Narzędzia wątku Wygląd
  #1  
Stary 08-09-2018, 11:48
WhiskeyJack WhiskeyJack jest offline
Podszyszkownik
 
Zarejestrowany: Jun 2018
Posty: 123
Domyślnie CAT + OCR/Images

Potrzebuję przetłumaczyć ulotkę w PDF składającą się z tekstu oraz obrazka. Obrazek zawiera również trochę tekstu i jest to integralna całość, więc aby CAT mógł widzieć wszystkie elementy ulotki trzeba ją prze-konwertować na plik Worda. Po prostej konwersji w Abbyy PDF Transformer bez edycji obrazka, dostałem idealną kopię Ulotki w Wordzie. Po otworzeniu jej w CAT np. DejaVu, tenże nie widział tekstu, który był częścią obrazka (co mnie w sumie nie zdziwiło :P) więc nie mogłem go przetłumaczyć. Otworzyłem więc ulotkę PDF w Fine Reader 14 w edytorze OCR. Po rozpoznaniu wstępnym program zaznaczył mi osobne obszary tekstowe, a w obszarze z obrazkiem zaznaczył mi dodatkowo linijki tekstu (jako obszary tekstowe). Pomijając już fakt, że nie udało mi się uzyskać dobrej kopii po konwersji do Worda po chyba 10 próbach ( połowy słów które zawierał obrazek nie widać), mam następujące pytanie: Czy jeżeli program OCR np. Fine Reader rozpozna część ulotki jako obraz i w tymże obrazie oznaczymy linijki tekstu jako obszary tekstowe, to po konwersji i zapisaniu go w Wordzie program CAT np. DejaVu będzie już widział tekst, który zawiera obrazek? Sorry za chaotyczny i długi post .
Odpowiedź z Cytowaniem
 


Narzędzia wątku
Wygląd

Zasady pisania postów
Możesz wysyłać nowe wątki
Możesz wysyłać odpowiedzi
Możesz wysyłać załączniki
Możesz edytować swoje posty

vB code jest Wł.
EmotikonyWł.
kod [IMG] jest Wł.
kod HTML jest Wył.
Przejdź do forum




Powered by: vBulletin Version 3.7.2
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.