SDL Trados - разпознаване на текст в сканирани PDF документи.
Thread poster: etale
etale
etale
Local time: 13:20
Spanish to Bulgarian
+ ...
Mar 12, 2018

Напоследък ми изпращат доста сканирани PDF документи. Функцията на SDL Trados 2017 за четене на PDF файли всеки път ми показва грешка.
Как се справяте Вие с този проблем, колеги?


 
Pavel Tsvetkov
Pavel Tsvetkov  Identity Verified
Bulgaria
Local time: 14:20
Member (2008)
English to Bulgarian
+ ...

Moderator of this forum
. Mar 12, 2018

Здравейте, etale!

Подходящ софтуер за преработката на сканирани документи в текст е ABBYY Finereader. Има и много други, но този се справя добре със славянски езици вкл. български.

Поздрави,
Павел


 
Ekaterina Kroumova
Ekaterina Kroumova  Identity Verified
French to Bulgarian
+ ...
Не е най-доброто решение Mar 12, 2018

Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBY... See more
Неведнъж съм попадала на мнения на самите служители на SDL, че това не е най-перфектното решение и че служи само за ситуации, в които нямате друг софтуер за оптическо разпознаване. Тоест самите те не препоръчват да разчитате много-много на тази функционалност. Аз използвам ABBYY PDF Transformer+, отлично се справя, но май от известно време предлагането ѝ е спряно.

При всички случаи, ако често Ви изпращат такива файлове, или искайте предварително да Ви ги извлекат в подходящ за текстообработване формат, или си набавете надежден софтуер. Ако нямате притеснения за поверителността, има прилични онлайн варианти.
Collapse


 
invguy
invguy  Identity Verified
Bulgaria
Local time: 14:20
English to Bulgarian
Още един глас за ABBYY Mar 12, 2018

Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична ... See more
Имам някаква стара OEM версия на FineReader, май 7.0. Беше дошла на CD с някой от скенерите. Работила е безотказно под XP, Vista и седмица (на десятката не съм я пробвал). Рядко ми се налага да използвам OCR, но за инцидентно конвертиране на някой и друг (не много голям) документ върши отлична работа.

Вероятно няма някои функции за автоматизация, с които разполагат по-новите версии. Но аз и без това съм малко консерва и не обичам софтуер да решава вместо мен, без да ме пита – тъй че ценя въможностите на тази версия за ръчен контрол, макар че това със сигурност прави процеса по-бавен.
Collapse


 
Georgi Kovachev
Georgi Kovachev  Identity Verified
Bulgaria
Local time: 14:20
Member (2010)
English to Bulgarian
+ ...
Купете си софтуер и поискайте повишение на цената Mar 12, 2018

Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина щ�
... See more
Здравейте, etale!

Пиша малко извън конкретния Ви въпрос, но е свързано със сканирани документи/файлове в PDF формат. Напълно съм съгласен с колегите и се присъединявам към техния съвет да си закупите подходящ софтуер за преобразуване на сканирани документи – наистина ще отделяте по-малко време за странична дейност. Аз лично ползвам PDF Transformer Pro 2.0, който е предишната версия на PDF Transformer+.

Бих искал да Ви обърна внимание на цената. Опитът ми от последните месеци показва, че получавам все по-малко документи в текстови формат – както е и при Вас, както и че агенциите не са склонни да отделят време и ресурс, за да се занимават с подготовка на документите за превод – разбирайте преобразуване в текстови формат и сравняване на резултата с оригиналния текст.
Затова преди време поисках от една от агенциите по-висока цена за сканирани документи или за такива в PDF формат, при които преобразуването в текстови формат е по-лошо, най-вече заради необходимото допълнително време за обработка (за друга давам цена за всеки текст, като уговорката ми е, че за сканирани файлове тя е по-висока по подразбиране). Не постигнах по-висока цена с първата агенция, но вече пестя време, като предавам само текст и не се занимавам да копирам и нагласявам изображенията от оригиналния файл – знаете, че техническите ръководства са пълни с такива.

Установявам обаче, че запитванията, свързани със сканирани/PDF файлове, ми отнемат все повече време, а не всички от тях биват потвърждавани. Решението, което ползвам от скоро, е да преобразувам в .txt формат (с PDF Transformer Pro 2.0), съвсем набързо да събера цели изречения, които са на отделни редове, да изтрия излишните интервали и да анализирам текста с преводаческата програма. Това става по-бързо в сравнение с преобразуване в doc(x) формат, тъй като няма колони, таблици, символи за край на реда, параграф или страница – поне такова усещане имам от последната седмица. Вярно е, че няма таблици, но за даване на първоначална информация за срока на изпълнение и стойността на превода върши работа.

Моля, ако някой колега има по-ефективно решение в тази връзка, да го сподели

Поздрави!
Георги

П. С. Не се притеснявайте да искате компенсация за повечето отделено време за странична дейност. Ще установите, че колкото по-често казвате „Не“ (на нахални предложения да работите повече за същото възнаграждение), толкова повече ще постигате една от Вашите цели – по-голямо заплащане за повече положен труд или същото заплащане, но без допълнителен труд
Collapse


 
etale
etale
Local time: 13:20
Spanish to Bulgarian
+ ...
TOPIC STARTER
Благодаря Mar 13, 2018

Ще опитам пробната версия на ABBYY FineReader и след това вероятно ще го купя.
Документите, които ми изпращат, в повечето случаи съдържат лични данни и затова онлайн конвертирането е изключено.
Поисках да ми ги изпращат в подходящ формат [както казвахме едно време: във вид удобен за логаритмуване], но любезно ми отказаха.
Благодаря за отзивчивостта, колеги.
Желая Ви приятен ден!


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

SDL Trados - разпознаване на текст в сканирани PDF документи.






Trados Studio 2022 Freelance
The leading translation software used by over 270,000 translators.

Designed with your feedback in mind, Trados Studio 2022 delivers an unrivalled, powerful desktop and cloud solution, empowering you to work in the most efficient and cost-effective way.

More info »
Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »