djvuocr



Автор Ђатьяна Ершова задал вопрос в разделе Другое

Как извлечь текст из файла типа DJVU??? и получил лучший ответ

Ответ от Hedji[гуру]
FineReader'ом

Ответ от Fai[мастер]
Программа Djvu OCR предназначена для внедрения текстового OCR слоя в djvu книги. Текстовый слой позволяет использовать поиск по документу и копировать текст из djvu в doc (word) или txt.
Программа Djvu OCR 2.4
Рис. 1. Главное окно программы Djvu OCR 2.4.
Djvu OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста. Оцифровка происходит в три этапа:
1. Djvu OCR конвертирует документ в формат tiff
2. FineReader распознает текст в полученных изображениях
3. Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu.
Кроме интеграции программа может извлекать уже существующий текстовый слой в djvu файла (режим Извлечь OCR Слой) . Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: txt, html.
Программа не требует установки. В архиве 4 исполняемых файла:
* DjvuOCR - Win32 GUI версия
* FRFGrab - консольная версия
* Djvused - стандартная утилита пакета djvulibre
* cvthtml2 - конвертация OCR слоя в HTML (UTF8)
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки) , остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.

Ответ от 22 ответа[гуру]
Привет! Вот подборка тем с похожими вопросами и ответами на Ваш вопрос: Как извлечь текст из файла типа DJVU???
DjVu на Википедии
Посмотрите статью на википедии про DjVu
 

Ответить на вопрос:

Имя*

E-mail:*

Текст ответа:*
Проверочный код(введите 22):*