YourLib.net
Твоя библиотека
Главная arrow Информатика (А.В. Терехов, А.В. Чернышев, В.Н. Чернышев) arrow 6.4. Система распознавания документов FineReader
6.4. Система распознавания документов FineReader

6.4. Система распознавания документов FineReader

   Система распознавания документов FineReader осуществляет преобразование графического изображения документа в редактируемый текст различных форматов, воспринимаемых текстовыми процессорами, электронными таблицами, системами управления базами данных. Она распознает символы различных языков (русского, английского, французского, немецкого и т.д.), напечатанные разными шрифтами. Причем в пределах страницы, абзаца и даже отдельного слова могут быть использованы разнообразные шрифты. FineReader позволяет работать со смешанными текстами (русский и английский на одной странице) и сохранять графики с текстом в одном документе.
   Важным преимуществом FineReader является возможность вводить табличные данные, распознавать их, соблюдая форматы оригинала для каждой ячейки таблицы. Результаты распознавания табличных данных могут записываться в форматах электронных таблиц, например Excel, экспортироваться в текстовые процессоры (MS Word, Write, WordPad). Система позволяет сохранять форматирование текста оригинала, табуляцию, отступы и выравнивание, а также графику в черно-белом, полутоновом и полноцветном форматах. FineReader может распознавать курсивное, полужирное и полужирное курсивное начертание символов и обрабатывать многоколонный текст.
   В FineReader реализована функция проверки орфографии. Редактирование текста возможно с помощью внутреннего текстового редактора FineReader, в окне которого отображается распознанный текст с выделенными ошибочными или неопределенными словами или символами, а также с помощью текстовых процессоров (Word).
   FineReader обеспечивает пакетный режим работы, т. е. сканирование и распознавание множества страниц без участия оператора. Система может обрабатывать и сохранять изображения следующих графических форматов: BMP, PCX, DCX, JPEG, TIFF, PNG.
   FineReader работает со сканерами через TWAIN-интерфейс. Это единый международный стандарт, введенный в 1992 г. для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN-драйвер:
   • через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReader Настройки сканера;
   • через интерфейс TWAIN-драйвера сканера: для настройки опций сканирования используется диалог TWAIN- драйвера сканера.
   Переключаться между этими режимами можно на закладке Сканирование > Открытие диалога Опции (меню Сервис > Опции), установив переключатель в одно из положений: Использовать интерфейс TWAIN-драйвера сканера или Использовать интерфейс FineReader.
   Порядок работы с программой FineReader достаточно прост, благодаря возможностям программы и удобному интерфейсу (основные элементы его те же, что и у других приложений: строка меню, панель инструментов).
   Вначале включите сканер (если он имеет отдельный от компьютера источник питания). Следует заметить, что модели сканера, подключаемые не к порту USB, необходимо включать до включения компьютера. После этого включите компьютер и запустите FineReader (Пуск > Программы > > ABBYY FineReader). Перед Вами откроется Главное окно программы FineReader. Затем вставьте в сканер страницу, которую Вы хотите распознать. Наиболее просто отсканировать и распознать документ можно с помощью мастера Scan&Read, нажав на стрелку справа от кнопки Scan&Read в открывшемся локальном меню выберите пункт Мастер Scan&Read. Мастер Scan&Read вызывает специальный режим, при котором Вы можете отсканировать и распознать страницу или открыть и распознать графическое изображение (пример графического файла Вы можете найти в папке Demo. Она находится в папке, куда Вы установили FineReader). При этом каждый шаг сопровождается подсказками системы. Далее следуйте указаниям Мастера Scan&Read.
   Процесс ввода документов в компьютер состоит из четырех этапов: сканирование, распознавание, проверка и сохранение результатов распознавания (не в режиме мастера эти этапы можно выполнить, последовательно нажимая кнопки Открыть/Сканировать, Распознать, Проверить, Сохранить на панели инструментов). В результате сканирования появится окно Изображение, содержащее «фотографию» страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются голубым цветом.
   Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диск, либо продолжить обработку следующих изображений.

 
< Пред.   След. >