My.BezDoz.ru

Категории раздела
Games not toys
Техно
Прогулка по сети
Мобайл
Компьютеры
Интернет
Андроид | Android
Программирование
Планшет
Поиск
Меню сайта
Главная » Статьи » Интернет

Мгновенное извлечение текста из изображений
Мгновенное извлечение текста из изображений

Способ первый - использование систем распознавания текста (OCR). Раньше они были жутко дорогими, а сейчас их стоимость снизилась до приемлемого уровня, и многие из OCR-систем переехали в онлайн, освободив тем самым пользователя от необходимости устанавливать дополнительное программное обеспечение на компьютер. Ярким примером мигрировавшего в Сеть продукта является сервис ABBYY FineReader Online, позволяющий быстро и легко конвертировать отсканированные документы и цифровые фотографии в редактируемые форматы. Система умеет распознавать документы любого из форматов BMP, PCX, DCX, JPEG/JPEG 2000, PNG, TIFF/TIF, GIF, DjVu на русском, английском, немецком и французском языках и размером не более 10 Мб. При этом результат распознавания может быть сохранен в виде DOC, XLS, RTF, TXT или PDF-файла. В настоящий момент FineReader Online работает в тестовом режиме и после регистрации позволяет пользователю бесплатно распознавать до 50 страниц в день. О стоимости услуг сервиса пока нет никакой информации.

Вместо FineReader Online можно воспользоваться другим коммерческим сервисом Online OCR. Его особенностями являются возможность выбора 28 языков распознавания и функция извлечения текста с определенных листов многостраничного документа. Системе можно скармливать файлы форматов TIFF, JPEG/JPG, BMP, PCX, PNG, GIF, PDF и размером не более 7 Мб. Для получения качественного результата распознавания разрешение картинок должно быть не меньше 200 dpi. Выходные форматы файлов - DOC, XLS, RTF, TXT, PDF и HTML. Услуги Online OCR платные и стоимость их варьируется от 80 копеек до 2,5 рублей за страницу распознанного текста. Для проверки настроек и качества распознавания в системе предусмотрен демонстрационный режим, функционирующий бесплатно и сканирующий только часть страниц.




На крайний случай можно воспользоваться еще одной онлайновой службой img2txt.ru. Судя по представленным на сайте сведениям, она тоже позволяет распознать многоязыковой текст из сканированного документа или фотографии и преобразовать результат в редактируемый формат. К сожалению, в нашем случае сервис почему-то толком не работал: он загружал файлы на сервер и после этого впадал в спячку. Остается надеяться, что это временное явление.

При наличии на компьютере офисного пакета Microsoft Office можно для извлечения текста из картинок прибегнуть к использованию инструмента Microsoft Office Document Imaging. При работе с ним потребуется предварительно средствами любого имеющегося под рукой графического редактора преобразовать изображение в формат TIFF, после чего останется только открыть файл в программе, щелкнуть по расположенной на панели инструментов клавише "Распознать текст" и дождаться завершения процесса конвертации изображений символов и букв в доступный для копирования текст. Вместо Microsoft Office Document Imaging можно воспользоваться приложением OneNote для создания быстрых заметок и организации личной информации. Оно входит в состав некоторых редакций Microsoft Office и позволяет выдергивать текстовые данные из любых помещенных в окно программы изображений простым выбором в контекстном меню пункта "Копировать текст из рисунка".



Наконец, еще один метод мгновенного извлечения текста из изображений - использование сервиса scanR, о котором мы подробно рассказывали на страницах нашего издания. Реализованная в scanR система оптического распознавания текста поддерживает 17 языков, включая русский, и позволяет сохранять результаты работы в PDF или обычный текстовый файл. Бесплатно средствами онлайновой службы можно обработать только один документ. Стоимость ежемесячной подписки на услуги scanR составляет 5 долларов США, а годовой - 30 американских президентов. Вполне демократически, учитывая тот факт, что работать с системой распознавания можно не только через браузер, но и посредством электронной почты и мобильных устройств, оснащенных, как минимум, мегапиксельной камерой (чем больше разрешение, тем лучше) и подключенных к Интернету.


Источник: http://www.computerra.ru/terralab/softerra/438725/

Понравился материал?







Ссылка для Форума:
Прямая ссылка

Категория: Интернет
Просмотров: 1642 | Рейтинг: 4.0/22
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
BezDoz.Ru
Форма входа
Техно
По теме
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

Copyright MyCorp © 2017
Бесплатный конструктор сайтов - uCoz