Программа распознавания рисунков

Содержание

Распознавание документов на частном примере — обзор доступных платных и бесплатных решений

Программа распознавания рисунков

Всем привет! Типичная ситуация сложилась в компании, в которой я работаю. В бухгалтерии вечный аврал, людей не хватает, все занимаются чем-то безусловно важным, но по сути бесполезным. Такое положение дел не устраивало руководство.

Если подробнее, то проблема в том, что ресурсов бухгалтерии не хватает на текущие задачи, а выделять ставки под новых людей никто не хочет. Поэтому сверху приняли решение порезать некоторые задачи и освободить время бухгалтеров для более полезных дел.

Под нож попала такая работа как сканирование и распознавание документов, копирование, внесение их в прочие рутинные радости.

Так передо мной, как аналитиком, встала задача: найти решение для распознавания документа типичного для моей компании — счет-фактуры — структурировать его в имеющиеся хранилища, а также в 1С. Решение, которое будет удобным, понятным, и не влетит компании в копеечку.

Опыт получился занятным, решил поделиться тем, что удалось собрать. Возможно я что-то упустил, поэтому велком в комментарии, если есть, что добавить. Программы сканирования документов, программы распознавания документов — не новое решение на рынке, его можно найти как в бесплатных программах, так и встроенных в системы.

Начал я с бесплатных программ:

  • glmageReader
  • Paperwork
  • VietOCR
  • CuneiForm.

В ходе распознавания нашего счета-фактуры такими программами я увидел следующее:

  • В таких программах как VietOCR, Paperwork, glmageReader можно настроить хранение отсканированных документов в определенные папки, Paperwork умеет их даже сортировать, согласно меткам.
  • В основном они хорошо справляются с текстом, а там, где текст распознан некорректно, в некоторых программах можно вручную изменить содержимое, прежде чем экспортировать файл.

Однако есть и проблемы:

  • Есть разница между работой с pdf сканами и png. Не всегда удается удачно конвертировать png в pdf.
  • Большинство таких программ сложно справляются с распознаванием документов табличного вида, даже самого простого формата. В результате мы получаем распознанный текст без размеченных полей.
  • Иногда неточно определяется шрифт, вследствие чего при конвертации весь распознанный текст наезжает друг на друга.
  • В процессе распознавания иногда необходимо делать выравнивание по ключевым словам, с доворотами и смещением координат.
  • В некоторых программах таблица распознавалась как картинка и экспортировалась в новый документ Word тоже в качестве картинки, очень урезанной, которую даже сложно разглядеть.
  • При редактировании распознанного содержимого в некоторых программах возникали проблемы, менялся шрифт или сам текст.

Технология сработала достаточно хорошо, Учитывая, что программы бесплатные, описанные выше проблемы допустимы. Однако, я искал более упорядоченного решения.

Затем я исследовал распознавание в ABBYY FineReader 15 Corporate

За 7-дневный срок триала я изучил и эту платформу. Что отметил:

  • Когда я открыл png файл, он отлично был считан и в результате удачно конвертирован в pdf без потери качества изображения и текста.
  • Программа отлично знает, как отсканировать документ для редактирования текста. Причем в режиме редактирования файла формата png текст удается отредактировать без проблем, но иногда слетает разметка.
  • Однако то же самое я не могу сказать про редактирование файла-скана pdf. При попытке редактирования летели слои.
  • Табличный вид распознается качественно, вся структура сохраняется, меня это порадовало.
  • OCR редактор хорошо распознал мой сформированный pdf счет-фактуры. Где-то пару символов требовалось поправить вручную.
  • Однако, была ситуация, что почти весь подобный документ распознался с меньшей точностью и данных для изменения вручную было уйма. Думаю, здесь можно было бы решить вопрос технически, но это затратило бы больше времени.
  • Здесь можно настроить автоматическую конвертацию входящих документов, которые регулярно будут тянуться из указанной папки, по указанному расписанию.
  • Он позволяет сравнивать версии документов, даже если они в разных форматах. При большом потоке документов и правок в них, это очень удобно.

От использования этого софта были приятные впечатления. Однако, когда я обратился к ценнику системного решения ABBYY Flexicapture (а мне нужно именно системное), то выяснил, что решение, особенно кастомизированное, обходится в довольно круглую сумму, около 400 тыс. руб./мес.

и выше за 10 тыс. страниц. Я стал искать альтернативу. Как освободить руки сотрудника, получить качественное распознавание документов и не переживать за сохранность и структуру данных.

И тут я решил получше разглядеть elma rpa, которую я уже изучал ранее

Вендор предлагает перекинуть значительную часть работы по экспорту данных в ERP с плеч бухгалтеров на роботов. По сути, именно это решает поставленную передо мной задачу. Чтобы познакомиться с распознаванием в этой системе, я взял у вендора триальную версию системы.

Здесь я обнаружил, что распознавание не преследует цели конвертировать полученные данные в новый документ-файл. Здесь главная цель — распознавание реквизитов документа и их передача в другие системы/сайты/приложения.

Кроме того, роботы складывают всю информацию куда надо: автоматически находят нужные папки и сохраняют в необходимых форматах. Какие виды распознавания в системе я посмотрел:

Распознавание по шаблону

Нам предлагается на основании шаблона документа распознать подгружаемый документ. Насколько мне известно, этот вид распознавания бесплатный, внутрь зашит движок Tesseract. Что отметил:

  • Этот вид распознавания работает именно со сканами формата jpg и png, pdf он пока не рассматривает. Но продукт еще молодой, думаю, все впереди.
  • Этот вид распознавания входит в бесплатную версию Community Edition
  • Удобно размечен текст по блокам, которые можно сопоставить, согласно переменным, которые мы создали в контексте робота. Таким образом вручную настроить, что именно тянем в распознавание.
  • Нашу счет-фактуру он распознал 50/50, некоторые слова подменил как посчитал нужным. 🙂

Однако, вендор на данный кейс сообщил, что этот вид распознавания адаптирован под простые документы, с текстовой структурой или с легкими формами.

И посоветовал для распознавания счета-фактуры использовать другой вид распознавания — intellect lab.

Процесс тот же, загружаем шаблон и по нему распознаем. Но здесь шаблон отправляется на облачный сервер. От сервера получаем ответ (распознает такой тип документа или нет), и если распознается, то передается структура шаблона (переменные для маппинга), для сопоставления переменных, которые необходимо будет записать в RPA процессе. В процессе воспроизведения мы отправляем уже документ, который хотели бы распознать и получаем ответ от iLab сервера о распознавании.

Что отметил по поводу этого распознавания:

  • Здесь уже распознавание работает как программа сканирования документов pdf, и при этом работает и с форматами jpg и png.
  • Качество документа не влияет на эффективность распознавания. Даже документы с плохим качеством распознаются корректно.
  • Счет-фактура распозналась полностью и без подмен переменных.
  • Робот сумел получить скан с почты, распознать его и создать его экземпляр в 1С. То есть автоматически сохранил файл там, где мы ему задали, что, естественно, крайне удобно.
  • Входит в бесплатную Community Edition в виде распознавания документа в облаке. Подходит, если используем стандартные типы (СФ, УПД, АВР и др.), и, например до 100 документов в месяц или до 500 в год. (Стоит заметить, что считаем не в страницах, а в документах непосредственно.)

Сам процесс распознавания документов довольно сложно отобразить на видео, так как это происходит в коробке, а экран пустует несколько секунд. Поэтому я сделал отдельную запись распознанных данных в блокнот для визуализации. Соответственно, эти же данные робот записывает в 1С, создавая там новый документ: Что удалось выяснить по ценам: Если мы, например, хотим работать масштабно именно с ilab распознаванием, то за наши 10 000 документов придется выложить:

  • примерно 180 000 руб. единовременно,
  • плюс, допустим, 400 000 руб. покупка робота с оркестратором
  • итого: 580 000 руб.

Робот бессрочный, а 10 000 документов на какое-то время хватит. Довольно выгодно получается, как минимум в том, что заплатим за все один раз.

Что понравилось в распознавании в этой платформе в целом:

  • Можно настроить получение документов по событию, а также, например из электронной почты и любых других внешних источников. У меня пока была цель настроить получение с почты.
  • Все считанные данные с документа можно спокойно записать в контекстные переменные и далее их передать в необходимые системы, приложения, сайты, ВМ и т д. И я не переписываю уже ничего руками.
  • Скорость обработки. 15 секунд и объект распознан, а остальной порядок действий — это счет по минутам. Если заявиться с потоковым сканированием с большим количеством документов, думаю это не составит больших временных затрат.
  • Много качественного функционала в свободном доступе, для небольших компаний им можно вполне обойтись.

Итого:

  • Бесплатные программы справляются с задачей распознавания документов лучше, чем я предполагал, однако за счет них значительно ускорить работу с большим объемом не удастся
  • ABBYY FineReader хорошо справляется с обработкой и распознаванием документов после, однако, чтобы получить системное решение, нужны большие финансовые возможности.
  • ELMA RPA удивила по качеству распознавания документов, вариативностью, а также возможностям хранения и передачи после распознавания, но стоит учесть, что продукт молодой.

Хабы:

  • Искусственный интеллект
  • Финансы в IT
  • 17 июля 2015 в 17:52
  • 12 января 2015 в 17:02
  • 4 августа 2011 в 12:38

Источник: https://habr.com/ru/post/518460/

Приложения для распознавания по фото и изображениям

Программа распознавания рисунков

Сейчас уже существует довольно много мобильных приложений, которые распознают фотографии для получения некоторой полезной информации о людях или объектах на нём. Одно из таких приложений – Facer, показывает на кого из знаменитостей вы похожи, используя алгоритмы на основе нейронных сетей.

Платформа: Android

Цена: Бесплатно

Платформа: iOS

Цена: Бесплатно

Загружаете фото лица крупным планом и через пару секунд вы видите трёх знаменитостей, на которых вы похожи, с указанием процента сходства. Среди похожих на себя звёзд можно встретить российских и зарубежных музыкантов, актёров, блогеров или спортсменов. Приложение Facer можно скачать по ссылкам: на Android и iOS.

У компании Яндекс тоже есть функции распознавания изображений, они встроены в их ого помощника. Алиса научилась искать информацию по фотографиям с камеры или любым другим картинкам, которые вы ей отправите. На основе загруженного изображения помощник может сделать некоторые полезные действия. Эти новыми функциями можно воспользоваться в приложении Яндекс и Яндекс.Браузер.

Где скачать Алису с поиском по картинкам

Голосовой ассистент Алиса встроен в приложение под названием «Яндекс». Скачать приложение для Android и iOS можно по этим ссылкам:

Платформа: Android

Цена: Бесплатно

Платформа: iOS

Цена: Бесплатно

Как включить поиск по картинкам в Алисе

  1. Чтобы открыть Алису нажимаем на красный значок приложения «Яндекс».
  2. Первый способ открыть функцию распознавания изображений: нажимаем на серый значок фотоаппарата с лупой в поисковой строке и переходим к шагу 4.

    Второй способ: нажимаем на фиолетовый значок Алисы или говорим «Привет, Алиса!» если у вас включена ая активация.

  3. Откроется диалог (чат) с Алисой. Нужно дать команду Алисе «Распознай изображение» или «Сделай фото». Также вы можете нажать на серый значок фотоаппарата с лупой.

  4. Приложение попросит доступ к камере вашего мобильного устройства. Нажимаем «Разрешить».
  5. Откроется режим съёмки. Здесь вы можете загрузить изображение из вашей галлереи или сделать новый снимок прямо сейчас. Нажмите на фиолетовый круг, чтобы сделать снимок.
  6. Алиса распознает объект на изображении.

  7. Давайте попробуем загрузить фотографию из памяти, т.е. галереи вашего iPhone или Android. Нажимаем на иконку с фотографией.
  8. Алиса попросит доступ к вашим фотографиям. Нажимаем «Разрешить».
  9. Выбираем фотографию.

  10. Через некоторое время фотография загрузится на сервера Яндекса и Алиса вам скажет, на что похоже загруженное изображение. В нашем случае мы загрузили фотографию умной колонки Amazon Echo Dot, и Алиса её успешно распознала.

Возможности Алисы по распознаванию изображений и список команд

Помимо общей команды «сделай фото», Алисе можно дать более точную команду по распознаванию объекта. Алиса умеет делать следующие операции с изображениями по соответствующим командам:

Узнать знаменитость по фото

  • Кто на фотографии?
  • Что за знаменитость на фотографии?

Алиса распознаёт фото знаменитых людей. Мы загрузили изображение актёра Константина Хабенского и Алиса успешно распознала его.

Распознать надпись или текст и перевести его

  • Распознай текст
  • Распознай и переведи надпись

Вы можете загрузить фотографию с текстом и Алиса распознает его и даже поможет его перевести. Для того, чтобы распознать и перевести текст с помощью Алисы необходимо:

— Загрузить фото с текстом.— Прокрутить вниз.

— Нажать «Найти и перевести текст».

— Откроется распознанный текст. Нажимаем «Перевести».
— Откроется Яндекс.Переводчик с переведённым текстом.

Узнать марку и модель автомобиля

  • Определи марку автомобиля
  • Распознай модель автомобиля

Алиса умеет определять марки автомобилей. Например, она без труда распознаёт новый автомобиль Nissan X-Trail, в который встроена мультимедийная система Яндекс.Авто с Алисой и Яндекс.Навигатором.

Узнать породу животного

  • Распознай животное
  • Определи породу собаки

Алиса умеет распознавать животных. Например, Алиса распознала не только, что на фото собака, но и точно определила породу Лабрадор по фото.

Узнать вид растения

  • Определи вид растения
  • Распознай растение

Если вы встретили экзотическое растение, Алиса поможет вам узнать его название.

Узнать автора и название картины

  • Распознай картину
  • Определи что за картина

Если вы увидели картину и хотите узнать её название, автора и описание, просто попросите Алису вам помочь. Картину «Утро в сосновом лесу» художника Ивана Ивановича Шишкина Алиса определяет моментально.

Найти предмет в Яндекс.Маркет

  • Определи товар
  • Найди товар

Если вы увидите интересный предмет, который вы не прочь были бы приобрести – вы можете попросить Алису найти похожие на него товары. Найденный товар вы можете открыть на Яндекс Маркете и там прочитать его характеристики, или сразу заказать.

Распознать QR-код

  • Определи Кью Эр код
  • Распознай Кью Эр код

Алиса пока не так быстро и качественно распознаёт QR коды, нам потребовалось несколько попыток, чтобы успешно распознать QR код.

Источник: https://voiceapp.ru/articles/alisa-image

Лучшие программы для распознавания и сканирования текста

Программа распознавания рисунков

Представляем вашему вниманию программы для распознавания и сканирования текста, с помощью которых можно оптимизировать процесс оцифровки документов, рукописных или бумажных книг.

Рассматриваемые нами приложения легко переводят png, jpg, pdf и «бумажные файлы» в удобный для редактуры в Word формат и другие офисные ПО, редактируют распечатанный или сфотографированный материал в полноценный текст.

ABBYY FineReader скачать

Приложение легко распознает печатные символы и преобразовывает отсканированные документы в цифровые форматы. Считается лидером в своей категории, поскольку выполняет свои задачи качественно и быстро, в отличие от подобных аналогов.

Эбби ФайнРидер имеет свою OCR технологию обработки материала, функции для захвата данных на разных источниках, а также инструменты для обработки PDF-объектов, их редактирования и комментирования.

Также доступна автоматизированная конвертация, сохранение разметок, обработка текста на разных языках, поддержка подключаемых устройств и интегрированный редактор. Бесплатная версия ограничивает работу софта после 15 дней использования.

OCR CuneiForm скачать

Программа специализируется на идентификации сканированного или сфотографированного текста, сохраняя его структурирование и гарнитуру шрифта.

Понимает любой печатный шрифт, отправляет распознанный результат во встроенный редактор текста, переделывает электронные копии и графические файлы в удобный вид для редактуры. В состав комплекса входят два программных обеспечения для пакетной и одиночной обработок.

Распознанные документы легко сохранить в удобном формате или отыскать их в поиске. Дополнительно прога может определять таблицы, текстовые блоки и графические картинки вне зависимости от сложности, объема и четкости текста.

Adobe Reader скачать

Популярный просмотрщик всех видов PDF-файлов с базовыми функциями работы с документацией. Позволяет просматривать, копировать, менять ориентацию или отправлять на печать документы. Для слабовидящих юзеров доступна опция масштабирования, увеличивающая размер шрифта до нужных параметров.

Также можно воспользоваться функцией трёхмерного изображения и воспроизведения интегрированных в мультимедийный контент объектов. Доступен поиск в PDF картах, портфолио и файлах, а также комментирование файлов, присоединение электронных подписей и настройка плагинов для веб-навигаторов.

Из минусов бесплатной версии отметим ограниченный только просмотром функционал.

WinScan2PDF скачать

Портативная утилита для считывания данных со сканеров и сохранения материала в PDF.

Софт переводит содержимое документов в цифровые форматы, одновременно обрабатывает несколько книг с последующим сохранением в один файл с соответствующим количеством страниц.

В настройках можно выбирать качество сохраняемой работы, создавать много страниц в одном документе, менять язык интерфейса. ВинСкан2ПДФ позволит быстро отсканировать бумажную документацию, обработать сразу несколько страниц и создать многостраничный ПДФ.

VueScan скачать

Программа-имитатор работы драйвера для расширения функциональных возможностей разнообразных моделей сканеров. Быстро подключается к устройствам сканирования, работает с негативами, старыми фотоснимками и слайдами без потери качества.

В пользовательских настройках можно настраивать все этапы сканирования, сохранять отсканированную документацию в TIFF, JPEG и PDF форматах, распознавать тексты, использовать глубокую настройку готовой работы и применять множество установок.

Фри-версия накладывает водяные знаки на работу.

SimpleOCR скачать

Утилита распознает рукописный и машинный текст на датском, английском и французском языках, имеет интегрированный редактор и большой словарный запас.

СимплеОЦР считывает данные со сканеров и проводит конвертацию материала в TXT, TIFF и DOC форматы, переводит напечатанный на бумаге текст и рукопись в цифровой формат, идентифицирует картинки и шрифты.

Также доступно сравнение отсканированного ранее текста с полученным, а также внесение изменений. Бесплатная версия предоставляет только 14 дней распознавания текстов.

Readiris Pro скачать

Один из лидеров в категории OCR программ, который сканирует и распознает бумажную и рукописную документацию, работает с более 100 языками и имеет интегрированный редактор. Позволяет отсканировать и оцифровать материал, а с помощью редактора внести изменения.

Реадирис конвертирует в формат изображения, таблицы и документа, работает с облачными хранилищами и ftp-папками, экспортирует в DJVU. В настройках можно улучшать качество документа, поворачивать его или сохранять в виртуальном хранилище.

Ознакомительная версия активна 10 дней и дает на обработку только 100 страниц.

Microsoft OneNote скачать

Является дополнением к Office Mobile пакету и предоставляет расширения для создания списков задач, покупок или заметок.

В функционале доступно создание маркированных списков, отметка галочкой выполненных пунктов, ввод рукописных примечаний сенсорным нажатием или цифровым пером, добавление графических картинок.

Немаловажным плюсом утилиты является работа мобильной версии с OneDrive для хранения всех правок заметок, их просмотра или редактуры. Понятный русскоязычный интерфейс и бесплатное распространение станут приятными плюсами в работе с этой удобной прогой.

Freemore OCR Features скачать

Качественное ПО для оптического распознавания текста из изображений и ПДФ-документации.

Доступно извлечение текста из картинки, которая получена с цифровой камеры, сканера или мобильного телефона, дешифровка и зашифровка символов, сохранение материала в TXT и Word, редактура метаданных, предпросмотр документации, применение пароля или цифровой подписи.

Софт имеет методику сверхскоростной обработки и передовой кодировки, пресеты с оптимальной настройкой, поддерживает многоядерные процессоры. Продукт совместим со многими известными фирмами сканеров, открывает картинки разных форматов, защищает работу паролем и в реальном времени быстро обрабатывает материал.

TopOCR скачать

Программа легко оптически распознает, редактирует и читает текстовую документацию.

Благодаря своей многофункциональности может распознать и отсканировать материал, а также внести изменения с помощью опций графического редактора и электронного переводчика.

Приложение озвучивает текст на 11 языках, быстро переводит документацию и создает аудиокниги. Поддерживает многие распространенные форматы, работает напрямую со сканером и озвучивает текст. Из минусов отметим отсутствие русскоязычной поддержки.

Источник: https://zen.yandex.ru/media/tvoiprogrammyru/luchshie-programmy-dlia-raspoznavaniia-i-skanirovaniia-teksta-5d494e85ae56cc00ac9512cf

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.