интеграция с системой распознавания cuneiform реализована в какой системе

Интеграция с системой распознавания cuneiform реализована в какой системе

Д.Смирнов, Cognitive Technologies За последнее время положение в секторе электронного документооборота изменилось. Если раньше, в продвижении технологий бесклавиатурного ввода делался упор на достоинства их персонального применения, то сейчас на первый план выступают преимущества коллективного и рационального использования технологий ввода и обработки документов. Иметь одну, обособленную систему распознавания сегодня уже явно недостаточно. С распознанными текстовыми файлами (как бы они хорошо распознаны не были) нужно что то делать: хранить в базе данных, осуществлять поиск, передавать по локальной сети и т.д. Словом, требуется взаимодействие с архивной или иной системой работы с документами. Таким образом, система распознавания превращается в утилиту для архивных и иных систем работы с документами. Изменения на рынке определили последние разработки Cognitive Technologies.
С появлением сетевых версий систем сканирования (режим потокового сканирования OCR CuneiForm) и распознавания (сервер распознавания CuneiForm OCR Server) документов, компании уже удалось реализовать некоторые преимущества коллективного использования данных технологий в малых и крупных организациях. Представляемые сегодня Cognitive Technologies разработки продолжают линию компании, направленную на расширение применения систем ввода информации и разработку технологий автоматизации работы с документами.

Электронный архив Евфрат

Новая версия популярной в России OCR CuneiForm включила в список выходных форматов HTML- формат. Эта уникальная возможность позволит пользователям преобразовывать бумажные документы со сканера непосредственно в формат WWW (с сохранением иллюстраций и таблиц). Возможен прямой экспорт результатов распознавания в популярный броузер NetScape Navigator. CuneiForm 96b устраняет целую цепочку лишних действий и позволяет использовать все возможности профессиональной OCR-системы при подготовке документов для Internet.

Источник

OpenOCR (CuneiForm)

Содержание

Введение

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Установка

TroubleShooting

Работа в Windows 7

Ошибка передачи данных при работе в программе CuneiForm

Описание ошибки: Причина в особенностях работы TWAIN драйверов сканера, в CuneiForm используются 2 режима передачи memory-buffered (режим по умолчанию) и memory-native. Раньше драйвера сканера не всегда реализовали оба, или один из них был не очень стабилен. Была ситуация когда это зависело и от производителя, и от версии драйвера. Сейчас у производителей промышленных сканеров (Fujitsu, Kodak и др.) поддерживаются все режимы, а у остальных производителей видимо ситуация с режимами передачи иногда остается нестабильной.

Лекарство: Необходимо отредактировать файл face.ini, который находится в директории windows. Находим в файле ключ TWAIN_TransferMode и делаем его равным memory-native. То есть должно быть TWAIN_TransferMode=memory-native

Ответы на другие вопросы о работе программы CuneiForm вы можете найти на форуме CuneiForm.

Источник

Интеграция с системой распознавания cuneiform реализована в какой системе

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Таблица 1. Возможности рассматриваемых систем OCR

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Россия начинает и выигрывает

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

CuneiForm — шрифтонезависимая система и способна распознавать любые шрифты (за исключением декоративных).

В CuneiForm используются самообучающиеся алгоритмы. Система независимо от пользователя способна обучаться в процессе распознавания. Это позволяет значительно увеличить точность распознавания. Еще одним отличительным свойством CuneiForm является наличие «экспертной системы» внутри ядра, которая в зависимости от качества и структуры документа позволяет выбирать оптимальный алгоритм распознавания.

Особенности работы с результатом распознавания

В CuneiForm результат распознавания помещается во встроенный текстовый редактор, в котором можно удобно перемещаться по «сомнительным» словам. Проверка сомнительных слов в ReadIris осуществляется в том же окне, что и обучение шрифту: появляется отдельное окно, в котором показывается сомнительное слово, и предлагается посимвольно проверить, правильно ли система его понимает. Если вы не хотите заниматься обучением системы, то вам не удастся и просмотреть сомнительные слова.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

При распознавании с помощью CuneiForm сохраняется структура документа и его форматирование.

Программа распознает таблицы любой структуры и сложности, в том числе и без отображения линий табличной сетки.

Распознаются любые печатные шрифты: книги, газеты, журналы, распечатки с лазерных и матричных принтеров, тексты с пишущих машинок и т.п.

Алгоритмы оптического распознавания (OCR, Optical Character Recognition), встроенные в программу позволяют распознавать текст с матричного принтера, плохих ксерокопий и факсов.

Распознавание документов более чем на 20 языках: на русском, английском, немецком, французском, испанском, итальянском, шведском, украинском и других.

Для повышения качества распознавания в программе используется словарная проверка. При этом стандартный словарь можно расширить за счет импорта новых слов из текстовых файлов.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Copyright (c) 1993-2010, Cognitive Technologies
All rights reserved.

Разрешается повторное распространение и использование как в виде исходного кода, так и в двоичной форме, с изменениями или без, при соблюдении следующих условий:

При повторном распространении исходного кода должны оставаться указанное выше уведомление об авторском праве, этот список условий и последующий отказ от гарантий.
При повторном распространении двоичного кода в документации и/или в других материалах, поставляемых при распространении, должны сохраняться указанная выше информация об авторском праве, этот список условий и последующий отказ от гарантий.
Ни название Cognitive Technologies, ни имена ее сотрудников не могут быть использованы в качестве средства поддержки и/или продвижения продуктов, основанных на этом ПО, без предварительного письменного разрешения.
ЭТА ПРОГРАММА ПРЕДОСТАВЛЕНА ВЛАДЕЛЬЦАМИ АВТОРСКИХ ПРАВ И/ИЛИ ДРУГИМИ ЛИЦАМИ «КАК ОНА ЕСТЬ» БЕЗ КАКОГО-ЛИБО ВИДА ГАРАНТИЙ, ВЫРАЖЕННЫХ ЯВНО ИЛИ ПОДРАЗУМЕВАЕМЫХ, ВКЛЮЧАЯ ГАРАНТИИ КОММЕРЧЕСКОЙ ЦЕННОСТИ И ПРИГОДНОСТИ ДЛЯ КОНКРЕТНОЙ ЦЕЛИ, НО НЕ ОГРАНИЧИВАЯСЬ ИМИ. НИ ВЛАДЕЛЕЦ АВТОРСКИХ ПРАВ И НИ ОДНО ДРУГОЕ ЛИЦО, КОТОРОЕ МОЖЕТ ИЗМЕНЯТЬ И/ИЛИ ПОВТОРНО РАСПРОСТРАНЯТЬ ПРОГРАММУ, НИ В КОЕМ СЛУЧАЕ НЕ НЕСЁТ ОТВЕТСТВЕННОСТИ, ВКЛЮЧАЯ ЛЮБЫЕ ОБЩИЕ, СЛУЧАЙНЫЕ, СПЕЦИАЛЬНЫЕ ИЛИ ПОСЛЕДОВАВШИЕ УБЫТКИ, СВЯЗАННЫЕ С ИСПОЛЬЗОВАНИЕМ ИЛИ ПОНЕСЕННЫЕ ВСЛЕДСТВИЕ НЕВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ПРОГРАММЫ (ВКЛЮЧАЯ ПОТЕРИ ДАННЫХ, ИЛИ ДАННЫЕ, СТАВШИЕ НЕГОДНЫМИ, ИЛИ УБЫТКИ И/ИЛИ ПОТЕРИ ДОХОДОВ, ПОНЕСЕННЫЕ ИЗ-ЗА ДЕЙСТВИЙ ТРЕТЬИХ ЛИЦ И/ИЛИ ОТКАЗА ПРОГРАММЫ РАБОТАТЬ СОВМЕСТНО С ДРУГИМИ ПРОГРАММАМИ, НО НЕ ОГРАНИЧИВАЯСЬ ЭТИМИ СЛУЧАЯМИ), НО НЕ ОГРАНИЧИВАЯСЬ ИМИ, ДАЖЕ ЕСЛИ ТАКОЙ ВЛАДЕЛЕЦ ИЛИ ДРУГОЕ ЛИЦО БЫЛИ ИЗВЕЩЕНЫ О ВОЗМОЖНОСТИ ТАКИХ УБЫТКОВ И ПОТЕРЬ.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Puma.NET is an open source OCR SDK project for Microsoft Windows platform available under BSD license. The project is oriented on software developers working with Microsoft.NET Framework and is aimed to provided newly developed applications with OCR capabilities. Puma.NET is a wrapper for CuneiForm.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Создание приложения для оптического распознавания
символов на основе Нейронной Сети

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Форум: Проблемы искусственного интеллекта

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Linux port of Cuneiform

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Уроки машинного чтения от Cognitive Technologies

Источник

Cuneiform что это за программа

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системеРано или поздно, все кто часто работает с офисными программами, сталкиваются с типичной задачей — отсканировать текст с книги, журнала, газеты, просто листочков, а затем перевести эти картинки в текстовый формат, например, в документ Word.

Чтобы это сделать необходим сканер и специальная программа для распознавания текста. В этой статье пойдет речь о бесплатном аналоге FineReader — CuneiForm (о распознавании в FineReader — см. в этой статье).

1. Особенности программы CuneiForm, возможности

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системеCuneiForm

Программа для распознавания текста с открытым исходным кодом. К тому же, работает во всех версиях Windows: XP, Vista, 7, 8, что радует. Плюс к этому добавьте полный русский перевод программы!

Плюсы:

— распознавание текста на 20 самых популярных языках мира (английский и русский само собой входит в это число);

— огромная поддержка различных печатных шрифтов;

— проверка по словарю распознанного текста;

— возможность сохранения результаты работы в нескольких вариантах;

— сохранение структуры документа;

— отличная поддержка и распознавание таблиц.

Минусы:

— не поддерживает слишком большие документы и файлы (более 400 dpi);

— не поддерживает на прямую некоторые типы сканеров (ну это не страшно, в комплект к драйверам сканера идет и спец. программа для сканирования);

— дизайн не блещет (но кому он нужен, если программа в полной мере решит задачу).

2. Пример распознавания текста

Будем считать что необходимые картинки для распознавания вы уже получили (отсканировали там, или скачали в интернете книгу в формате pdf/djvu и достали из них нужные картинки. Как это сделать — см. в этой статье).

1) Открываем требуемую картинку в программе CuineForm ( файл/открыть или « Cntrl+O «).

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

2) Чтобы приступить к распознаванию — нужно сначала выделить различные области: текста, картинок, таблиц и пр. В программе Cuneiform это можно сделать не только в ручную, но и автоматически! Для этого щелкните по кнопке « разметка » в верхней панели окна.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

3) Спустя 10-15 сек. программа автоматически подсветит все области различными цветами. Например, область текста выделяется синим цветом. Кстати, подсветила она все области правильно и довольно быстро. Честно говоря, не ожидал от нее такой быстрой и правильной реакции…

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

4) Для тех, кто не доверяет автоматической разметке, можно воспользоваться и ручной. Для этого есть панелька инструментов (см. картинку ниже), благодаря которой можно выделить: текст, таблицу, картинку. Передвинуть, увеличить/уменьшить начальное изображение, подрезать края. В общем, неплохой набор.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

5) После того, как все области были размечены, можно приступить к распознаванию. Для этого просто щелкните по одноименной кнопке, как на картинке ниже.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

6) Буквально через 10-20 сек. перед вами откроется документ в Microsoft Word с распознанным текстом. Что интересно, в тексте для этого примера, ошибки, конечно были, но их крайне не много! Тем более, учитывая в каком невзрачном качестве был исходный материал — картинка.

По скорости и качеству вполне сравнимо с FineReader!

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

3. Пакетное распознавание текста

Эта функция программы может пригодится, когда вам нужно распознать не одну картинку, а сразу несколько. Ярлык для запуска пакетного распознавания, обычно, спрятан в меню « пуск «.

1) После открытия программы, вам нужно создать новый пакет, либо открыть ранее сохраненный. В нашем примере — создадим новый.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

2) В следующем шаге даем ему название, желательно такое, чтобы и через полгода вспомнить что в нем сохранено.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

3) Далее выбираете язык документа (русско-английский), указываете, есть ли в вашем отсканированном материале картинки и таблицы.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

4) Теперь нужно указать папку, в которой расположены файлы для распознавания. Кстати, что интересно, программа сама найдет все картинки и другие графические файлы, которые она сможет распознать и добавить их в проект. Вам же останется удалить лишние.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

5) Следующий шаг не важен- выбираете что делать с исходными файлами, после распознавания. Рекомендую выбрать галочку «ничего не делать».

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

6) Осталось лишь выбрать формат, в котором будет сохранен распознанный документ. Есть несколько вариантов:

— rtf — файл из документа word, открывается всеми популярными офисами (в том числе и бесплатными, ссылка на программы);

txt — текстовый формат, в нем можно сохранить только текст, картинки и таблицы нельзя;

htm — гипертекстовая страничка, удобно, если вы сканируете и распознаете файлы для сайта. Его и выберем в нашем примере.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

7) После нажатия кнопки « готово » запустится процесс обработки вашего проекта.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

8) Программа работает довольно таки быстро. После распознания перед вами появится вкладка с файлами htm. Если щелкнуть по такому файлу запуститься браузер, где вы сможете увидеть результаты. Кстати, пакет можно сохранить для дальнейшей работы с ним.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

9) Как видно, результаты работы весьма впечатляющие. Картинку программа легко распознала, а под ней легко распознала текст. При том что программа и бесплатна — то вообще супер!

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системеинтеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

4. Выводы

Если вы часто не занимаетесь сканированием и распознаванием документов, то покупать программу FineReader, наверное, не имеет смысла. С большинством задач легко справляется CuneiForm.

С другой стороны, есть у нее и минусы.

Во-первых, слишком мало инструментов для редактирования и проверки получившегося результата. Во-вторых, когда приходится распознавать много картинок — то в FineReader удобнее сразу видеть в колонке справа всё, что добавлено в проект: быстро удалять лишнее, вносить правки пр. И третье, на документах совсем уж плохого качества, CuneiForm проигрывает в качестве распознавания: приходится документ доводить до ума — править шибки, проставлять знаки препинания, кавычки и т.д.

На этом все. А вы знаете какую-нибудь еще достойную бесплатную программу для распознавания текста?

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

CuneiForm — бесплатная программа для распознавания текста

CuneiForm — бесплатная система оптического распознавания текста на изображениях и отсканированных документах, с возможностью дальнейшего редактирования в офисных пакетах и текстовых редакторах.

Назначение и возможности программы CuneiForm OpenOCR

Пользователи часто задаются вопросом: Как отсканированный документ перевести в формат Word? Как раз для этого и предназначен пакет. Приложение позволяет найти и распознать текст на изображениях полученных со сканера, цифровых фото-, видео-, веб-камер, мобильных телефонов, планшетов или скриншотов, и с сохранением форматирования данных перевести документ в редактируемый формат.

Приведем простой пример. Имеется графический файл содержащий фотографию газетной заметки, которую необходимо перевести в текст и отредактировать.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Запустите программу и зайдите в верхнем меню в пункт «Файл», а затем «Открыть».

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Откройте меню «Файл» в CuneiForm

В появившейся форме выберите путь к файлу и сам файл.

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

OpenOCR — выберите необходимый файл

После того как изображение будет открыто в программе, нажмите на пункт меню с изображением циркуля, и в выпадающем меню выберите пункт «Авторазметка»

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

CuneiForm — пункт меню Авторазметка

Программа в автоматическом режиме выделит блоки для дальнейшего распознавания, пользователь также может создавать, изменять и удалять блоки самостоятельно, либо корректировать результаты работы автоматического режима.

После того как все блоки подготовлены, нажмите на пиктограмму с изображением очков, а в появившемся выпадающем меню пункт «Распознать»

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Распознавание текста в CuneiForm OpenOCR

интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть фото интеграция с системой распознавания cuneiform реализована в какой системе. Смотреть картинку интеграция с системой распознавания cuneiform реализована в какой системе. Картинка про интеграция с системой распознавания cuneiform реализована в какой системе. Фото интеграция с системой распознавания cuneiform реализована в какой системе

Полученный CuneiForm результат в программе Writer из пакета LibreOffice

Открыть и отредактировать RTF файл можно практически в любом текстовом редакторе, либо офисном пакете, например, в популярных бесплатных LibreOffice или OpenOffice, загрузить которые Вы так же можете на соответствующих страницах нашего ресурса.

Так же Вам может быть полезна программа для сканирования VueScan, позволяющая работать старым сканерам с новыми операционными системами и имеющая дополнительные возможности по сравнению со стандартными драйверами сканера.

CuneiForm
Типоптическое распознавание символов
АвторCognitive Technologies
Разработчикикоманда CuneiForm-Linux
Написана наC, C++
Интерфейскомандная строка
Операционная системаLinux, Mac OS X и др. UNIX-подобные
Первый выпуск1996
Последняя версия1.1.0(19 апреля 2011 [1] )
Создаваемые форматы файловHOCR
Состояниеактивное
ЛицензияBSD-подобная лицензия Cognitive Technologies [2]
Сайтlaunchpad.net/cuneiform-…

OCR CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с наиболее популярными моделями сканеров, МФУ и ПО в России и мире: Corel Draw, Hewlet-Pachard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др. В 2008 году Cognitive Technologies открыла исходные коды OCR CuneiForm.

Содержание

Особенности [ править | править код ]

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.

Список языков, поддерживаемых системой:

История [ править | править код ]

1993 год — Cognitive Technologies заключила OEM-контракт с канадской корпорацией Corel Corporation, по которому библиотека распознавания Cognitive встроена в популярный издательский пакет Corel Draw 3.0 (и последующие версии). [4]

1994 год — Заключен контракт с Hewlett-Packard по комплектации сканеров, поставляемых в Россию OCR CuneiForm. Это первый контракт HP с российским разработчиком ПО. [5] [6] [7] [8]

1995 год — Заключен контракт с японской корпорацией Epson о комплектации сканеров OCR CuneiForm. [9] Подписан OEM-контракт с крупнейшим мировым производителем факсимильных аппаратов, лазерных принтеров, сканеров и другого офисного оборудования — Brother Corporation. Согласно договору новый роликовый сканер Brother IC-150 будет комплектоваться программным обеспечением Cognitive для сканирования, распознавания по всему миру.

1996 год — Подписан ОЕМ-контракт с одним из крупнейших мировых производителей мониторов, факсимильных аппаратов, лазерных принтеров, многофункциональных устройств и другого офисного оборудования — Samsung Information Systems America. [10] Согласно договору новое многофункциональное устройство Samsung OFFICE MASTER OML-8630A будет продаваться в комплекте с системой оптического распознавания символов Cognitive Cuneiform LE по всему миру.

Адаптивное распознавание — метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, то есть используется динамическая настройка (адаптация) на конкретные входные символы. Таким образом, метод совмещает универсальность и технологичность бесшрифтового подхода и высокую точность распознавания шрифтового, что позволяет кардинальным образом повысить качество распознавания.

1997 год — В системе CuneiForm впервые применены технологии, основанные на нейронных сетях. Алгоритмы, использующие нейронные сети для распознавания символов, строятся следующим образом. Поступающее на распознавание изображение символа (растр) приводится к некоторому стандартному размеру (нормализуется). Значения яркости в узлах нормализованного растра используются в качестве входных параметров нейронной сети. Число выходных параметров нейронной сети равняется числу распознаваемых символов. Результатом распознавания является символ, которому соответствует наибольшее из значений выходного вектора нейронной сети.

2001 год — Подписан OEM-контракт о комплектации оборудования, производимого компанией Canon (сканеры, многофункциональные устройства), программным обеспечением Cognitive Technologies (OCR CuneiForm) на территории стран Восточной Европы.

Последняя версия OpenSource версии для Windows не обновлялась с февраля 2009.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *