Пропустить заголовок
 

Добавление текстовой информации в отсканированные данные

Функцию OCR можно использовать для добавления текстовой информации в отсканированный документ без обработки данных на компьютере.

Важно

  • Для получения подробных сведений об опциях, необходимых для данной функции, см. руководство "Начало работы".

  • Эта функция поддерживает следующие типы файлов: [PDF], [Высокое сжатие] и [PDF/A].

  • Если при сканировании оригиналов из [Тип оригинала] выбран [Черно-бел.: Текст/Фото], текст будет отсканирован в оттенках серого, и буквы в верхней и нижней части страницы могут корректно не распознаваться. Если качество распознавания более важно, чем качество изображение, выберите при сканировании оригинала [Черно-бел.: Текст] в [Тип оригинала].

  • Функцию оптического распознавания невозможно использовать в следующих случаях:

    • В качестве типа файла выбран [TIFF/JPEG] или [TIFF].

    • В блоке [Сохранить файл] выбрана опция [Сохр.на жестк.диске] или [Сохр.на жест.д+Отпр].

    • В качестве разрешения выбрано [100 т/д].

    • Выбрано [Пред.].

    • В качестве адресата сервера распределения используется [WSD] или [DSM].

1Разместите оригиналы.

2Нажмите [Отпр. Имя файла/Тип].

Иллюстрация экрана панели управления

3Выберите [PDF] в качестве [Тип файла].

4В параметрах файла PDF выберите [Настройки OCR] и нажмите [Вкл.].

5Задайте необходимые параметры, такие как [Доб. извл.текст в им.файла], [Уд.пустую страницу] и [Язык распознавания].

6Дважды нажмите [OK].

7Настройте адрес назначения и другие необходимые параметры.

8Нажмите клавишу [Пуск].

Примечание

  • Функция OCR может обрабатывать тексты объемом до 40 000 символов на каждой странице.

  • Функция OCR может распознавать следующие языки:

    • Английский, немецкий, французский, итальянский, испанский, голландский, португальский, польский, шведский, финский, норвежский, венгерский, датский, японский.

  • При сканировании изображения в разрешении 200 точек на дюйм эффективное разрешение может быть менее 200 точек на дюйм из-за применения коэффициента масштабирования. В этих случаях можно применить настройки OCR, но качество распознавания может ухудшиться.

  • Некоторые формы и типы символов могут не распозноваться корректно.

  • Если сканируемая страница не содержит распознанных как текст секций, будет создан PDF-файл без встроенного текста.

  • Если на странице есть большие пустые области, верхняя и нижнияя границы страницы могут не распознаваться корректно.

  • Файл PDF не будет создан, если все страницы документа будут определены как пустые. В этом случае проверьте правильность расположения оригиналов и попробуйте еще раз.

  • Пустая страница или вехняя и нижняя часть страницы могут не распознаваться корректно, если на отсканированной странице есть пятна или следы грязи, а также если сквозь нее просвечивает изображение с обратной стороны.

  • Если при сканировании включена функция распознавания, типы не определяются. Если ширина встроенных и печатаемых символов различается, положение встроенного текста может не совпадать с отпечатанным на отсканированной странице.

  • При указании настроек OCR и последовательном сканировании нескольких пакетов оригиналов скорость сканирования может падать при определенных параметрах разрешения и размеров оригиналов.