Как правильно класть документ в сканер. книжная и альбомная ориентация изображения.

Документ закладывается в сканер текстом вниз, по направлению к стеклу сканера. Общее правило такое. Верхняя часть текста должна находиться там, откуда стартует лампа сканера. Это будет правильная книжная ориентация. При книжной ориентации лампа сканера проходит текст сверху вниз. А правильная альбомная ориентация текста получается поворотом на 90 градусов по часовой стрелке. То есть, при альбомной ориентации лампа сканера должна проходить по тексту справа налево или против направления чтения. Если лист положен правильно, тогда можно отключить автоматическое определение ориентации страницы, что ускорит распознавание текста.

[1]Сканирование и распознавание.

FineReader содержит в своём меню различные команды для сканирования и распознавания текста. Простейшая из команд – «Сканировать и распознать» или просто «Сканировать». По этой команде будет отсканирована и тут же распознана одна страница текста. После завершения распознавания вновь распознанный текст появится в окне «Текст». Курсор будет установлен на начало распознанного текста. Джоз обычно реагирует на это произнесением слова «Текст». После этого распознанный текст можно читать и править, как в обычном редакторе текстов.

Если Вы сканируете целую книгу, то удобно сначала отсканировать все страницы, а потом их распознать.

Перечислим основные команды сканирования и распознавания (для FineReader 6.0) (фирма ABBY любит сильно изменять меню в разных версиях FineReader, а также структуру диалога настройки опций, поэтому горячие клавиши для основных операций могут отличаться в новых версиях FineReader и располагаться в других пунктах меню). В версии 11 процесс сканирования вообще происходит в отдельном диалоговом окне, которое открывается по команде «Сканировать страницы» из меню «Файл».

«Control+d» — отсканировать и распознать одну страницу или разворот книги (меню «Процесс»)

«Control+k» — сканировать одну страницу (меню «Файл»).

«Control+Shift+k» — сканировать много страниц (меню «Файл»).

«Control+T» — остановить сканирование (меню «Файл»).

«Control+r» — распознать одну страницу (меню «Процесс»).

«Control+Shift+r» — распознать все страницы (меню «Процесс»).

«Сканировать и распознать несколько страниц» – команда из меню «Процесс».

«Control+Shift+s» – вызов диалога Настройки сканера (в меню «Сервис» пункт «Настройки сканера»).

Если Вы сканируете разворот книги (альбомная ориентация текста), то можно установить опцию «Делить Разворот Книги» на вкладке «Сканирование» диалога «Опции». Это приведёт к тому, что после сканирования FineReader разделит два листа разворота на два разных файла и будет распознавать их отдельно. Такой метод улучшит качество распознавания и уменьшит количество ошибок. При сканировании отдельных страниц эту опцию можно убрать.

Однако, FineReader может не понять, что перед ним разворот книги и оставить этот разворот как страницу текста в две колонки.

А бывает и ещё хуже. Если текст состоит из многих колонок, FineReader может разделить разворот не посредине, а в другом месте. И тогда Вы получите полстраницы и полторы страницы текста и гарантировано неправильное распознавание. Поэтому будьте осторожны с переключателем «Делить Разворот Книги». Применяйте его только к качественному тексту в хорошо разворачивающейся книге.

На месте разворота обычно происходит изгиб бумаги. Место изгиба после сканирования выглядит как тёмная полоса. Если в изгиб попадают буквы, то в этом месте изображение строки изгибается, а сами буквы искажаются. Ещё буквы могут попадать как бы в серую тень изгиба, частично или полностью теряясь. Многочисленные ошибки в концах или в начале строк говорят о том, что книгу нужно сильнее прижать на развороте, чтобы уменьшить изгиб.

Если книгу не удаётся достаточно хорошо развернуть, перейдите на серый режим сканирования. Это уменьшит влияние тени изгиба на крайние буквы и улучшит распознавание.

При сканировании разворота книги в диалоге «Настройки Сканера» необходимо установить «Альбомную Ориентацию Изображения», а при сканировании одной обычной страницы текста – «Книжную ориентацию». Правда, новые версии Fine Reader уже хорошо распознают ориентацию текста в автоматическом режиме.

Текст нормального размера и качества печати можно сканировать при «Ручном подборе яркости» 50%. Если буквы мелкие, увеличьте Разрешение до 400, 500 или 600.

Если качество печати плохое или книга совсем плохо разворачивается, перейдите к «Автоматическому Подбору Яркости» и в «Режиме Сканирования Картинок» установите «Серый». Это замедлит сканирование, но улучшит качество распознавания.

Все эти параметры устанавливаются в диалоге «Настройки Сканера» («Control+Shift+s»).

Если на листе встречаются серые пятна или из-за тонкой бумаги и жирного чёрного текста проступают буквы и рисунки с обратной стороны страницы, увеличивайте яркость сканирования, например, до 60 или до 70. Это приведёт к исчезновению пятен и проступающих с обратной стороны страницы букв и рисунков.

Если буквы слишком бледные, то уменьшите яркость сканирования, например, до 40. Это приведёт к тому, что буквы станут более чёткими и жирными, и их легче будет распознавать.

Если текст на листе расположен в несколько колонок, как в журнале или газете, то на вкладке «Сканирование» диалога «Опции» переключатель «Тип Страницы» необходимо установить в положение «Авто». А если это обычный книжный текст, то лучше поставить переключатель «Тип Текста» в значение «Одна Колонка», что ускорит распознавание. Для верности лучше всегда держать этот переключатель в режиме «Авто».

Замечание. Если выставлен признак «Делить Разворот Книги», то книгу можно распознавать, установив переключатель «Тип текста» в значение «Одна колонка». Если же признак «Делить разворот книги» не выставлен, то обе страницы книги распознаются как один лист текста. То есть, получается текст, набранный в две колонки. Поэтому в таком случае необходимо установить переключатель «Тип текста» в положение «Авто», чтобы текст распознавался как состоящий из нескольких колонок.

Если нужно повторно отсканировать некоторые страницы, то установите на вкладке «Сканирование» диалога «Опции» признак «Запрашивать номер страницы перед добавлением в пакет». Это даст Вам возможность привести номер отсканированной страницы в пакете FineReader в соответствии с номером страницы в книге. Затем эту опцию можно будет отменить, так как дальше страницы будут нумероваться по порядку и добавляться в конец пакета.

Если текст распознаётся очень плохо или распознанный текст совсем нечитабелен, первым делом проверьте ориентацию страницы, то есть, правильно ли закладывается страница в сканер. Дальше проверьте на вкладке «Распознавание» диалога «Опции» самый первый параметр «Язык распознавания». Неправильно выбранный язык может привести к огромному количеству ошибок. Не ставьте «Русско-английский» язык распознавания, если в тексте нет английских букв, чтобы русские буквы не заменялись аналогичными по написанию английскими. И только после проверки языка распознавания увеличивайте разрешение сканирования и переходите к серому режиму сканирования.

Как сделать альбомную ориентацию


Похожие статьи.

Понравилась статья? Поделиться с друзьями: