home











 • Абай





Universal
Declaration of Human Rights
Kaz
Kyrg
Rus New!



Как я научил FineReader понимать казахский:

Идем в Меню Сервис

/редактор языков...

/новый...

/создать новый язык

/В свойствах языка пишем имя языка [Къазакъ тiлi]

/выбрать мышкой нужные и кириллические символы и латинскую I и i

/Finish

После сканирования и сегментирования (лучше вручную) надо в опциях распознавания установить распознавание с обучением:

Начинаем распознавание с обучением и любой новый символ назначаем для FineReader'a как Новую лигатуру из новой практической транскрипции "Казановица"



После "Ручного обучения эталона" и достаточно уверенного распознавания - можно разрешить ему "Продолжать без обучения"

Жалгъасы • Продолжение

Вопросы и Ответы по распознаванию текстов на казахском языке.

В. Почему-то после обучения не все символы распознаются, даже обычные русские буквы. Да, я еще хотел спросить, каким должен быть первоначальный казахский текст для сканирования.

О. Во-первых, Fine Reader распознает действительно не очень уверенно, даже просто русский текст, но качество распознавания напрямую зависит от качества оригинала, во-вторых, есть несколько правил сканирования.

В. Каковы эти правила?

О. Я бы рекомендовал то, что проверено опытом:

  • сканировать с разрешением не меньше 300 dpi (но и не больше 600 dpi);
  • лучше grayscale (256 оттенков серого) чем black&white (черно-белый);
  • обязательно немного сузить динамический диапазон, те. движок dark (темный) чуть вправо (сделать текст более темным), light (светлый) - влево (сделать желто-серую бумагу белой). Изображение при этом становится более четким, серость бумаги исчезает и появляется белизна, а буквы становятся чернее; - обязательно выровнять лист (текст), чем ближе строки к горизонтали или вертикали, тем увереннее распознается текст;

И все равно придется учить FineReader и русским буквам, кстати, придется залезть в шаблон и "выковырять" от туда неудачно или ошибочно занесенные символы. Кроме того, даже если вы будете сканировать уже без обучения, надо до сканирования, при пустом окне установить шаблон "казахский". Иначе он по умолчанию не вызывается.

В. Вы не могли бы поподробнее рассказать о сканировании. У меня HP Office Jet Pro 1170 c. И как установить грейскейл?

О. Сканирование производится любым сканером, независимо от его марки, при этом используется универсальный протокол TWAIN (это как бы правила взаимодействия сканера и программ вызывающих сканирование). Подключение сканера, кроме установки его специальных программ, которые идут в поставке со сканером, необходимо осуществить и в самой программе. В частности в FineReader'e нужно в меню Service (Сервис) выбрать пункт Select TWAIN... (Выбор сканера...)

Select TWAIN... (Выбор сканера...)

В. Как настроить Fine Reader и сканер для сканирования казахских текстов?

О. Сканирование с помощью разных сканеров отличается только интерфейсами TWAIN-программ этих устройств. Подробно останавливаться на перечислении всех особенностей не имеет смысла. Главное соблюдать вышеприведенные правила и стараться не перегружать сканер излишним разрешением (1200 dpi ничего вам не даст, кроме замедления работы).

Настройка Fine Reader'a:

В меню-кнопке 1. Сканировать выбрать пункт Опции...

(3K) Option...

Проверить, чтобы сканер был обязательно выбран:

(7K) Option...

В опции Распознавание можно выбрать Язык исходного документа и указать Текущий пользователский эталон, можете разрешить Распознавание с обучением:

(11K) Option...

Андрей Сергеев.

Search in Dictionary (rus-kaz-rus)
А АЬ Б В
Г ГЪ Д Е
Ё Ж З И
Й К КЪ Л
М Н НЪ О
ОЬ П Р С
Т У УЪ УЬ
Ф Х ХЪ Ц
Ч Ш Щ Ъ
Ы I Ь Э

Ю Я
TopList
Шрифты легально!