5:47 AM Узнать и распознать | |
№ 215 (16846) от 14.11.2009 Александр КАМИНСКИЙ, Алматы Изобретена программа, распознающая беглую казахскую речь и переводящая ее в текст. Сбылась заветная мечта судебных секретарей, парламентских стенографистов и даже оперативных работников, замученных бесчисленными протоколами. Над проблемой распознавания устной речи с 90-х годов относительно успешно работали крупнейшие IT-корпорации мира. Обычно речь шла о различении компьютерной программой определенного списка слов, произносимых четко и раздельно. Но амбициозная задача узнавания всех слов языка в режиме живой речи не ставилась даже мастодонтами программного обеспечения, хотя Билл Гейтс говорил о создании такого интерфейса как одной из приоритетных задач человечества. - В этом направлении нами сделан ряд разработок. Многие ими, наверное, уже пользовались, - говорит директор казахстанской фирмы "Изет" Изетали Тилешев. - Это шрифты, проверка орфографии казахского языка, словари и переводчик с русского на казахский язык и обратно. Данная программа - дальнейшее развитие этих работ. Казахский язык по своим грамматическим и фонетическим особенностям труден для распознавания. Если, например, в английском "pig" - он и в Африке "pig", то в казахском в связи с большим числом аффиксов каждое слово имеет большое количество словоформ, что очень усложняет математическое моделирование речи. Использование западных разработок для распознавания казахской речи оказалось невозможным. Фактически разработчики с нуля построили акустическую модель казахского языка. Работа над проектом продолжалась более трех лет. В качестве образца были записаны голоса сорока дикторов-женщин и тридцати мужчин разных возрастов. Записано 30 тысяч словоформ казахского языка. Был достигнут уровень распознавания речи на 70-80 процентов. К весне следующего года создатели надеются выйти на рынок с коммерческой версией программы. Она будет распознавать 90 процентов сказанного, для этого необходимо поработать над голосами не менее чем тысячи дикторов. Еще лучше будет, если пользователь, купивший распознаватель речи, даст ему приспособиться к собственной дикции, зачитав несколько образцовых текстов. Чтобы программа работала достаточно быстро, нужен, по крайней мере, двухядерный процессор компьютера и оперативная память не менее гигабайта. Разработчики отважно предоставили опытный образец журналистам. Демонстрация прошла с переменным успехом - программа в принципе работала, но путала близкие по звучанию слова, долго думала, ошибалась. Однако когда кто-то сказал по-казахски: "Нурсултан Абишевич Назарбаев - президент Республики Казахстан", то программа сразу "взяла под козырек" и немедленно отпечатала всю фразу без единой ошибки. Андрей Карпин, один из авторов разработки, говорит, что сейчас даже трудно представить себе, насколько обширными могут быть сферы применения распознавателя речи. Например, можно будет проводить поиск слова в Интернете не по его написанию, а по звучанию. Можно будет автоматизировать поиск в судебных архивах, поскольку вследствие практики ведения аудио- и видеозаписей на процессе в них скопилось огромное количество фонограмм. Программа может существенно ускорить и облегчить работу судебных протоколистов, следователей, оперативных дежурных спецслужб, парламентских стенографистов, журналистов, педагогов - словом, всех, кто работает на границе живого и печатного слова. Но самое главное - программа создает мостик между казахским языком и мультимедийным обеспечением, продвигая казахскую речь в сложный компьютеризированный мир будущего. http://www.express-k.kz/show_article.php?art_id=34560 | |
|
Форма входа |
---|
Категории раздела | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Социальные закладк |
---|
Поиск |
---|
Друзья сайта |
---|
Статистика |
---|