Коллеги - педагогический журнал Казахстана

Главная » 2009 » Ноябрь » 17 » Узнать и распознать
5:47 AM
Узнать и распознать
№ 215 (16846) от 14.11.2009
Александр КАМИНСКИЙ, Алматы
Изобретена программа, распознающая беглую казахскую речь и переводящая ее в текст. Сбылась заветная мечта судебных секретарей, парламентских стенографистов и даже оперативных работников, замученных бесчисленными протоколами.
Над проблемой распознавания устной речи с 90-х годов относительно успешно работали крупнейшие IT-корпорации мира. Обычно речь шла о различении компьютерной программой определенного списка слов, произносимых четко и раздельно. Но амбициозная задача узнавания всех слов языка в режиме живой речи не ставилась даже мастодонтами программного обеспечения, хотя Билл Гейтс говорил о создании такого интерфейса как одной из приоритетных задач человечества.
- В этом направлении нами сделан ряд разработок. Многие ими, наверное, уже пользовались, - говорит директор казахстанской фирмы "Изет" Изетали Тилешев. - Это шрифты, проверка орфографии казахского языка, словари и переводчик с русского на казахский язык и обратно. Данная программа - дальнейшее развитие этих работ.
Казахский язык по своим грамматическим и фонетическим особенностям труден для распознавания. Если, например, в английском "pig" - он и в Африке "pig", то в казахском в связи с большим числом аффиксов каждое слово имеет большое количество словоформ, что очень усложняет математическое моделирование речи. Использование западных разработок для распознавания казахской речи оказалось невозможным. Фактически разработчики с нуля построили акустическую модель казахского языка.
Работа над проектом продолжалась более трех лет. В качестве образца были записаны голоса сорока дикторов-женщин и тридцати мужчин разных возрастов. Записано 30 тысяч словоформ казахского языка. Был достигнут уровень распознавания речи на 70-80 процентов. К весне следующего года создатели надеются выйти на рынок с коммерческой версией программы. Она будет распознавать 90 процентов сказанного, для этого необходимо поработать над голосами не менее чем тысячи дикторов.
Еще лучше будет, если пользователь, купивший распознаватель речи, даст ему приспособиться к собственной дикции, зачитав несколько образцовых текстов. Чтобы программа работала достаточно быстро, нужен, по крайней мере, двухядерный процессор компьютера и оперативная память не менее гигабайта.
Разработчики отважно предоставили опытный образец журналистам. Демонстрация прошла с переменным успехом - программа в принципе работала, но путала близкие по звучанию слова, долго думала, ошибалась. Однако когда кто-то сказал по-казахски: "Нурсултан Абишевич Назарбаев - президент Республики Казахстан", то программа сразу "взяла под козырек" и немедленно отпечатала всю фразу без единой ошибки.
Андрей Карпин, один из авторов разработки, говорит, что сейчас даже трудно представить себе, насколько обширными могут быть сферы применения распознавателя речи. Например, можно будет проводить поиск слова в Интернете не по его написанию, а по звучанию. Можно будет автоматизировать поиск в судебных архивах, поскольку вследствие практики ведения аудио- и видеозаписей на процессе в них скопилось огромное количество фонограмм. Программа может существенно ускорить и облегчить работу судебных протоколистов, следователей, оперативных дежурных спецслужб, парламентских стенографистов, журналистов, педагогов - словом, всех, кто работает на границе живого и печатного слова.
Но самое главное - программа создает мостик между казахским языком и мультимедийным обеспечением, продвигая казахскую речь в сложный компьютеризированный мир будущего.
http://www.express-k.kz/show_article.php?art_id=34560
Категория: Новости Казахстан | Просмотров: 983 | Добавил: collegy | Теги: казахский язык | Рейтинг: 0.0/0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Пятница, 2024-11-08, 7:27 PM
Приветствую Вас Гость

Форма входа

Категории раздела

Новости Казахстан [1793] Новости Россия [389] Портрет учителя [11] Новости сайта [76]
Наш календарь [45] Новости Планета [382] Хочу все знать [198]
Для любознательных учителей
Гранты и конкурсы [112]
Гранты и конкурсы
Новости Россотрудничества [151] ТЮЗ им. Н.Сац г.Алматы [30] Новости факультета журналистики КазНУ им. аль-Фараби [3] 75 лет Великой Победе [6]

Социальные закладк

Поиск

Друзья сайта

Академия сказочных наук

  • Теги

    презентация Ирина Борисенко открытый урок информатика флипчарт животные новый год 9 класс 5 класс творчество Казахские пословицы проект конспект урока 6 класс физика язык класс педагогика стихи Казахстан математика урок праздник наурыз познание мира музыка доклад программа литература география природа сценарий семья воспитание классному руководителю осень игра казахский язык и литература викторина Начальная школа тест конкурс ИЗО внеклассная работа литературное чтение Русский язык 3 класс технология воспитательная работа сказка Здоровье Оксана 8 марта искусство независимость английский язык психология учитель 3 класс биология статья внеклассное мероприятие классный час ЕНТ выпускной школа 1 класс Русский язык ЕГЭ тесты химия начальные классы Дети экология Дошкольники любовь разработка урока казахский язык самопознание Английский родители br конспект спорт критическое мышление патриотизм дружба дошколенок История обучение тренинг разработка 7 класс физическая культура игры КВН занятие детский сад физкультура Абай коучинг

    Статистика

    Рейтинг@Mail.ru