Компьютер, читающий по губам
О создании искусственного интеллекта, способного распознавать человеческую речь, впервые заговорили в Оксфордском университете. Сегодня же, благодаря упорной работе многочисленных ученых, удалось создать абсолютно новую программу с возможностями, в разы превышающими человеческие способности.
Работа проводилась совместно британскими учеными и специалистами компании DeepMind, которая специализируется на машинном обучении. За компанией DeepMind уже числится огромное количество успешных инновационных разработок в области распознавания эмоций человека. Однако для создания компьютера, способного распознавать по движению человеческих губ речь, разработчикам необходимо было использовать дополнительные источники (записи телепередач и субтитры к ним). Программа обязана была устанавливать соответствие мимики говорящего на записи человека с аналогичной звуковой информацией на напечатанном тексте.
Когда были получены первые результаты?
Предварительные результаты новейшей разработки появились в ноябре прошлого года. Тогда же ученые во всеуслышание заявили об успешном создании искусственного интеллекта, читающего по губам. В своем отчете о проделанной работе ученые из Оксфорда раскрыли некоторые секреты разработки. Как утверждают исследователи, компьютеру удалось проанализировать более 5 тыс. выпусков различных программ, среди которых были немало известные телепередачи под названием BBC Breakfast, Newsnight, Question Time. Благодаря программам компьютером были отслежены более 118 тыс. предложений, словарный запас, охваченный при этом, насчитывает более 17,5 тыс. слов.
Проверка новой технологии прошла успешно. При показе фильма без звука искусственному интеллекту удалось превзойти возможности профессионального чтеца по губам, более чем в 4 раза. Компьютером было расшифровано 50 % текста без единой допущенной ошибки. Остальная же часть текста была расшифрована с незначительными ошибками. Успех человека в этом вопросе составил всего лишь 12% проработанного текста.
Каковы перспективы проекта?
Новая разработка может стать альтернативным помощником для людей с частичной потерей слуха. Слабослышащие люди смогут лучше ориентироваться в современном мире. Технологией уже вплотную заинтересовалась организация Action on Hearing Loss. Однако однозначно сказать, что новая разработка позволит открыть новые горизонты возможностей пока рано. В основном функцией искусственного интеллекта на сегодняшний день является проработка и улучшение уже существующих методов распознавания речи. Как предполагают сами разработчики, при глубоком совершенствовании технологии и расширении словарного запаса перспективы данного проекта могут быть безграничными. Возможно и дублирование старых архивных видеозаписей с неясной речью станет реально выполнимой задачей.
Комментарии (0)