Искусственный интеллект научили «читать» по губам

Искусственный интеллект научили «читать» по губам

26 апреля 2019


Исследователи из Калифорнийского университета в Сан-Франциско сделали большой шаг в улучшении технологии, позволив искусственному интеллекту воспроизводить голос не читая мысли, а анализируя движения губ человека. Результат оказался впечатляющим — синтезированный голос можно послушать прямо сейчас.

Ожидается, что устройство будет работать, когда человек мысленно или физически будет воспроизводить движения рта, даже если он не будет выдавать никаких звуков. Чтобы понять, какие области человеческого мозга активизируются при определенных движениях рта, исследователи вовлекли в испытание пять добровольцев. Им были прочитаны небольшие отрывки из детских рассказов — в ходе этого процесса внедренные в их мозги электроды считывали их активность.

В конечном итоге у исследователей получились две нейронные сети: первая согласовывала сигналы мозга с движениями губ, а вторая превращала эти движения в синтезированную речь. Добровольцы действительно смогли повторить отрывки предложений — на записи можно легко распознать около 69% синтезированных слов. Как и в других исследованиях, чем короче были предложения, тем точнее получался результат.

Исследователи могут улучшить технологию путем использования мозговых имплантатов с более плотным расположением электродов и сложных алгоритмов машинного обучения. Между реакцией мозгов разных участников исследования были найдены общие черты, что говорит о том, что будущие устройства для синтеза речи можно будет легко настраивать под каждого человека. Также исследователи заметили, что искусственный интеллект порой распознает и не использованные при обучении звуки, что тоже вселяет большие надежды.

articles_views.php?article=22143


Источник

Это также будет Вам интересно:
Популярные темы часа: 2019сигналытехнологииТехнологии
iMag.one - Самые важные новости достойные вашего внимания из более чем 300 изданий!