Microsoft делает преобразование текста в речь более доступным и вместе с Alphabet X открывает обучающие курсы по квантовым вычислениям


Microsoft делает преобразование текста в речь более доступным и вместе с Alphabet X открывает обучающие курсы по квантовым вычислениям

Microsoft совместно с группой китайских исследователей создала искусственный интеллект для преобразования текста в речь. Он способен генерировать реалистичную речь, используя 200 образцов голоса (общей продолжительностью примерно 20 минут) и соответствующие правила транскрипции. Система частично полагается на так называемые трансформеры – глубокие нейронные сети, которые действуют приблизительно как мозговые нейроны.

Преобразователи обрабатывают каждый ввод и вывод на лету, словно синаптические связи, помогая системе эффективно воспроизводить длинные и сложные конструкции. Данная технология также имеет функцию шумоподавления, что позволяет добиться довольно реалистичного звучания. Тем не менее, результаты ещё не идеальные, в них иногда наблюдается незначительная роботизированная интонация, но разборчивость слов составляет 99,84%. Важнее то, что преобразование текста в речь может стать более доступным – не нужно тратить много усилий, времени и ресурсов. Исследователи надеются, что в ближайшее время они смогут обучить искусственный интеллект, чтобы тот смог создавать полноценные реалистичные диалоги.

Софтверный гигант также сотрудничает с Alphabet X и Brilliant в организации онлайн-курсов по квантовым вычислениям. Курс начинается с основных понятий и постепенно знакомит слушателей с языком Q#, обучая «простейшим» квантовым алгоритмам, прежде чем переходить к действительно сложным сценариям. Курс не слишком длинный, время прохождения составляет от 16 до 24 часов. Первые два занятия доступны бесплатно. Организаторы обещают, что по итогам обучения каждый сможет написать свои 100 строк работающего квантового кода.

Источники: Engadget (2)

Источник

Интересное по теме