Мультфильмы для роботов: как синтетические данные помогают экономить время и деньги

Для обучения современных моделей искусственного интеллекта (ИИ) требуется много данных и много времени. В некоторых случаях можно сэкономить и то, и другое с помощью искусственно созданных данных

Директор по науке Neuromation Сергей Николенко и основатель и директор по маркетингу TechComLab Илья Стечкин подготовили для TechFusion.ru подробный материал о том, зачем искусственному интеллекту смотреть мультфильмы и чем могут помочь бизнесу синтетические данные.

Как выглядят и где применяются синтетиченские данные

Синтетические данные — это, в первую очередь, рисунки (2D- и 3D-модели) и виртуальные среды, в которых возможно взаимодействие с ними. Взаимодействие с нарисованным объектом дает реальный опыт, необходимый для обучения ИИ, примерно как в тренажерах-симуляторах. Например, в третьей части мультфильма «Тачки» главный герой стремится попасть на такой тренажер, рассчитывая (и не без оснований), что тот поможет лучше изучить тактику соперника и особенности гоночных трасс. Робот из мультфильма пытается использовать мультфильм для роботов внутри мультфильма про роботов… воистину, we need to go deeper.

Не только гонщики, но и летчики вовсю используют виртуальные среды для получения более дешевого опыта, ведь реальные полетные часы стоят очень дорого. А человеческая жизнь — бесценна, поэтому врачи проходят практику, производя операции на специально сконструированных роботах. Вот и искусственный интеллект сегодня также способен к обучению на моделях, функционирующих в виртуальных средах.

Что общего у всех примеров, которые мы привели выше? Они рассчитаны на получение больших объемов визуальной информации. Так и синтетические данные лучше всего подходят для совершенствования технологий компьютерного зрения. Например, для роботов, которые должны уметь перемещаться по производственным или жилым помещениям, необходимы наборы данных (датасеты) интерьеров.

В идеале — это трехмерные среды с описанными свойствами объектов (твердый/мягкий, подвижный/неподвижный, хрупкий/прочный и т.п.), которые позволяют осуществлять обучение с подкреплением, то есть давать системе опыт интерактивного взаимодействия с объектами, активных действий в окружающей среде, а не только навык их «узнавания» по картинкам или видео.

Синтетические данные и компьютерное зрение

Хотя сам по себе навык узнавания тоже весьма востребован бизнесом. Например, если интеллектуальная система торговой сети умеет распознавать те или иные товары на полках, это дает возможность поставщикам отказаться от услуг супервайзеров и существенно снизить расходы на мерчандайзинг.

Распознавание лиц позволит не только просчитать возможную угрозу со стороны того или иного человека, но также использовать ИИ для контроля явки сотрудника на рабочее место или даже как инструмент контроля качества. Предположим, сотрудник кредитного отдела банка общается с клиентом. Параллельно система анализирует мимику клиента, выявляя и фиксируя неприятные моменты беседы. Обрабатывая контрольную запись разговора, сотрудник отдела качества обслуживания получит от системы уведомление о том, на какие именно фрагменты беседы (с точностью до секунды) стоит обратить внимание. Эффективность работы отдела контроля качества, а значит, и кредитного отдела, существенно возрастет.

Навык распознавания объектов хорошо тренируется с помощью синтетических данных.

От распознавания к действию

Если говорить о распознавании объектов и автоматизации действий, связанных с корректным распознаванием, то первое, что приходит на ум, — это сборочные цеха. Номенклатура деталей всегда ограничена. А значит, сравнительно просто обучить систему «узнавать» ту или иную деталь и давать команду на определенное действие с нею.

Более сложный пример — линии упаковочные. Число наименований и свойств товаров, подлежащих упаковке, может быть весьма велико, но, опять же, всегда конечно и известно заранее.

Наконец, похожий механизм может сработать и для задачи, обратной упаковке и сборке — утилизации. Например, интеллектуальные системы сортировки мусора могут существенно повысить качество переработки, а значит, их массовое внедрение позволит заметно уменьшить ущерб, наносимый окружающей среде, и компенсировать безразличие людей, которые часто не обращают внимания на контейнеры для раздельного сбора отходов.

Машинное обучение в виртуальных пространствах

Вернемся к мультфильмам. Pixar приучила нас к богатой мимике персонажей и удивительной достоверности обстановки, в которой они действуют. Текстуры, цвета, преломление света — все это вызывает у нас доверие к происходящему на экране. Мы понимаем, как «синтезировать» стул, стол, колесо от машины и даже лицо.

Значит, мы можем оснастить «виртуальный учебный класс» для ИИ всеми этими объектами, научить распознавать их, познакомить с их свойствами (цветом, весом, размером, фактурой и т.п.) и дать возможность «поиграть» с ними: поменять колеса разных размеров на виртуальных автомобилях, пододвинуть миллион стульев к миллиону столов, причем столы и стулья будут различаться высотой ножек, формой спинок, свойствами материалов. Они будут двигаться по паркету, мрамору, линолеуму или другому покрытию. Лица будут злорадно или радостно улыбаться, зло или печально хмуриться, выражать нетерпение…

И система научится интерпретировать эмоции и действовать с учетом этой информации. Но даже сегодня система распознавания лиц позволила Apple реализовать принципиально новый способ авторизации пользователя мобильного устройства.

Синтетические данные: границы области применения

Синтетические данные применить легко в том случае, если то, что мы хотим объяснить машине, «перпендикулярно» отличию между синтетическими данными и настоящими. Другими словами: мы узнаем бутылку колы и на фотографии, и на рисунке, и на полке в магазине. У нее характерная форма, уникальная этикетка, специфические цвет и размер. Если показать вам рисованный мультфильм с новой этикеткой колы, вы легко узнаете её в магазине — и искусственный интеллект тоже может с этим справиться.

Гораздо сложнее использовать синтетические данные для распознавания объектов, форму которых мы не можем предсказать заранее. Например, если мы распознаем раковые опухоли, то понять их характерную форму — это и есть большая часть задачи; а если ее не понять, то как сгенерировать синтетические данные?

Но можно попытаться взять большой массив реальных снимков, сделать синтетические заготовки (которые пока будут бесполезны для обучения системы диагностики), а затем применить порождающие модели (вид моделей искусственного интеллекта, которые могут не только, например, классифицировать породы собак по фотографиям, но и породить новую «фотографию» собаки нужной породы) для того, чтобы сделать «синтетические меланомы» более похожими на настоящие.

Так можно дополнить настоящие данные в тех случаях, когда их мало; в той же медицине так бывает сплошь и рядом. И тогда система сможет с высокой степенью достоверности распознавать прячущуюся опасность на разных стадиях. Над этой задачей сейчас бьются лучшие умы индустрии машинного обучения, и есть основания надеяться, что она будет успешно решена в обозримом будущем.

Практика применения синтетических данных

Кое-что мы уже можем применить на практике. Одна из наших лабораторий занимается исследованиями в области фармацевтики и биотехнологий. В ее задачи входит обучение ИИ распознаванию специфических изображений и глубокое обучение для улучшения медицинского обслуживания.

Например, совместно с компанией MonBaby мы разрабатываем интеллектуальную камеру, которая позволит интерпретировать состояние младенца по смене позы, изменению характера дыхания и т.п. Если поведение или состояние младенца выйдет за пределы нормы, в установленное на родительский смартфон приложение поступиит тревожный сигнал.

В 2016 году Frost & Sullivan опубликовали исследование, в котором оценивают рынок искусственного интеллекта в здравоохранении не менее 6,6 млрд. долларов США к 2021 году (по сравнению с 634 млн. долларов США в 2014 году). В отчете также отмечается, что использование ИИ при диагностике и шире в клинической практике позволило бы сократить расходы на лечение на 50 процентов, улучшая при этом результаты как минимум на 30–40 процентов.

За границами области применения

Есть, конечно, и бастионы, которые раз за разом отбивают атаки ученых. Например, мы не умеем генерировать текст на естественном языке; до того, чтобы пройти тест Тьюринга, моделям искусственного интеллекта ещё очень далеко. Здесь задача порождения гораздо сложнее, чем большинство задач, которые мы можем потом захотеть научиться решать, так что синтетические данные в обработке естественных языков применяются только в очень ограниченных контекстах.

Синтетические данные: взгляд со стороны бизнеса

Этот текст для вас тоже написали живые люди, которым очень хочется, чтобы вы по достоинству оценили реальные возможности современных интеллектуальных систем и задумались о том, как они могут усилить ваш бизнес уже сегодня.

Выгоды от внедрения интеллектуальных систем в 2018 году уже оценили 4% компаний, 21% планируют в самое ближайшее время начать экспериментировать с этими технологиями, а 25% бизнесов рассматривают возможность внедрения искусственного интеллекта (ИИ) в средне- и долгосрочной перспективе (см. доклад Gartner «Прогноз: ценность искусственного интеллекта для бизнеса во всем мире в 2017 – 2025 годы» / «Forecast: The Business Value of Artificial Intelligence, Worldwide, 2017-2025).

Таким образом, около половины предприятий всерьез настроены внедрять ИИ в бизнес-практики. Однако этот процесс тормозится из-за того, что компании не в состоянии предоставить структурированные массивы данных, необходимые для обучения интеллектуальных систем.

Чтобы не отставать от конкурентов, важно своевременно проанализировать возможность синтезировать большие объемы данных, соответствующих специфике вашего бизнеса. И если такая возможность есть — ее нужно использовать.

Иллюстрации для материала предоставлены компанией Neuromation

Neuromation
Искусственный интеллект
машинное обучение
Нейросети
синтетические данные Источник

Это также будет Вам интересно:

Набирает популярность:

Популярные темы часа: ДанияИИСШАтехнологииТехнологии