Категория: Технологии

Мультфильмы для роботов: как синтетические данные помогают экономить время и деньги

Для обучения современных моделей искусственного интеллекта (ИИ) требуется много данных и много времени. В некоторых случаях можно сэкономить и то, и другое с помощью искусственно созданных данных


Директор по науке Neuromation Сергей Николенко и основатель и директор по маркетингу TechComLab Илья Стечкин подготовили для TechFusion.ru подробный материал о том, зачем искусственному интеллекту смотреть мультфильмы и чем могут помочь бизнесу синтетические данные.


Как выглядят и где применяются синтетиченские данные

Синтетические данные — это, в первую очередь, рисунки (2D- и 3D-модели) и виртуальные среды, в которых возможно взаимодействие с ними. Взаимодействие с нарисованным объектом дает реальный опыт, необходимый для обучения ИИ, примерно как в тренажерах-симуляторах. Например, в третьей части мультфильма «Тачки» главный герой стремится попасть на такой тренажер, рассчитывая (и не без оснований), что тот поможет лучше изучить тактику соперника и особенности гоночных трасс. Робот из мультфильма пытается использовать мультфильм для роботов внутри мультфильма про роботов… воистину, we need to go deeper.

Не только гонщики, но и летчики вовсю используют виртуальные среды для получения более дешевого опыта, ведь реальные полетные часы стоят очень дорого. А человеческая жизнь — бесценна, поэтому врачи проходят практику, производя операции на специально сконструированных роботах. Вот и искусственный интеллект сегодня также способен к обучению на моделях, функционирующих в виртуальных средах.        

Что общего у всех примеров, которые мы привели выше? Они рассчитаны на получение больших объемов визуальной информации. Так и синтетические данные лучше всего подходят для совершенствования технологий компьютерного зрения. Например, для роботов, которые должны уметь перемещаться по производственным или жилым помещениям, необходимы наборы данных (датасеты) интерьеров.

В идеале — это трехмерные среды с описанными свойствами объектов (твердый/мягкий, подвижный/неподвижный, хрупкий/прочный и т.п.), которые позволяют осуществлять обучение с подкреплением, то есть давать системе опыт интерактивного взаимодействия с объектами, активных действий в окружающей среде, а не только навык их «узнавания» по картинкам или видео.

Синтетические данные и компьютерное зрение

Хотя сам по себе навык узнавания тоже весьма востребован бизнесом. Например, если интеллектуальная система торговой сети умеет распознавать те или иные товары на полках, это дает возможность поставщикам отказаться от услуг супервайзеров и существенно снизить расходы на мерчандайзинг.

Распознавание лиц позволит не только просчитать возможную угрозу со стороны того или иного человека, но также использовать ИИ для контроля явки сотрудника на рабочее место или даже как инструмент контроля качества. Предположим, сотрудник кредитного отдела банка общается с клиентом. Параллельно система анализирует мимику клиента, выявляя и фиксируя неприятные моменты беседы. Обрабатывая контрольную запись разговора, сотрудник отдела качества обслуживания получит от системы уведомление о том, на какие именно фрагменты беседы (с точностью до секунды) стоит обратить внимание. Эффективность работы отдела контроля качества, а значит, и кредитного отдела, существенно возрастет.

Навык распознавания объектов хорошо тренируется с помощью синтетических данных.

От распознавания к действию

Если говорить о распознавании объектов и автоматизации действий, связанных с корректным распознаванием, то первое, что приходит на ум, — это сборочные цеха. Номенклатура деталей всегда ограничена. А значит, сравнительно просто обучить систему «узнавать» ту или иную деталь и давать команду на определенное действие с нею.

Более сложный пример — линии упаковочные. Число наименований и свойств товаров, подлежащих упаковке, может быть весьма велико, но, опять же, всегда конечно и известно заранее.

Наконец, похожий механизм может сработать и для задачи, обратной упаковке и сборке — утилизации. Например, интеллектуальные системы сортировки мусора могут существенно повысить качество переработки, а значит, их массовое внедрение позволит заметно уменьшить ущерб, наносимый окружающей среде, и компенсировать безразличие людей, которые часто не обращают внимания на контейнеры для раздельного сбора отходов. 

Машинное обучение в виртуальных пространствах

Вернемся к мультфильмам. Pixar приучила нас к богатой мимике персонажей и удивительной достоверности обстановки, в которой они действуют. Текстуры, цвета, преломление света — все это вызывает у нас доверие к происходящему на экране. Мы понимаем, как «синтезировать» стул, стол, колесо от машины и даже лицо.

Значит, мы можем оснастить «виртуальный учебный класс» для ИИ всеми этими объектами, научить распознавать их, познакомить с их свойствами (цветом, весом, размером, фактурой и т.п.) и дать возможность «поиграть» с ними: поменять колеса разных размеров на виртуальных автомобилях, пододвинуть миллион стульев к миллиону столов, причем столы и стулья будут различаться высотой ножек, формой спинок, свойствами материалов. Они будут двигаться по паркету, мрамору, линолеуму или другому покрытию. Лица будут  злорадно или радостно улыбаться, зло или печально хмуриться, выражать нетерпение…

И система научится интерпретировать эмоции и действовать с учетом этой информации. Но даже сегодня система распознавания лиц позволила Apple реализовать принципиально новый способ авторизации пользователя мобильного устройства.

Синтетические данные: границы области применения

Синтетические данные применить легко в том случае, если то, что мы хотим объяснить машине, «перпендикулярно» отличию между синтетическими данными и настоящими. Другими словами: мы узнаем бутылку колы и на фотографии, и на рисунке, и на полке в магазине. У нее характерная форма, уникальная этикетка, специфические цвет и размер. Если показать вам рисованный мультфильм с новой этикеткой колы, вы легко узнаете её в магазине — и искусственный интеллект тоже может с этим справиться.

Гораздо сложнее использовать синтетические данные для распознавания объектов, форму которых мы не можем предсказать заранее. Например, если мы распознаем раковые опухоли, то понять их характерную форму — это и есть большая часть задачи; а если ее не понять, то как сгенерировать синтетические данные?

Но можно попытаться взять большой массив реальных снимков, сделать синтетические заготовки (которые пока будут бесполезны для обучения системы диагностики), а затем применить порождающие модели (вид моделей искусственного интеллекта, которые могут не только, например, классифицировать породы собак по фотографиям, но и породить новую «фотографию» собаки нужной породы) для того, чтобы сделать «синтетические меланомы» более похожими на настоящие.

Так можно дополнить настоящие данные в тех случаях, когда их мало; в той же медицине так бывает сплошь и рядом. И тогда система сможет с высокой степенью достоверности распознавать прячущуюся опасность на разных стадиях. Над этой задачей сейчас бьются лучшие умы индустрии машинного обучения, и есть основания надеяться, что она будет успешно решена в обозримом будущем.

Практика применения синтетических данных

Кое-что мы уже можем применить на практике. Одна из наших лабораторий занимается исследованиями в области фармацевтики и биотехнологий. В ее задачи входит обучение ИИ распознаванию специфических изображений и глубокое обучение для улучшения медицинского обслуживания.

Например, совместно с компанией MonBaby мы разрабатываем интеллектуальную камеру, которая позволит интерпретировать состояние младенца по смене позы, изменению характера дыхания и т.п. Если поведение или состояние младенца выйдет за пределы нормы, в установленное на родительский смартфон приложение поступиит тревожный сигнал.

В 2016 году Frost & Sullivan опубликовали исследование, в котором оценивают рынок искусственного интеллекта в здравоохранении не менее 6,6 млрд. долларов США к 2021 году (по сравнению с 634 млн. долларов США в 2014 году). В отчете также отмечается, что использование ИИ при диагностике и шире в клинической практике позволило бы сократить расходы на лечение на 50 процентов, улучшая при этом результаты как минимум на 30–40 процентов.

За границами области применения

Есть, конечно, и бастионы, которые раз за разом отбивают атаки ученых. Например, мы не умеем генерировать текст на естественном языке; до того, чтобы пройти тест Тьюринга, моделям искусственного интеллекта ещё очень далеко. Здесь задача порождения гораздо сложнее, чем большинство задач, которые мы можем потом захотеть научиться решать, так что синтетические данные в обработке естественных языков применяются только в очень ограниченных контекстах.

Синтетические данные: взгляд со стороны бизнеса

Этот текст для вас тоже написали живые люди, которым очень хочется, чтобы вы по достоинству оценили реальные возможности современных интеллектуальных систем и задумались о том, как они могут усилить ваш бизнес уже сегодня.

Выгоды от внедрения интеллектуальных систем в 2018 году уже оценили 4% компаний, 21% планируют в самое ближайшее время начать экспериментировать с этими технологиями, а 25% бизнесов рассматривают возможность внедрения искусственного интеллекта (ИИ) в средне- и долгосрочной перспективе (см. доклад  Gartner «Прогноз: ценность искусственного интеллекта для бизнеса во всем мире в 2017 – 2025 годы» / «Forecast: The Business Value of Artificial Intelligence, Worldwide, 2017-2025).

Таким образом, около половины предприятий всерьез настроены внедрять ИИ в бизнес-практики. Однако этот процесс тормозится из-за того, что компании не в состоянии предоставить структурированные массивы данных, необходимые для обучения интеллектуальных систем.

Чтобы не отставать от конкурентов, важно своевременно проанализировать возможность синтезировать большие объемы данных, соответствующих специфике вашего бизнеса. И если такая возможность есть — ее нужно использовать. 

Читайте также: Синтетические данные: новая надежда искусственного интеллекта

Иллюстрации для материала предоставлены компанией Neuromation

Neuromation
Искусственный интеллект
машинное обучение
Нейросети
синтетические данные Источник

Disqus Comments Loading...
Share
Опубликовано
Elena Frolova

Recent Posts

Биткоин: где купить? Обзор некоторых платформ для покупки криптовалюты

С ростом цен все больше россиян интересуются биткоином. Но всемирное увлечение этим криптоактивом также привело…

07.12.2023

Cryptonica – лучший информационный портал о криптовалюте

В наше время криптовалюты стали неотъемлемой частью мировой экономики и финансов. Они предоставляют уникальные возможности…

24.11.2023

Прогноз курса Ethereum: опасения регулирующих органов по поводу будущего ETH стремительно растет

Виталий Бутерин, основатель Ethereum, имеет тесные связи с Wanxiang Group, китайской компанией, зависящей от правительства…

13.11.2023

Обмен юсдт на российские рубли

Обмен юсдт (Tether TRC20 USDT) на российские рубли (RUB) на карты РФ - это процесс…

05.10.2023

Выбор интернет-казино с минимальным депозитом и невысокими ставками

Каждый посетитель интернет-казино жаждет получить крупный выигрыш с наименьшими рисками. Для такой игры лучше всего…

30.08.2023

Алгоритм обмена криптовалюты в обменнике на примере epichange.online

Появление криптовалюты произвело революцию в цифровых активах, позволив частным лицам безопасно и легко обмениваться ценностями…

31.07.2023

Заявление управляющего Банка Англии о Bitcoin и стейблкоинах

Bitcoin и другая криптовалюта всегда вызывала противоречивые мнения у разных участников финансового сектора. Не исключением…

13.07.2023

Какие преимущества клиентам дает онлайн-сервис по подбору кредитов?

Рынок финансовых услуг России стабильно развивается. Каждый день компании предлагают новые программы финансирования для потенциальных…

12.07.2023

Кэш-память L3 в процессоре, что это значит и как отражается на быстродействии ноутбука/компьютера?

Кэш-память является одним из ключевых компонентов процессора, который играет важную роль в оптимизации производительности ноутбука…

10.07.2023

Риэлтор: отзывы о работе и особенности профессии

Для того чтобы стать успешным и востребованным риэлтором, нужно хорошо разбираться в объектах недвижимости и…

28.06.2023

Как технология блокчейн может повлиять на безработицу

По данным Организации Объединенных Наций, пандемия и связанная с ней нестабильная экономика приводят к росту…

23.06.2023

Оформить кредитную карту без отказа: критерии выбора продукта, обзор предложений

В последнее время банки активно предлагают различные программы финансирования граждан. Одним из удобных и технологичных…

19.06.2023

В чем особенность доверенного торгового счета

Доверенный торговый счет – это соглашение между трейдером и инвестором, в результате которого трейдер торгует…

06.06.2023

Рейтинг лучших ботов для торговли криптовалютой на бирже

Рейтинг лучших ботов для торговли криптовалютой на бирже может меняться со временем и зависит от…

23.05.2023

GRIN4: площадка для эффективного трейдинга

Криптовалюты уже давно стали отличным вариантом заработка. Волатильность рынка позволяет получать хороший доход. Поэтому трейдеры…

18.05.2023

Онлайн микрозаймы на карту: быстро, удобно и без лишних вопросов

В наше время деньги нужны всем и всегда. Но иногда бывают ситуации, когда они нужны…

17.04.2023

Что такое Aptos? Охота на миллиард пользователей

Aptos - это блокчейн L1, который стремится стать самым безопасным и масштабируемым блокчейном в истории.…

07.04.2023

Причины, по которым вам следует инвестировать в Ethereum

Ethereum является одной из самых перспективных криптовалют и в ближайшем будущем может отнять трон у…

18.03.2023

Дефи Криптовалюта: Очередное Поколение Валютных Революций

Дефи криптовалюта - это новый вид валюты, которая появилась на рынке в последние годы. Она…

14.03.2023

Покупать ноутбуки-трансформер или нет: собрали все преимущества и недостатки

Ноутбуки 2-в-1, также известные как конвертируемые ноутбуки — эти устройства давно стали отдельным сегментом в…

27.02.2023

WhiteBIT залучає до купівлі NFT Brave Legion задля активізації зборів на ЗСУ та гуманітарку

Найбільша криптовалютна біржа Європи з українським корінням — WhiteBIT — створила спеціальні умови для залучення…

14.02.2023