Директор по науке Neuromation Сергей Николенко и основатель и директор по маркетингу TechComLab Илья Стечкин подготовили для TechFusion.ru подробный материал о том, зачем искусственному интеллекту смотреть мультфильмы и чем могут помочь бизнесу синтетические данные.
Синтетические данные — это, в первую очередь, рисунки (2D- и 3D-модели) и виртуальные среды, в которых возможно взаимодействие с ними. Взаимодействие с нарисованным объектом дает реальный опыт, необходимый для обучения ИИ, примерно как в тренажерах-симуляторах. Например, в третьей части мультфильма «Тачки» главный герой стремится попасть на такой тренажер, рассчитывая (и не без оснований), что тот поможет лучше изучить тактику соперника и особенности гоночных трасс. Робот из мультфильма пытается использовать мультфильм для роботов внутри мультфильма про роботов… воистину, we need to go deeper.
Не только гонщики, но и летчики вовсю используют виртуальные среды для получения более дешевого опыта, ведь реальные полетные часы стоят очень дорого. А человеческая жизнь — бесценна, поэтому врачи проходят практику, производя операции на специально сконструированных роботах. Вот и искусственный интеллект сегодня также способен к обучению на моделях, функционирующих в виртуальных средах.
Что общего у всех примеров, которые мы привели выше? Они рассчитаны на получение больших объемов визуальной информации. Так и синтетические данные лучше всего подходят для совершенствования технологий компьютерного зрения. Например, для роботов, которые должны уметь перемещаться по производственным или жилым помещениям, необходимы наборы данных (датасеты) интерьеров.
В идеале — это трехмерные среды с описанными свойствами объектов (твердый/мягкий, подвижный/неподвижный, хрупкий/прочный и т.п.), которые позволяют осуществлять обучение с подкреплением, то есть давать системе опыт интерактивного взаимодействия с объектами, активных действий в окружающей среде, а не только навык их «узнавания» по картинкам или видео.
Хотя сам по себе навык узнавания тоже весьма востребован бизнесом. Например, если интеллектуальная система торговой сети умеет распознавать те или иные товары на полках, это дает возможность поставщикам отказаться от услуг супервайзеров и существенно снизить расходы на мерчандайзинг.
Распознавание лиц позволит не только просчитать возможную угрозу со стороны того или иного человека, но также использовать ИИ для контроля явки сотрудника на рабочее место или даже как инструмент контроля качества. Предположим, сотрудник кредитного отдела банка общается с клиентом. Параллельно система анализирует мимику клиента, выявляя и фиксируя неприятные моменты беседы. Обрабатывая контрольную запись разговора, сотрудник отдела качества обслуживания получит от системы уведомление о том, на какие именно фрагменты беседы (с точностью до секунды) стоит обратить внимание. Эффективность работы отдела контроля качества, а значит, и кредитного отдела, существенно возрастет.
Навык распознавания объектов хорошо тренируется с помощью синтетических данных.
Если говорить о распознавании объектов и автоматизации действий, связанных с корректным распознаванием, то первое, что приходит на ум, — это сборочные цеха. Номенклатура деталей всегда ограничена. А значит, сравнительно просто обучить систему «узнавать» ту или иную деталь и давать команду на определенное действие с нею.
Более сложный пример — линии упаковочные. Число наименований и свойств товаров, подлежащих упаковке, может быть весьма велико, но, опять же, всегда конечно и известно заранее.
Наконец, похожий механизм может сработать и для задачи, обратной упаковке и сборке — утилизации. Например, интеллектуальные системы сортировки мусора могут существенно повысить качество переработки, а значит, их массовое внедрение позволит заметно уменьшить ущерб, наносимый окружающей среде, и компенсировать безразличие людей, которые часто не обращают внимания на контейнеры для раздельного сбора отходов.
Вернемся к мультфильмам. Pixar приучила нас к богатой мимике персонажей и удивительной достоверности обстановки, в которой они действуют. Текстуры, цвета, преломление света — все это вызывает у нас доверие к происходящему на экране. Мы понимаем, как «синтезировать» стул, стол, колесо от машины и даже лицо.
Значит, мы можем оснастить «виртуальный учебный класс» для ИИ всеми этими объектами, научить распознавать их, познакомить с их свойствами (цветом, весом, размером, фактурой и т.п.) и дать возможность «поиграть» с ними: поменять колеса разных размеров на виртуальных автомобилях, пододвинуть миллион стульев к миллиону столов, причем столы и стулья будут различаться высотой ножек, формой спинок, свойствами материалов. Они будут двигаться по паркету, мрамору, линолеуму или другому покрытию. Лица будут злорадно или радостно улыбаться, зло или печально хмуриться, выражать нетерпение…
И система научится интерпретировать эмоции и действовать с учетом этой информации. Но даже сегодня система распознавания лиц позволила Apple реализовать принципиально новый способ авторизации пользователя мобильного устройства.
Синтетические данные применить легко в том случае, если то, что мы хотим объяснить машине, «перпендикулярно» отличию между синтетическими данными и настоящими. Другими словами: мы узнаем бутылку колы и на фотографии, и на рисунке, и на полке в магазине. У нее характерная форма, уникальная этикетка, специфические цвет и размер. Если показать вам рисованный мультфильм с новой этикеткой колы, вы легко узнаете её в магазине — и искусственный интеллект тоже может с этим справиться.
Гораздо сложнее использовать синтетические данные для распознавания объектов, форму которых мы не можем предсказать заранее. Например, если мы распознаем раковые опухоли, то понять их характерную форму — это и есть большая часть задачи; а если ее не понять, то как сгенерировать синтетические данные?
Но можно попытаться взять большой массив реальных снимков, сделать синтетические заготовки (которые пока будут бесполезны для обучения системы диагностики), а затем применить порождающие модели (вид моделей искусственного интеллекта, которые могут не только, например, классифицировать породы собак по фотографиям, но и породить новую «фотографию» собаки нужной породы) для того, чтобы сделать «синтетические меланомы» более похожими на настоящие.
Так можно дополнить настоящие данные в тех случаях, когда их мало; в той же медицине так бывает сплошь и рядом. И тогда система сможет с высокой степенью достоверности распознавать прячущуюся опасность на разных стадиях. Над этой задачей сейчас бьются лучшие умы индустрии машинного обучения, и есть основания надеяться, что она будет успешно решена в обозримом будущем.
Кое-что мы уже можем применить на практике. Одна из наших лабораторий занимается исследованиями в области фармацевтики и биотехнологий. В ее задачи входит обучение ИИ распознаванию специфических изображений и глубокое обучение для улучшения медицинского обслуживания.
Например, совместно с компанией MonBaby мы разрабатываем интеллектуальную камеру, которая позволит интерпретировать состояние младенца по смене позы, изменению характера дыхания и т.п. Если поведение или состояние младенца выйдет за пределы нормы, в установленное на родительский смартфон приложение поступиит тревожный сигнал.
В 2016 году Frost & Sullivan опубликовали исследование, в котором оценивают рынок искусственного интеллекта в здравоохранении не менее 6,6 млрд. долларов США к 2021 году (по сравнению с 634 млн. долларов США в 2014 году). В отчете также отмечается, что использование ИИ при диагностике и шире в клинической практике позволило бы сократить расходы на лечение на 50 процентов, улучшая при этом результаты как минимум на 30–40 процентов.
Есть, конечно, и бастионы, которые раз за разом отбивают атаки ученых. Например, мы не умеем генерировать текст на естественном языке; до того, чтобы пройти тест Тьюринга, моделям искусственного интеллекта ещё очень далеко. Здесь задача порождения гораздо сложнее, чем большинство задач, которые мы можем потом захотеть научиться решать, так что синтетические данные в обработке естественных языков применяются только в очень ограниченных контекстах.
Этот текст для вас тоже написали живые люди, которым очень хочется, чтобы вы по достоинству оценили реальные возможности современных интеллектуальных систем и задумались о том, как они могут усилить ваш бизнес уже сегодня.
Выгоды от внедрения интеллектуальных систем в 2018 году уже оценили 4% компаний, 21% планируют в самое ближайшее время начать экспериментировать с этими технологиями, а 25% бизнесов рассматривают возможность внедрения искусственного интеллекта (ИИ) в средне- и долгосрочной перспективе (см. доклад Gartner «Прогноз: ценность искусственного интеллекта для бизнеса во всем мире в 2017 – 2025 годы» / «Forecast: The Business Value of Artificial Intelligence, Worldwide, 2017-2025).
Таким образом, около половины предприятий всерьез настроены внедрять ИИ в бизнес-практики. Однако этот процесс тормозится из-за того, что компании не в состоянии предоставить структурированные массивы данных, необходимые для обучения интеллектуальных систем.
Чтобы не отставать от конкурентов, важно своевременно проанализировать возможность синтезировать большие объемы данных, соответствующих специфике вашего бизнеса. И если такая возможность есть — ее нужно использовать.
Читайте также: Синтетические данные: новая надежда искусственного интеллекта
Neuromation
Искусственный интеллект
машинное обучение
Нейросети
синтетические данные Источник
С ростом цен все больше россиян интересуются биткоином. Но всемирное увлечение этим криптоактивом также привело…
В наше время криптовалюты стали неотъемлемой частью мировой экономики и финансов. Они предоставляют уникальные возможности…
Виталий Бутерин, основатель Ethereum, имеет тесные связи с Wanxiang Group, китайской компанией, зависящей от правительства…
Обмен юсдт (Tether TRC20 USDT) на российские рубли (RUB) на карты РФ - это процесс…
Каждый посетитель интернет-казино жаждет получить крупный выигрыш с наименьшими рисками. Для такой игры лучше всего…
Появление криптовалюты произвело революцию в цифровых активах, позволив частным лицам безопасно и легко обмениваться ценностями…
Bitcoin и другая криптовалюта всегда вызывала противоречивые мнения у разных участников финансового сектора. Не исключением…
Рынок финансовых услуг России стабильно развивается. Каждый день компании предлагают новые программы финансирования для потенциальных…
Кэш-память является одним из ключевых компонентов процессора, который играет важную роль в оптимизации производительности ноутбука…
Для того чтобы стать успешным и востребованным риэлтором, нужно хорошо разбираться в объектах недвижимости и…
По данным Организации Объединенных Наций, пандемия и связанная с ней нестабильная экономика приводят к росту…
В последнее время банки активно предлагают различные программы финансирования граждан. Одним из удобных и технологичных…
Доверенный торговый счет – это соглашение между трейдером и инвестором, в результате которого трейдер торгует…
Рейтинг лучших ботов для торговли криптовалютой на бирже может меняться со временем и зависит от…
Криптовалюты уже давно стали отличным вариантом заработка. Волатильность рынка позволяет получать хороший доход. Поэтому трейдеры…
В наше время деньги нужны всем и всегда. Но иногда бывают ситуации, когда они нужны…
Aptos - это блокчейн L1, который стремится стать самым безопасным и масштабируемым блокчейном в истории.…
Ethereum является одной из самых перспективных криптовалют и в ближайшем будущем может отнять трон у…
Дефи криптовалюта - это новый вид валюты, которая появилась на рынке в последние годы. Она…
Ноутбуки 2-в-1, также известные как конвертируемые ноутбуки — эти устройства давно стали отдельным сегментом в…
Найбільша криптовалютна біржа Європи з українським корінням — WhiteBIT — створила спеціальні умови для залучення…