www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Генеративное глубокое обучение: давайте посмотрим, как ИИ расширяет, а не заменяет творческий процесс

Дата публикации Sep 15, 2018

«Технология не должна быть направлена ​​на то, чтобы заменить людей, а скорее усиливать человеческие возможности».

- Дуг Энгельбарт, изобретатель компьютерной мыши

На Web Summit 2017, крупнейшей в мире технологической конференции в Лиссабоне, Португалия. София, человекоподобный робот, работающий на искусственном интеллекте (AI), сказала«Мы возьмем вашу работу»а аудитория 60 000 мировых технологических лидеров просто нервно рассмеялась.

Веб Саммит 2017

До этого момента вы, наверное, все слышали о том, как достижения в области искусственного интеллекта наносят ущерб отраслям и создают угрозу безопасности рабочих мест для миллионов работников во всем мире. Рабочие места офисных служащих, администраторов, представителей обслуживания клиентов, аналитиков, маркетологов, врачей и адвокатов могут бытьзамененыИИ в следующем десятилетии. КакСундар ПичаиГенеральный директор Google сказал: «В ближайшие 10 лет мы перейдем к миру, в котором искусственный интеллект будет первым».

Но замена людей всегда была неуместна: искусственный интеллект - это не замена собственного интеллекта чем-то другим, а привнесение в нашу жизнь и работу.Большеинтеллект - интеллект разного рода. Во многих областях, но особенно вТВОРЧЕСКИЙИИ будут использоваться людьми как инструмент для расширения своих собственных возможностей: так что это будет больше похоже надополненнойинтеллект, чемискусственныйинтеллект.

В этой статье я предоставлю обзор высокого уровня того, как ИИ используется в настоящее время для расширения, а не для замены, творческого процесса посредством глубокого обучения.

В этом посте я расскажу, что такое генеративное глубокое обучение, что такое Discriminativeмодель и чем она отличается от Generativeмодель. Я даже приведу несколько конкретных примеров применения генеративного глубокого обучения, которое в дальнейшем поможет всем и каждому расширить свое понимание фантастических возможностей, которые эти Генеративные модели предлагают всем нам.

Итак, переведите свой мобильный телефон в беззвучный режим, выключите телевизор и начните.

Во время моей инженерии мой учитель каждый раз говорил, что нужно больше фокусироваться на основах, потому что именно они укрепят вашу базу по любому предмету, который вы читаете, поэтому здесь я прежде всего дам вам основную информацию о контролируемом обучении, обучении без учителя и тогда я открою дверь знаний о Генеративных моделях для всех вас, чтобы погрузиться в них.

Контролируемое обучениена сегодняшний день является наиболее доминирующей формой глубокого обучения сегодня, с широким спектром применения в промышленности. При контролируемом обучении у вас есть входная переменная (x) и выходная переменная (Y), и вы используете алгоритм для изучения функции отображения от входа к выходу.

Цель состоит в том, чтобы аппроксимировать функцию отображения так, чтобы при наличии новых входных данных (x) вы могли предсказать выходную переменную (Y) для этих данных.

Как правило, почти все приложения глубокого обучения, которые в настоящее время находятся в центре внимания, относятся к этой категории, такие как оптическое распознавание символов, распознавание речи, классификация изображений и языковой перевод.

* Раздел информации *: Если вы хотите увидеть, как с помощью tenorflow я сделал классификатор продуктов питания, просто нажмите на этоссылкаВо всяком случае, посмотрите видео для большей ясности.

Индийский пищевой классификатор

Хотя контролируемое обучение в основном состоит из классификации и регрессии, есть и другие привлекательные варианты, включая следующие:

  • Сегментация изображения. Для данного изображения нарисуйте маску на уровне пикселей на определенном объекте.
  • Обнаружение объекта - Для данного изображения нарисуйте ограничивающий прямоугольник вокруг определенных объектов внутри изображения, если вы хотите узнать больше об обнаружении объектов, просто прочитайте этостатья(конечно, я тоже написал это :)), но не забудьте проверить видео ниже.
Обнаружение объекта

Неконтролируемое обучениеэто еще одна ветвь глубокого обучения, которая состоит в нахождении интересных преобразований входных данных без помощи каких-либо целей, с целью визуализации данных, сжатия данных или шумоподавления данных или для лучшего понимания корреляций, присутствующих в данных под рукой , Многие специалисты по машинному обучению говорят, что неконтролируемое обучение - это суть аналитики данных, и часто необходимо сделать шаг к лучшему пониманию набора данных, прежде чем пытаться решить проблему контролируемого обучения.

Изображение предоставлено:Неконтролируемое обучение

Уменьшение размерностиа такжекластеризацияЭто очень известные категории обучения без учителя, прочитайте о них, перейдя по ссылкам, чтобы укрепить ваше понимание этой области машинного обучения.

Теперь пришло время поговорить о герое этой статьи, т.е. «Генеративная модель». Генеративная модель - это класс моделей для обучения без учителя, где с учетом данных обучения наша цель состоит в том, чтобы попытаться сгенерировать новые выборки из того же распределения

Изображение предоставлено: cs231n 2017, лекционные заметки

Для обучения генеративной модели мы сначала собираем большой объем данных в некоторой области (например, думаем о миллионах изображений, предложений или звуков и т. Д.), А затем обучаем модель генерировать подобные данные.

Хитрость заключается в том, что нейронные сети, которые мы используем в качестве генеративных моделей, имеют ряд параметров, значительно меньших, чем объем данных, на которых мы их обучаем, поэтому модели вынуждены обнаруживать и эффективно усваивать сущность данных для их генерации.

Генеративные модели имеют много краткосрочных приложений. Но в конечном итоге они обладают потенциалом для автоматического изучения естественных особенностей набора данных, будь то категории или измерения или что-то еще полностью.

Хорошо, что много литературы, давайте теперь немного поговорим о формализме.

Принципиальная разница между Dдискриминационные моделии Gобразные моделиявляется:

Дискриминационные моделиизучать(жесткая или мягкая) границамежду классами

Генеративные моделисмоделироватьраспределениеиндивидуальных занятий

Генеративная модель - это та,которые могут генерировать данные, Он моделирует как особенности, так и класс (то есть полные данные).

Если мы моделируемP(x,y): Я могу использовать это распределение вероятностей для генерации точек данных - и, следовательно, все алгоритмы моделированияP(x,y)являются генеративными.

например, генеративных моделей

  • Наивные байесовские моделиP(c)а такжеP(d|c)- гдеcэто класс иdвектор признаков
  • Также,P(c,d) = P(c) * P(d|c)
  • Следовательно, Наивный Байес в некоторых моделях формы,P(c,d)
  • Байес Нет

Дискриминационная модель - это та, которая может быть использована только дляразличать / классифицировать точки данных, Вам требуется только модельP(y|x)в таких случаях (то есть вероятность класса, заданного вектором признаков).

примеры дискриминационных моделей:

  • логистическая регрессия
  • Нейронные сети

Проще говоря: Gдоходная модельмодель условной вероятности наблюдаемойИксзаданная цель y, символически, P (X | Y = y), в то время как Dдискриминационная модельмодель условной вероятности целиYпри условии наблюдения x символически P (Y | X = x).

Итак, все основные аспекты, все технические термины объяснены, теперь пришло время обратить ваше внимание на применение Генеративных моделей и задуматься, как ИИ будет и помогает нам «Людям» быть более креативными.

Я знаю, что вы, наверное, догадаетесь, что теперь, как и все остальные, этот автор тоже расскажет о неявных моделях, таких какГенеративные состязательные сети(Gans)и явные глубокие авторегрессионные модели, такие какPixelCNNили даже он мог бы также объяснить глубоко скрытые переменные модели, такие какВариационные АвтоЭнкодерыНо вы все не правы, поэтому просто расслабьтесь, успокойте свой мозг и наслаждайтесь тем, что вы собираетесь прочитать.

Теперь, в последней части этого поста, я познакомлю вас всех с проектом «фуксин»,фуксинЭто исследовательский проект, исследующий роль машинного обучения в процессе создания искусства и музыки.

В первую очередь это связано с разработкой новых алгоритмов глубокого обучения и подкрепления для создания песен, изображений, рисунков и других материалов. Но это также исследование создания интеллектуальных инструментов и интерфейсов, которые позволяют художникам и музыкантам расширять (а не заменять!) Свои процессы, используя эти модели. Пурпурный был создан некоторыми исследователями и инженерами изКоманда Google Brainно многие другие внесли значительный вклад в проект.

Итак, первая модель, которая является моей личной любимойЭскиз-РННГенеративная модель для векторных рисунков, которая представляет собой рекуррентную нейронную сеть (RNN), способную создавать основанные на штрихах рисунки общих объектов. Модель обучена на наборе данных нарисованных человеком изображений, представляющих много различных классов. Автор очерчивает структуру для создания условных и безусловных эскизов и описывает новые надежные методы обучения для генерации последовательных эскизов в векторном формате.

В демо-версии справа ниже посмотрите на позы йоги, порожденные перемещением через выученное представление (скрытое пространство) модели, обученной на рисунках йоги. Обратите внимание, как он запутывается примерно через 10 секунд, когда он движется от поз, стоящих к позам, выполненным на коврике для йоги.

Эскиз-РНН

Вторая модель посвящена меломану по имениMusicVAE.Когда художник создает произведение искусства, он сначала смешивает и исследует варианты цвета в палитре художника, а затем применяет их к холсту. Этот процесс сам по себе является творческим актом и оказывает глубокое влияние на окончательную работу.

Музыканты и композиторы в основном испытывали недостаток в подобном устройстве для исследования и микширования музыкальных идей, но теперь MusicVAE, который является моделью машинного обучения, позволяет им создавать палитры для смешивания и исследования музыкальных партитур. Демо прямо там внизу

MusicVAE

Я выставил всех вас только двум из множества моделей, которые были построены в рамках проектафуксини к этому времени вы все должны были испытать, как ИИ может помочь нам в расширении, не заменяя наш творческий процесс. Чтобы узнать больше об этих порождающих моделях, изучите указатели в справочном разделе.

ССЫЛКИ:

  1. «Нейронное представление эскизовБумага на Скетч-РНН.
  2. «Иерархическая модель скрытого вектора для изучения долгосрочной структуры в музыкеБумага на MusicVAE.
  3. Нарисуйте вместе с нейронной сетьюБлог Google AI.
  4. MusicVAE: создание палитры для музыкальных партитур с помощью машинного обученияБлог Google AI.
  5. Для получения дополнительной информации займитесь этимвидеоотДуглас Эк(Главный научный сотрудник Google Brain Team. Ведущий наhttp://g.co/magenta.)

Спасибо за внимание

Вы используетевашвремя читатьмойработа значит мир для меня. Я полностью это имею в виду.

Если вам понравилась эта история, сходите с ума отаплодируют (👏)кнопка! Это поможет другим людям найти мою работу.

Кроме того, следуйте за мной на Medium, LinkedIn или Twitter, если хотите! Мне бы понравилось это.

Навин Манвани - Средний

Читайте письмо от Навина Манвани на Среднем. Инженер машинного обучения, энтузиаст глубокого обучения |

Навин Манвани - инженер по машинному обучению - AIMonk Labs Private Ltd | LinkedIn

Посмотреть профиль Naveen Manwani в LinkedIn, крупнейшем в мире профессиональном сообществе. У Навина есть 1 работа, перечисленная в их…

www.linkedin.com

Навин Манвани (@ NaveenManwani17) | щебет

Последние твиты от Навина Мануани (@ NaveenManwani17). Инженер электроники и связи, глубокое обучение и…

twitter.com

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map