www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home
Занимательная история, выдающиеся люди, малоизвестные факты, находки, открытия, фальсификации. Присоединяйся!

Машинное обучение с нуля: часть 1

Дата публикации Feb 19, 2018

Оглавление


Это первая статья в новой серии о машинном обучении. Каждая статья будет основана на пяти основных принципах:

  1. Главная цель, которую я ставлю перед собой, - дать читателю глубокое понимание основ прикладного машинного обучения. Если вы хотите создать прочную основу для анализа последствий использования искусственного интеллекта для вашей отрасли и вашей личной жизни, то эта серия для вас.
  2. План состоит в том, чтобы охватить наиболее успешные модели машинного обучения, а также некоторые из последних подтвержденных тенденций исследований. Я не буду обсуждать какие-либо подходы, которые либо не смогли набрать силу, ни какие-либо спекулятивные идеи, которые еще не получили эмпирической поддержки.
  3. Материал самодостаточен и развивает основы прикладного машинного обучения по одному шагу за раз. Сказать, что математика в школе является обязательным условием, было бы преувеличением. Некоторые статьи будут охватывать такие основные темы, как множества, производные и линейные модели.
  4. Каждая концепция будет объяснена по крайней мере одним примером. Я думаю, что одна из наиболее эффективных стратегий подхода к абстрактной теме - это перевести ее на простой случай, конкретизировать его на ярких примерах и, наконец, восстановить общую картину. Когда это кажется полезным, текст будет дополнен визуальными элементами.
  5. Все остальное подлежит обратной связи, экспериментам и обучению. Я приветствую вопросы и конструктивные отзывы в любое время!

Давайте начнем.


Что такое машинное обучение?

Машинное обучение использует компьютеры для прогнозирования неизвестных атрибутов объекта путем распознавания закономерностей в данных.

Наиболее важной причиной роста машинного обучения является его успех в широком спектре областей, включая изображения, звук, видео, текст, программный код, столкновения частиц, химические дескрипторы, ДНК, социальные сети и финансовые данные.

Интересно, что количество строительных блоков, составляющих большинство систем машинного обучения, меньше, чем можно себе представить. Это особенно верно для многих глубоких нейронных сетей, которые будут подробно описаны в последующих эпизодах.

Другими словами, мы можем объединить небольшое количество базовых элементов в системы, которые могут иметь огромное значение для таких разнообразных приложений, как классификация изображений, ответы на вопросы и синтез речи с естественным звучанием.

Хотя машинное обучение может применяться во многих различных областях, большинство производственных систем оптимизированы для одной цели и обрабатывают объекты одного конкретного типа.

Системы компьютерного зрения, например, специализируются на задачах, связанных с изображениями или видео, таких как распознавание дорожных знаков [1] и классификация медицинских изображений [2].


Объекты

Поскольку машинное обучение имеет дело с неизвестными атрибутами объекта, естественной отправной точкой является разговор об объектах.

Для целей этого урока,объектэто все, что имеет атрибуты.

Я обещал, что сделаю абстрактные понятия конкретными и использую визуальные эффекты там, где это кажется уместным. Вот фотография, которая показывает три примерных объекта (желания):

Рис. 1: ИзображениеРаван Хуссейн

Среди других атрибутов у каждого из этих шариков мороженого есть характерный вкус, диапазон цветов, в которых он представлен, определенный уровень популярности, цена, за которую он продает, и т. Д.

(Атрибут, которым обладают три-три шарика мороженого, заключается в том, что они имеют более интересные свойства, чем вафельный рожок.)

Атрибуты

атрибутэто то, что характеризует объект.

Позвольте мне предупредить вас заранее. Я люблю концептуальные деревья. Следовательно, вы увидите много из них в течение этой серии. Вот первый:

Рис. 2

На высоком уровне мы можем различать измеренные атрибуты и неизмеренные атрибуты.

Многие атрибуты измеримы. Простые примеры включают вес ложки мороженого и цену, по которой единица продается в определенном месте и времени. Из измеримых атрибутов только часть будет фактически измерена как часть действий по сбору данных во время проекта.

Другие атрибуты не будут измеряться, потому что они либо не имеют значения, за пределами нашего текущего понимания или за пределами нашего бюджета. Предположительно, мозг обладает свойствами, которые мы могли бы измерить, чтобы создать совершенно новый вкус мороженого. На практике, однако, такие усилия ограничены нашим несовершенным пониманием того, как мозг генерирует субъективный опыт дегустации вкусного мороженого, и ценой, установленной на необходимое сканирующее оборудование.

Измеренные атрибуты

Давайте далее разбить измеренные атрибуты на два подтипа:

  • Цели
  • особенности

цельэто атрибут, который нам небезразличен и который мы хотели бы предсказать.

Некоторые из терминов, которые в значительной степени являются синонимамизависимая переменная,ненаблюдаемая переменная,объясненная переменная,выходная переменнаяа такжеизмерение результатов,

[Следует отметить, что некоторые понятия, используемые в машинном обучении, известны под другими именами в других сообществах. Во многих отношениях машинное обучение является потомком статистики, и между этими двумя областями существует сильное совпадение. Следовательно, вы можете столкнуться с вариантами, которые популярны среди статистиков, когда вы углубляетесь в литературу.

Я упомяну некоторые часто используемые синонимы, когда вводится новый термин, а затем последовательно использую вариант, который наиболее популярен в сообществе машинного обучения и лучше всего соответствует общей картине.]

Часто целью являетсяизвестендля некоторых объектов инеизвестныйдля других. Например, нам может потребоваться предсказать неизвестные будущие показатели продаж для продукта, частично основанные на известных исторических показателях продаж.

особенностиявляются атрибутами, которые (потенциально) связаны с целью.

Например, цена товара связана со спросом на товар. Эти отношения могут быть сильными или слабыми в зависимости от обстоятельств [3], но цена, безусловно, является одной из первых особенностей, которые должны прийти на ум.

В других сообществах функции часто называютнезависимые переменные,наблюдаемые переменные,объясняющие переменныеа такжевходные переменные,

Значения атрибута

значение атрибутаэто значение атрибута относительно конкретного объекта.

Если целью являются цифры продаж за следующий квартал, примеромцелевое значениеможет быть 8000 единиц.

По аналогии с целями мы можем использовать терминзначение функциидля ссылки на значение конкретной функции в отношении конкретного объекта. Значение функции цены в долларах США может составлять 99,99.

Распознавание образов

Машинное обучение основано на предпосылке, что существуют связи между функциями и целями, которые повторяются предсказуемым образом. Давайте обратимся к этим отношениям какузоры,

Если бы мы жили в мире без шаблонов, для машинного обучения не было бы никакой пользы, и этот учебник не был бы ни написан, ни прочитан. К счастью, вселенная, в которой мы находимся, очень структурирована. Успех эмпирической науки [4] свидетельствует о том, что закономерности существуют и их можно обнаружить.

В недалеком прошлом геркулесовские усилия были предприняты для разработки функций для конкретных задач. Например, есть большая литература по функциям, которые были разработаны для определенных проблем компьютерного зрения, таких как способность роботов распознавать объекты в комнате. [5]

За последнее десятилетие прогресс в машинном обучении позволил в некоторой степени автоматизировать поиск функций. [6]

Пример из компьютерного зрения

Чтобы завершить эту статью, давайте рассмотрим конкретный пример, чтобы лучше понять взаимосвязь между функциями и целями.

Рис. 3: Фото автораПатрик Берри/ CC BY-SA 2.0

Предположим, вы только начали работать над системой с целью автоматического распознавания животных на фотографиях.

Фотография выше имеет атрибут, показывающий мать орангутана и ее ребенка, и этот факт очевиден для нас.

Однако для системы компьютерного зрения это далеко не очевидно. В начале разработки у него не было никаких знаний об орангутангах, матерях или детях.

Прежде чем я опишу, что мы можем сделать, чтобы изменить это, я хотел бы задать вам вопрос.

Кактырешить эту задачу? То есть как вы понимаете, что на фото выше изображены два орангутана?

Человеческое зрение (и зрение приматов в целом) настолько эффективно и происходит с таким небольшим сознательным усилием, что может потребоваться некоторое время, чтобы найти точный и убедительный ответ.

Я бы посоветовал вам остановиться и подумать об этом. При этом вы можете предвидеть некоторые идеи, описанные ниже, и в конечном итоге понять, что, по крайней мере, некоторые формы машинного обучения более интуитивны, чем могут показаться.


Отчасти ответ заключается в том, что мы видели похожие фотографии орангутанов в прошлом.

В некоторых случаях нам были представлены соответствующие изображения, но без особого описания или контекста. Например, мы могли кратко увидеть этих великих обезьян во время просмотра телеканалов или прокрутки нашего фида в Facebook.

В других случаях изображения орангутанов были представлены вместе с определенной информацией, которая позволила нам легко распознать закономерности. Это могло быть во время документальных фильмов, посещений зоопарка, школьных уроков или других возможностей обучения.

Один из этих паттернов заключается в том, что у орангутангов волосы оранжево-красновато-коричневые Наличие этой характерной особенности делает многие другие возможности значительно менее вероятными.

Другим важным аспектом является их полусинтетический образ жизни. Помимо сильных связей между матерью и младенцем, орангутанги обычно встречаются в одиночку. При прочих равных условиях присутствие множества людей на одной фотографии может быть признаком отсутствия орангутанов.

Еще один источник информации, на который мы можем обратить внимание - это фон. Как крупнейшие животные, обитающие в деревьях, орангутанги часто появляются на фотографиях, которые показывают навес леса, в котором они живут.

Это интуитивно понятный отчет о некоторых высокоуровневых функциях, которые мы могли бы использовать для обнаружения наших эволюционных родственников на изображениях. В последующих уроках будет описано, как модели машинного обучения изучают иерархию функций для классификации изображений. Примечательно, что некоторые из этих функций легко интерпретируются и имеют степень сходства с теми, которые используются в видении приматов.

Контролируемое машинное обучение

Рабочий процесс сбора соответствующих данных и распознавания шаблонов для генерации прогнозов является сущностью того, что называетсяконтролируемое (машинное) обучение, При этой настройке целевые значения (например, наличие отсутствия определенного содержимого) известны для некоторых объектов (например, изображений) и неизвестны для других.

В контексте компьютерного зрения мы, учителя, показываем образы ученика (компьютер / робот), даем краткое описание контента, подчеркиваем определенные функции и выбираем стратегии, которые помогают учащемуся «видеть» закономерности в данных.

С некоторыми корректировками один и тот же процесс можно использовать во многих различных областях, которые были упомянуты с самого начала, от текста и звука до химических структур и социальных сетей.

Мы постепенно сделаем эту интуицию точной и интегрируем ее в сеть концепций, которые позволят вам понять приложения машинного обучения.


Основное внимание в этой статье было уделено атрибутам, шаблонам и компьютерному зрению.Часть 2смотрит на коллекции данных, используя примеры из обработки естественного языка.

Спасибо за чтение! Если вам понравилась эта статья, нажмите кнопку хлопка и следуйте за мной, чтобы получить следующие статьи из этой серии.


Ссылки

[1] CireşAn, D., Meier, U., Masci, J. and Schmidhuber, J., 2012. Многоколоночная глубокая нейронная сеть для классификации дорожных знаков.Нейронные сети,32, с.333–338.

[2] Эстева А., Купрел Б., Новоа Р.А., Ко Дж., Светтер С.М. Блау Н.М. и Thrun S., 2017. Дерматологическая классификация рака кожи с глубокими нейронными сетями.Природа,542(7639), с.115.

[3]https://en.wikipedia.org/wiki/Price_elasticity_of_demand

[4]https://en.wikipedia.org/wiki/List_of_equations

[5] Лоу, Д.Г., 1999. Распознавание объектов по локальным масштабно-инвариантным признакам. ВКомпьютерное зрение, 1999. Материалы седьмой международной конференции IEEE по(Том 2, с. 1150–1157). IEEE.

[6] Крижевский А., Суцкевер И., Хинтон Г.Е., 2012. Классификация Imagenet с глубокими сверточными нейронными сетями. ВДостижения в нейронных системах обработки информации(стр. 1097–1105).

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map