www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Учебник для машинного обучения: почти без математики - часть 1

Дата публикации Sep 25, 2018

Введение в курсы машинного обучения всегда начинается с большого количества математического контента, который, как правило, пугает начинающих и отталкивает их от него. Здесь я попытаюсь перейти к некоторым важным концепциям машинного обучения, за исключением математики, ну почти. Я также постараюсь приложить к каждому из терминов несколько простых примеров. Большинство рассматриваемых здесь концепций будут связаны с контролируемым обучением и прогнозным моделированием.

Все объяснения, обсуждаемые здесь, разбавлены версиями реальных концепций. Если вы заинтригованы этим, я настоятельно рекомендую вернуться к математике, чтобы узнать больше!


(Машинное обучение

Говорят, что компьютерная программа учится на опытеЕпо отношению к некоторому классу задачTи показатель эффективностипесли его выполнение при задачах вTизмеряетсяп, улучшается с опытомЕ, Том Митчелл

Модель машинного обучения

Модели машинного обучения могут рассматриваться как математическое (или иногда архитектурное) представление системы машинного обучения, включая, помимо прочего, представление входных и выходных данных, алгоритм, участвующий в обучении, параметры, которые определяют процесс обучения и архитектура модели.

Население

Совокупность всех возможных примеров, относящихся к рассматриваемому эксперименту. Это то, что модели машинного обучения пытаются предсказать, распределение целевого населения.

Пространство объектов (вход)

Пространство признаков - это пространство ввода модели, в котором находятся переменные (кроме целевой переменной, которую мы хотим предсказать). Особенности могут быть числовыми или категориальными. Например, вес и скорость автомобиля являются числовыми характеристиками. Является ли автомобиль Шевроле или Теслой, это категорическая особенность.

Если вы описываете набор автомобилей, используя их цвет, скорость, марку и модель, тогда все возможные значения этих атрибутов образуют пространство признаков.

Особенность Вектор X

Каждая запись в пространстве признаков называется n-мерным вектором объектов, где n - это число объектов, которые определяют конкретную точку данных.

Если бы вы определили автомобиль, используя некоторые его функции, список объектов сформировал бы вектор объектов. Например: [Оранжевый цвет, 280 миль в час, 2800 фунтов] - это трехмерный вектор объектов с 3 характеристиками, цветом, скоростью и весом.

Пространство меток (выход)

Набор меток или целевых переменных, связанных с каждым из векторов объектов, составляет пространство меток.

Могут быть разные автомобили Mustang GT, Roadster, Camaro и т. Д. Все это обозначения для набора функций, которые их определяют.

Истинный ярлык у

Это фактическая метка, связанная с одной конкретной точкой данных.

пример

Примером является точка данных, включающая элементы и метку. Примеры, имеющиеся в наборе данных, могут не полностью исчерпать распределение данных.

Родстер [оранжевый цвет, 280 миль в час, 2800 фунтов] является одним примером из набора данных. Если у нас есть набор данных из 100 автомобилей, принадлежащих только одной компании, это не означает, что мы можем делать прогнозы относительно автомобилей других компаний, поскольку они могут иметь совершенно другое распределение данных. Было бы очень сложно делать прогнозы относительно автомобилей Ford на основе данных автомобилей Tesla.

Предсказанный ярлык у ^

Это метка, предсказанная для данного вектора признаков моделью машинного обучения. Это может или не может быть правильно.

Вектор [Оранжевый цвет, 280 миль в час, 2800 фунтов] можно предсказать как родстер или оранжевый пляжный багги.

Обучающий набор

Набор примеров, которые используются для обучения модели машинного обучения.

Валидация установлена

Это подмножество обучающего набора (или иногда отдельное от обучающего набора), которое используется для проверки текущего состояния модели в процессе обучения. Это напрямую не способствует обучению модели. Набор валидации можно использовать для обучения параметров модели или предоставления метрики оценки для модели.

Тестовый набор

Набор точек данных, которые недоступны для модели, если она не была обучена. Он используется для проверки обученного состояния модели.

Различаются данные

классификация

Классификационные модели - это модели, которые классифицируют или классифицируют данные на 2 (двоичный классификатор) или более (многоклассифицирующий классификатор) классов.

Мы попытаемся понять, как модель учится, используя небольшой набор данных:

Давайте построим этот набор данных так, чтобы каждая ось представляла одно из значений объектов:

Теперь отметим данные метки на точках:

Если мы попытаемся разделить два класса, используя прямые линии, теоретически могут быть бесконечные возможные линии:

Если мы добавим еще одну точку, количество возможных строк уменьшится:

добавив больше очков ..

и больше.

Теперь, если нам дается новая точка из того же распределения данных, мы знаем, где классифицировать эту точку на основе нашей синей линии. Эта синяя линия - гипотеза, полученная из обученной модели.

Мы все еще не можем быть уверены, является ли наша синяя линия фактическим представлением линии, разделяющей исходное население. Рассмотрим следующую строку, это также разделяет два класса точек.

Если мы получим доступ к еще большему количеству точек, линия может фактически изменить свою позицию. Вот почему вы, возможно, всегда слышали: больше данных в машинном обучении обычно дает лучшие результаты.

регрессия

Простая линейная регрессия - это линейный подход к моделированию взаимосвязи между скалярной меткой и одним или несколькими пояснительными признаками. Обычно регрессионные модели используются для прогнозирования непрерывных значений, таких как температура, вес, процентные ставки и т. Д.

Рассмотрим другой набор игрушечных данных, нанесенный на график:

Синяя линия приблизительно описывает, где лежат точки распределения.

Теперь, если мы добавим еще несколько точек из распределения данных в обучающий набор, линия в целом изменится:

Любая новая точка, которую мы добавим из того же распределения данных, будет лежать на этой синей кривой. Учитывая значение одного из двух объектов, мы можем предсказать значение другого объекта на основе его расположения на кривой. ех. Если нам дано x1 = 3, то согласно кривой x2 = 1


Подготовка

Поскольку модель продолжала видеть новые точки, положение линии продолжало смещаться. Это процесс обучения (в случае контролируемого обучения). Чем больше очков мы получим, тем лучше будет процесс обучения и лучше будет точность модели.

гипотеза

Мы считаем, что это функция (или модель) максимально приближенная к истинной функции (или модели), которая описывает данные. В нашем примере классификации синяя линия, которую мы получили, является одной из таких гипотез, которая описывает данные так, что все точки на одной стороне линии принадлежат к одному и тому же классу.

Гипотеза пространства

Пространство гипотез - это совокупность всех возможных моделей или функций, которые могут быть представлены n признаками, необязательно описывающими данные. Целевая функция должна быть выбрана из этого пространства гипотез. Для двух переменных возможны бесконечные кривые в двух измерениях.

эвристический

Его можно рассматривать как простое пространство гипотез или решение, которое интуитивно помогает нам в конечном итоге выбрать правильную модель или функцию. Например, в нашем примере классификации мы интуитивно решили выбрать разные формы прямых линий, а не кругов или квадратов, потому что было очевидно, что линии будет достаточно для разделения точек. Это была наша эвристика. Мы могли бы выбрать круги, чтобы охватить 2 класса, но это ограничило бы тестовое пространство только теми кругами, которые были получены из тренировочных данных. Если бы мы выбрали другие формы, это могло бы занять больше попыток, чтобы прийти к финальной линии. Правильный выбор эвристики помогает быстрее достичь целевой функции.

Целевая функция

Целевая функция - это функция, которая фактически представляет исходное распределение данных. Если бы у нас был доступ ко всем возможным точкам данных, мы могли бы обучить модель изучению целевой функции.

параметры

Параметры модели - это внутренние переменные, значения которых могут быть определены из данных. Во время обучения значения параметров модели обновляются.

Выбор модели машинного обучения

Теперь, когда мы знаем некоторую основную терминологию, давайте попробуем понять, как мы выбираем модель машинного обучения:

  1. Определите постановку задачи.Это проблема классификации или проблема регрессии?
  2. Получите необходимые данные.
  3. Выберите эвристику на основе анализа исходных данных.
  4. Выберите модель машинного обучения, основанную на эвристике и поставленной задаче.

Теперь, когда мы рассмотрели основы, мы попытаемся увидеть модель Perceptron в следующей статье. Опять же, представленные здесь концепции являются разбавленными версиями. Я рекомендую Эндрю НгКурс машинного обучения на Courseraдля углубленного математического взгляда на эти темы.

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map