www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Как решить бизнес-задачи с помощью Data Science

Дата публикации Oct 3, 2019

Шесть шагов, чтобы сформулировать проблемы как проект Data Science

Как я уже заметилв моем последнем постеЯ хочу обсудить способы перевода бизнес-задач в проекты по науке о данных. В последние недели я провел несколько часов, исследуя эту тему. В этом посте я поделюсь тем, что узнал о фазе подготовки успешных проектов по науке о данных.Часть контента - это то, что я извлек из лучших практик Google в проектах по науке о данных.Пожалуйста, не забывайте, что в любой дисциплине, связанной с данными, нет строго определенных правил. Вот почему лучше принять это как предложение, а не как ориентир.

Термин Data Science состоит из двух частей: Data + Science.

Что является более перспективным: наука о данных или разработка программного обеспечения? | Инвестор, управляемый данными

Около месяца назад, когда я сидел в кафе и работал над созданием веб-сайта для клиента, я нашел эту женщину ...

www.datadriveninvestor.com

Научная часть в основном связана с математикой и вычислительной техникой. В масштабе человека есть много способов изучить математические основы и развить навыки работы на компьютере. Я также буду обсуждать это в следующих постах. Если вы управляете бизнесом, имея достаточно финансовых и временных ресурсов, вы можете переподготовить сотрудников, нанять новые таланты или инвестировать в новые технологии.

Данные похожи на воду. Это может быть проливной дождь или оазис в Сахаре. Иногда это озеро Верхнее, иногда вода в бутылках. Иногда вам нужно выпить рафинер, иногда вы сразу же начинаете орошение. В масштабе отдельного человека вы можете иметь открытый доступ к тоннам данных, чтобы начать проект. Если вы управляете бизнесом, бремя лежит на ваших плечах большую часть времени.

Поскольку название подразумевает, что наука о данных может быть одним из оружий, когда компании сталкиваются с проблемами. Научная часть приносит решение. Однако данные - это зелье, которое превращается в магическое в результате применения науки. Если у вас неправильное зелье, вы получите уродливую лягушку. Если у вас есть правильное зелье, вы получите лебедя (иногда даже черного).

Вот почему результат зависит от силы связи между определенной проблемой и доступными данными.Теперь давайте подробнее рассмотрим шаги по укреплению этих связей.

1. Укажите свою бизнес-проблему

Все начинается с четко определенной бизнес-проблемы. Вы должны предложить прогнозирующую проблему для создания / повышения ценности бизнеса для вашей организации. Кроме того, вы также должны знать влияние прогнозирующего результата.

Ваша бизнес-проблема может быть определена в следующем дизайне:Как мы можем (цели), чтобы (влияние / результат)?

Пример:

Как мы можемустановить акции / скидки для потенциальных клиентовна основе нашего существующего портфеля, чтобы мы моглиувеличить нашу долю в их расходах?

2. Провести анализ подразделения

Чем детальнее проблема, тем понятнее становится. Единичный анализ в большинстве случаев определяется бизнес-проблемой. Вы должны определить единицы из имеющихся у вас данных, и они должны быть единообразными по всему набору данных. Вы должны быть уверены в том, что означает каждая строка в ваших данных.

Пример:

Бизнес проблема:Как многоспросожидается нанесколько периодов впередчтобы мы могли управлять нашимиинвентарьэффективно?

Анализ подразделения:требовать(количество заказов, SKU и т. д.),Время(День / неделя / месяц),инвентарь(SKU, количество бочек, посылок и т. Д.)

3. Определите ваши переменные

Переменные - это все, что имеет значение для прогнозирования. Думайте о переменных как о столбцах в ваших данных. Ваши переменные должны быть связаны с единичным анализом.

Все переменные должны быть единообразными в измерении, например, если цена является переменной, валюту следует заранее определить как доллар США и т. Д.

Все переменные также должны быть согласованы в спецификациях. Например, если пол является переменной величиной, наличие как женщины / женщины, так и мужчины / мужчины нарушает последовательность.

Переменные могут не иметь структуру большую часть времени. Например, ваш набор переменных может представлять собой пиксели на изображениях, которые также могут иметь разные размеры. В таких случаях вы должны стандартизировать изображения для обеспечения согласованности.

Пример:

Бизнес проблема:какаявид обувиможет ли онлайн-клиент быть заинтересован в покупке?

Переменные:Марка, цвет, размер, цена, ставка дисконта, InStock_YN и т. Д.

4. Определите вашу цель

Цель - это то, что мы хотим предсказать. Это также должно быть связано с единичным анализом. Это может быть категориальное значение, например, горячее / теплое / холодное или непрерывное, например, градусы Цельсия / Фаренгейта.

Пример:

Бизнес проблема:Как мы должны предсказать время, которое питомец проводит в приюте, прежде чем его усыновят?

Переменные:Тип, порода, пол, цвет, имя, состояние здоровья, изображение домашнего животного, описание профиля и т. Д.

Цель: количество дней, проведенных домашним животным в приюте до усыновления.

5. Установите действия

Планируйте, как вы будете пользоваться предсказаниями Действие - это то, что пользователи должны делать после получения прогнозов. Ваши действия должны быть основаны на бизнес-проблеме и быть связаны с целью. В зависимости от результатов может потребоваться несколько альтернативных действий.

Пример:

Бизнес проблема:Как Uber должен устанавливать цену для конкретного путешествия?

Переменные:Расстояние, уровень затора, расчетное время в пути, история клиента, спрос / предложение вокруг и т. Д.

Цель:Общая стоимость поездки показана потенциальному клиенту

Действие: Подайте алгоритм Uber с ответом клиента (Принять / Отклонить), чтобы оптимизировать ценообразование.

6. Определите критерии успеха

Ваши критерии успеха должны быть определены, чтобы измерить влияние решения проблемы. Это может быть либо минимизировать, либо максимизировать что-то. Это может быть получено из статистических критериев. Вам лучше представлять это деньгами, временем или рабочей силой. Критерии успеха должны быть связаны с целью.

Пример:

Бизнес проблема:Каков правильный объем запасов для запуска производства?

Цель:Лимит запасов в каждом центре распределения для каждого продукта

Критерии успеха: минимизировать средний запас (монетизировать, удерживая затраты), максимизировать% уменьшения количества дефицитов (монетизировать дефициты)

Мне нравится упрощенный, нереалистичный пример Uber, который я показал выше. Вот полный пример для этого случая:

Бизнес проблема:Как Uber должен устанавливать цену для конкретного путешествия, чтобы они могли максимизировать свой ежедневный доход?

Переменные:Расстояние, уровень перегрузки, история клиента, расчетное время в пути, спрос / предложение вокруг и т. Д.

Цель:Общая стоимость поездки показана потенциальному клиенту

Действие:Подайте алгоритм Uber с ответом клиента, чтобы оптимизировать ценообразование.

Критерий успеха:Повысьте ежедневную выручку на 15% по сравнению со статической моделью ценообразования за счет максимального принятия клиентов (или целевой цены).

Анализ подразделения:

  • Цена: (USD)
  • Расстояние: (мили между исходным и целевым местоположением)
  • Уровень загруженности: (низкий, средний, высокий, необычный. Генерируется другой моделью)
  • История клиента: (A для принятия, D для отклонения. A-D-A-A)
  • Расчетное время в пути: (мин)
  • Спрос / предложение: (3 бесплатных водителя, 7 запросов клиентов. 3/7)

Надеюсь, вам понравился этот пост. Увидимся на следующем!

Турецкая версия этого постадоступна здесь.

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map