www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Следующие шаги с пандами и моделированием

Дата публикации Oct 3, 2019

К настоящему времени вы изучили основы машинного обучения и немного Python 3 и Pandas. Вот несколько следующих шагов, и бесплатные ресурсы, чтобы начать работу. Я буду продолжать добавлять информацию здесь, как я думаю об этом, или из предложений в комментариях.

На этом этапе вам не следует читать документацию, как если бы это была книга (хотя вы можете сделать это, если это работает для вас). Просмотрите документацию сверху вниз, чтобы ознакомиться с различными доступными темами.

Проверьте документацию, прежде чем смотреть на переполнение стека, и особенно, если вы хотите опубликовать вопрос.

Я предпочитаю посмотреть мой текущий вопрос или проблему и внимательно прочитать соответствующий раздел.

Например, мне часто приходится писать свой собственный анализатор даты и времени и передавать егоread_csv, Я также передал свой собственный список типов данных, чтобы получить правильный фрейм данных. Есть примеры обоих из них в документации.

Документация также включает в себяПоваренная книга, который стоит посмотреть.

  • Использование Pandas для больших наборов данных

Я использовал Pandas для наборов данных, которые были порядка 30 ГБ после создания моего фрейма данных Pandas. Процесс включает в себя импорт, очистку, объединение и поворот (при необходимости). Тем не менее, существуют различные стратегии использования больших наборов данных в Pandas. Проверьте документацию иэтот вопрос о переполнении стека, Будьте осторожны со старыми вопросами о переполнении стека, поскольку они могут включать устаревшие функции или стиль кодирования Pandas.

Я получил большую пользу от чтения книги Тома, которая доступна бесплатно. Однако я призываю вас заплатить ему что-то, в зависимости от ваших собственных обстоятельств.

Еще один отличный и бесплатный ресурс. Окунитесь здесь, когда вы столкнетесь с проблемой или вопросом.

  • Изучите байесовские методы

Как отмечает Кэл Дэвидсон Пилон в своей книгеВероятностное программирование и байесовские методы для хакеровБайесовские методы часто терпят неудачу в книгах статистики. Байесовские методы элегантны, полезны и являются очень естественным способом решения определенных проблем. Теперь у всех нас есть вычислительные ресурсы, такие как Digital Ocean, AWS и т. Д., Поэтому байесовские методы теперь практичны для изучения и использования.

Pilon вводит байесовские методы, сначала кодируя, а затем - теорию, которая является отличным способом развить не только навыки Python, но и получить работающую модель.

Думаю, байеса такжеДумаю, статистикаАллен Дауни доступны бесплатно и также стоит прочитать.

  • Лучшие вычислительные ресурсы

Лучшийэто всегда относительный термин. Вот почему люди в Stack Overflow закрывают вопросы и спрашивают, какие технологии использовать.

Все, что я скажу, это то, что если вы ищете дешевые ресурсы, не игнорируйте сайты разработчиков Oracle, NVIDIA, Intel или AMD. Например, NVIDIA предлагает онлайн-курсы по соответствующим технологиям, таким как OpenACC.

  • Участвуйте в вызовах

Например,Проблема очистки данных Kaggleтренирует свои навыки. Создание нескольких записных книжек для размещения на GitHub - это всегда хорошая вещь, которую можно передать потенциальному работодателю, или в качестве наброска для подготовки доклада на местном собрании PyData.

  • Посетите свой местныйPyDataMeetup

Пожалуйста, оставляйте качественные ресурсы в комментариях. Я всегда ищу дополнения к этому документу.

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map