Дата публикации Oct 3, 2019
К настоящему времени вы изучили основы машинного обучения и немного Python 3 и Pandas. Вот несколько следующих шагов, и бесплатные ресурсы, чтобы начать работу. Я буду продолжать добавлять информацию здесь, как я думаю об этом, или из предложений в комментариях.
На этом этапе вам не следует читать документацию, как если бы это была книга (хотя вы можете сделать это, если это работает для вас). Просмотрите документацию сверху вниз, чтобы ознакомиться с различными доступными темами.
Проверьте документацию, прежде чем смотреть на переполнение стека, и особенно, если вы хотите опубликовать вопрос.
Я предпочитаю посмотреть мой текущий вопрос или проблему и внимательно прочитать соответствующий раздел.
Например, мне часто приходится писать свой собственный анализатор даты и времени и передавать егоread_csv, Я также передал свой собственный список типов данных, чтобы получить правильный фрейм данных. Есть примеры обоих из них в документации.
Документация также включает в себяПоваренная книга, который стоит посмотреть.
Я использовал Pandas для наборов данных, которые были порядка 30 ГБ после создания моего фрейма данных Pandas. Процесс включает в себя импорт, очистку, объединение и поворот (при необходимости). Тем не менее, существуют различные стратегии использования больших наборов данных в Pandas. Проверьте документацию иэтот вопрос о переполнении стека, Будьте осторожны со старыми вопросами о переполнении стека, поскольку они могут включать устаревшие функции или стиль кодирования Pandas.
Я получил большую пользу от чтения книги Тома, которая доступна бесплатно. Однако я призываю вас заплатить ему что-то, в зависимости от ваших собственных обстоятельств.
Еще один отличный и бесплатный ресурс. Окунитесь здесь, когда вы столкнетесь с проблемой или вопросом.
Как отмечает Кэл Дэвидсон Пилон в своей книгеВероятностное программирование и байесовские методы для хакеровБайесовские методы часто терпят неудачу в книгах статистики. Байесовские методы элегантны, полезны и являются очень естественным способом решения определенных проблем. Теперь у всех нас есть вычислительные ресурсы, такие как Digital Ocean, AWS и т. Д., Поэтому байесовские методы теперь практичны для изучения и использования.
Pilon вводит байесовские методы, сначала кодируя, а затем - теорию, которая является отличным способом развить не только навыки Python, но и получить работающую модель.
Думаю, байеса такжеДумаю, статистикаАллен Дауни доступны бесплатно и также стоит прочитать.
Лучшийэто всегда относительный термин. Вот почему люди в Stack Overflow закрывают вопросы и спрашивают, какие технологии использовать.
Все, что я скажу, это то, что если вы ищете дешевые ресурсы, не игнорируйте сайты разработчиков Oracle, NVIDIA, Intel или AMD. Например, NVIDIA предлагает онлайн-курсы по соответствующим технологиям, таким как OpenACC.
Например,Проблема очистки данных Kaggleтренирует свои навыки. Создание нескольких записных книжек для размещения на GitHub - это всегда хорошая вещь, которую можно передать потенциальному работодателю, или в качестве наброска для подготовки доклада на местном собрании PyData.
Пожалуйста, оставляйте качественные ресурсы в комментариях. Я всегда ищу дополнения к этому документу.
© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map