Шпаргалки освободят ваш разум для более важных задач. Мы собрали 27 лучших шпаргалок, которые можно и нужно использовать.
Машинное обучение охватывает множество аспектов. Когда я только начинал интересоваться этим вопросом, наткнулся на шпаргалки, в которых собраны стандартные проверки на все случаи жизни. В конце концов, я разобрался и скопил больше двадцати шпаргалок, которыми хочу поделиться.
Да, машинное обучение развивается семимильными шагами, и, полагаю, моя коллекция устареет, но для июня 2017 года она более чем актуальна.
Если не хотите загружать все шпаргалки по отдельности, скачайте готовый zip-архив.
Машинное обучение
Существует немало полезных блок-схем и таблиц, затрагивающих машинное обучение. Ниже представлены наиболее полные и нужные.
Архитектуры Neural Network
С появлением новых архитектур нейронных сетей их стало сложно отслеживать. Большое количество сокращений (BiLSTM, DCGAN, DCIGN, а знает ли кто-то их все?) может обескуражить.
Поэтому я решил составить чит-лист, содержащий многие из этих архитектур. Большая часть относится к нейронным сетям. Есть только одна проблема в такой визуализации: не показан принцип использования. Например, вариационные автокодеры (VAE) могут выглядеть как автокодеры (AE), но процесс обучения другой.
Блок-схема алгоритмов Microsoft Azure
Шпаргалки по машинному обучению Microsoft Azure помогут выбрать правильный алгоритм для модели прогнозирующей аналитики. Студия машинного обучения Microsoft Azure включает в себя большую библиотеку алгоритмов регрессии, классификации, кластеризации и обнаружения аномалий.
Блок-схема алгоритмов SAS
Шпаргалки с алгоритмами SAS позволят быстро найти подходящий алгоритм для решения конкретной задачи. Представленные здесь алгоритмы – результат компиляции отзывов и советов от нескольких ученых по данным, разработчиков и экспертов в области машинного обучения.
Собрание алгоритмов
Здесь представлены алгоритмы регрессии, регуляризации, кластеризации, дерева принятия решений, байесовский и другие алгоритмы. Все они сгруппированы согласно принципам работы.
Также список в инфографическом формате:
Алгоритм прогнозирования: «за/против»
Эти шпаргалки собрали лучшие алгоритмы, которые используются в прогнозирующем анализе. Прогнозирование – это процесс, в котором из набора входных переменных определяется значение выходной переменной.
Python
Неудивительно, что язык Python собрал большое комьюнити и множество онлайн-ресурсов. Для этого раздела я подобрал лучшие шпаргалки, с которыми работал.
Алгоритмы Python
Это коллекция из 10 наиболее часто используемых алгоритмов машинного обучения с кодами на Python и R. Чит-лист подойдет в качестве справочника, который поможет использовать полезные алгоритмы машинного обучения.
Основы Python
Нельзя отрицать, что сегодня Python находится на подъеме. Шпаргалки включили в себя все необходимое, в том числе функции и определение объектно-ориентированного программирования на примере языка Python.
А этот чит-лист станет замечательным дополнением вступительной части любого учебника по Python:
NumPy
NumPy – это библиотека, которая позволяет Python быстро обрабатывать данные. При первом изучении могут возникнуть проблемы с запоминанием всех функций и методов, поэтому здесь собраны самые полезные шпаргалки, способные значительно облегчить изучение библиотеки. Расписаны импорт/экспорт, создание массивов, копирование, сортировка, перемещение элементов и многое другое.
А здесь дополнительно представлена теоретическая часть:
Схематическое представление некоторых данных можно найти в этом чит-листе:
Вся необходимая информация с диаграммами:
Pandas
Высокоуровневая библиотека Pandas предназначена для анализа данных. Соответствующие фреймы, панели, объекты, функционал пакета и другие необходимые сведения собраны в удобно организованном чит-листе:
Схематизированное представление информации о библиотеке Pandas:
А этот чит-лист включил в себя подробное изложение с примерами и таблицами:
Matplotlib
Если же дополнить предыдущую библиотеку Pandas пакетом matplotlib, появится возможность рисовать графики к полученным данным. Именно за построение графиков на языке Python и отвечает matplotlib. Зачастую это первый пакет, связанный с визуализацией, который используют начинающие Python-программисты, и представленные шпаргалки помогут быстро сориентироваться в функционале данной библиотеки.
Во втором чит-листе вы найдете больше примеров визуального представления графиков:
Scikit-Learn
Библиотека Python с алгоритмами машинного обучения Scikit-Learn – не самая простая в изучении, но с чит-листами принцип ее работы становится максимально понятным.
Схематизированное представление:
С теорией, примерами и дополнительными материалами:
TensorFlow
Еще одна библиотека для машинного обучения, но со своим функционалом и трудностями его восприятия. Ниже представлен полезный чит-лист для изучения TensorFlow:
PyTorch
Хороший инструмент для исследований и экспериментов, обеспечивающий гибкость и высокую скорость обработки данных. Шпаргалки PyTorch в основном содержат примеры и дополнительные материалы. Этот не исключение:
Шпаргалки: математика
Если вы действительно хотите понять машинное обучение, вам нужно знать статистику (особенно вероятностную), линейную алгебру и некоторые исчисления. Я думал, что умру в процессе изучения всех тонкостей, и определенно нуждался в переподготовке. Эти шпаргалки дадут большую часть того, что вам нужно знать.
Вероятность
Линейная алгебра
Статистика
Исчисление
Также рекомендуем Вам посмотреть:
Путь Data Scientist’а в 2017
Как научиться data science?
Программирование на Python: от новичка до профессионала
Путь Python Junior-а в 2017
Машинное обучение за год
Большая подборка материалов по машинному обучению: книги, видеокурсы, онлайн-курсы
Комментарии