Jupyter Notebook: галерея лучших блокнотов по ML и Data Science
Подборка примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных.
Если вы увлекаетесь машинным обучением и Data Science, Jupyter Notebook – это один из самых удобных инструментов для совместной работы над проектами и изучения новых концепций. Ниже представлены блокноты Jupyter, которые будут наиболее полезны специалистам по анализу данных – как обучающимся новичкам, так и практикующим профи.
Вводные курсы в Jupyter Notebook
Статистика, машинное обучение и наука о данных
- Блокнот по введению в количественную оценку неопределенности и анализ чувствительности
- Сопроводительные материалы книги Джейка Вандерпласа Python Data Science Handbook (можно использовать как интерактивную альтернативу чтению самой книги)
- Введение в статистику с Python
- Блокноты по упражнениям онлайн-курса Эндрю Ына по ML, Spark и TensorFlow
- Методы Монте Карло, стохастическая оптимизация
- Введение в байесовский вывод
- Байесовский анализ данных
- Самоучитель по Data Science
- Поваренная книга IPython
- Введение в машинное обучение с Python и scikit-learn
- Растущая подборка блокнотов по курсу машинного обучения Университета Турина (с упражнениями)
- Кластеризация и регрессия
- Нейронные сети
- Введение в Pandas
- Data Science и Big Data с Python
- У проекта Statsmodels есть две подборки блокнотов: в официальной документации и в вики
- Python для анализа данных
- Статистика и анализ данных для психологов
- Решение задания курса по анализу данных CS 109
- Книга "Введение в статистическое обучение с приложениями на языке R" имеет две подборки блокнотов с примерами на Python
- Блокноты упражнений по курсу StatLearning
- Прикладное предсказательное моделирование с помощью Python
- Большая подборка по четырем курсам, посвященным Data Science, алгоритмам и базам данных Университета Колумбии
- SciPy и OpenCV как интерактивная вычислительная среда для компьютерного зрения
- Фильтры Калмана и Байеса на Python
- Adaboost для задачи классификации цифр
- Подборка по практическому использованию машинного обучения и анализа данных
- Глубокое обучение с Apache SINGA
- Подборка блокнотов по ML и Data Science
- ETL с Python, работа с MySQL и csv файлами
Анализ данных со стеком SciPy
- Введение в машинное обучение с sklearn
- Интерактивный фитинг кривых с пакетом lmfit
- Введение в машинное обучение с Python и scikit-learn
- Распознавание лиц (датасет Wild)
- Введение в байесовские методы многоуровневого моделирования
- Введение в байесовские сети
- Байесовский анализ данных с помощью PyMC3
- Набор примеров для решения шаблонных задач классификаций
- Вероятность, парадокс и принцип разумности
- Определение вероятности отзыва 5 звезд
- Модель геодемографической сегментации
Визуализация данных и построение графиков в Jupyter Notebook
- Общие проблемы при визуализации больших наборов данных и как их избежать
- Визуализация данных переписи США с использованием datashader
- Интеграция данных и визуализации c помощью веб-ресурсов
- 21 интерактивный график
- Визуализация комплекснозначных функций с Matplotlib и Mayavi
- Пример использования библиотеки bqplot
- D3 Viewer для визуализации Matplotlib
- Bokeh – интерактивная библиотека для веб-визуализации c Python
- Визуализация с помощью HoloViews
- Победитель конкурса E. Tufte Slope Graphs
- matta – d3.js-визуализация в IPython Notebook
- Отображение Pandas в интерактивной карте распределения значений
Обработка естественного языка
- Программирование на Python для гуманитариев
- Мультиноминальный наивный байесовский классификатор новостей
- Использование рандомной кросс-валидации для категоризации новостей
Pandas для анализа данных в Jupyter Notebook
- 10-минутный тур по Pandas
- Анализ временных последовательностей с Pandas
- Анализ финансовых данных с Pandas
- Кластеризация данных с датчиков смартфона для анализа данных о физической активности с pandas и scipy
- Анализ и визуализация вспышек на Солнце
- Продвинутый анализ логов Apache
- Статистический анализ данных в Python
- Глубокое погружение в Pandas от .head() до .tail()
Заключение
Заметим, что Jupyter Notebook применяется далеко не только для задач, связанных с машинным обучением и анализом данных, но также и в математике, физике, химии, биологии, геологии, обработке сигналов, работе с социологическими данными, в психологии и нейрологии. Кроме питонистов, технологию Jupyter Notebook все чаще осваивают разработчики на Julia, Haskell и Ruby.
Источник (включает подборки по другим областям знаний)
Вас также могут заинтересовать:
- Описание платформы Jupyter Lab
- Покажем, как использовать docker-compose для Python и Jupyter
- Data Science за 3 месяца: эффективный учебный план
- От новичка до профи в машинном обучении за 3 месяца
- Большая подборка материалов по машинному обучению: книги, видеокурсы, онлайн-курсы
- Мнения топовых людей из индустрии Data Science о развитии отрасли
- Учебный план освоения глубокого обучения и нейросетей за 6 недель