Освоение Data Science с нуля может показаться сложным и пугающим занятием. С чего же начать? Во вступительной серии публикаций мы подробно описали особенности профессии, а также рассказали, как научиться ей c нуля и какие навыки необходимы специалисту по Data Science.
В подготовленной при поддержке Факультета Искусственного интеллекта онлайн-университета GeekBrains статье мы расскажем, какие книги и видеокурсы помогут новичку освоить навыки Data Scientist. Предварительные знания для этого не нужны, достаточно желания погрузиться в профессию.
Книги для новичков
На русском
![<a href="https://www.ozon.ru/product/data-science-nauka-o-dannyh-s-nulya-2-e-izdanie-184991619/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/800f792a6e249f8b9b965d80649c095c.webp)
«Data Science. Наука о данных с нуля» от Джоэла Граса
Второе издание популярной книги включает описание библиотек, фреймворков, модулей и наборов инструментов для изучения науки о данных. Книга рассчитана на новичков, которые хотят понять, как работают фундаментальные инструменты и алгоритмы анализа данных.
![<a href="https://www.mann-ivanov-ferber.ru/books/verhovnyj-algoritm/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/d740f3bc7d6b3da1f33eef798208b971.png)
«Верховный алгоритм. Как машинное обучение изменит наш мир» от Педро Домингос
Книга о поиске универсального самообучающегося алгоритма подойдет пытающимся понять, как работают алгоритмы Machine Learning и где они применяются. Педро Домингос – один из ведущих исследователей в этой области. В доступной форме он знакомит читателей с пятью основными школами машинного обучения.
![<a href="https://www.ozon.ru/context/detail/id/140891479/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/380cba95faeaf8695b138072a75a2ca1.webp)
«Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными» от Андреас Мюллер и Сара Гвидо
Если вы абсолютный новичок, но хотите узнать о направлениях машинного обучения, эта книга для вас. Она подойдет даже не владеющим основами Python. Читателей знакомят с концепциями и алгоритмами машинного обучения, а также с их практическим использованием. В книге детально описаны все процессы: от предварительной обработки данных, до оценки результатов и внедрения алгоритмов в систему производственного уровня.
![<a href="https://www.ozon.ru/context/detail/id/139296295/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/1fe54c2d15d80abcc4028ae73c94a7da.webp)
«Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих» от Бхаргава Адитья
Книга с иллюстрациями, которая простым языком рассказывает об алгоритмах и их значении в последовательности решения различных задач.
![<a href="https://www.ozon.ru/context/detail/id/155266079/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/37d66f6977914ae68d4082d4e44ef68a.webp)
«Грокаем глубокое обучение» от Траск Эндрю
Книга обещает научить новичков в Data Science конструировать нейронные сети с нуля. Автор знакомит читателей со всеми тонкостями этой нелегкой задачи на примерах распознавания изображений и перевода текстов с помощью Python и библиотеки NumPy.
![<a href="https://www.ozon.ru/context/detail/id/159744533/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/b155e6d7fb847280bc86257516572a1b.webp)
«Работа с данными в любой сфере» от Еременко Кирилла
Практическое руководство по погружению в профессию Data Scientist для новичков и специалистов. Ее автор – основатель образовательного онлайн-портала и консультант Кирилл Еременко. Эксперт просто и понятно рассказывает об основных методах, алгоритмах и приемах, которые помогут на любом этапе: от сбора данных и их анализа, до визуализации полученных результатов.
![<a href="https://www.ozon.ru/context/detail/id/148592255/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/43993dab46a507d3ed2eea82f6ec9842.webp)
«Data Science. Инсайдерская информация для новичков» от Кэти О'Нил и Рэйчел Шатт
Книга основана на курсе Колумбийского университета «Введение в Data Science» и предназначена для тех, кто только начинает осваивать науку о данных. Авторы погружают читателя в Data Science c помощью примеров исследований и понятного кода. Книга охватывает тему алгоритмов, а также методов построения моделей и визуализации данных.
На английском
![<a href="https://www.amazon.fr/Understanding-Machine-Learning-Theory-Algorithms-ebook/dp/B00J8LQU8I" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/f92091d297b377629353c18d49034784.jpg)
«Understanding Machine Learning: From Theory to Algorithms» от Шай Бен-Давид и Шай Шалев-Шварц
Цель данного учебника – освоить машинное обучение от теории до внедрения алгоритмов. В книге дается теоретическая база основ машинного обучения и математических выводов, которые преобразуют эти принципы в практические алгоритмы.
![<a href="https://www.amazon.com/Numsense-Data-Science-Layman-Added-ebook/dp/B01N29ZEM6" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/256e02bdbcfd5f273715ba857d5eea17.jpg)
«Numsense! Data Science for the Layman: No Math Added» от Анналин НГ и Кеннет Су
Книга обещает представить Data Science c небольшим количество математики. Она подойдет новичкам и тем, кого пугают сложные формулы и статистика. Каждая глава посвящена определенному алгоритму, с описанием его работы и примерами использования.
![<a href="https://books.apple.com/us/book/data-science-for-dummies/id1208905171" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/0163be066ff35820a9280f3ec0fb427d.jpg)
«Data Science For Dummies» от Лилиан Пирсон
Концепции Data Science в простых терминах. Книга фокусируется на деловой стороне науки о данных и может использоваться как вводное руководство. Это ресурс для начинающих, который дает широкий обзор и знакомит читателей с наукой о данных и ее приложениями.
Книги для более продвинутых специалистов
На русском
![<a href="https://www.ozon.ru/context/detail/id/145995607/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/6a9414e78783ef99bc3712478cb0a6fb.webp)
«Практическая статистика для специалистов Data Science» от Брюса Эндрю и Брюса Питера
Книга рассчитана на специалистов в области Data Science, обладающих некоторым опытом работы с языком программирования R и имеющих представление о математической статистике. В удобной и легкодоступной форме в ней представлены ключевые понятия из статистики, которые относятся к науке о данных.
![<a href="https://www.ozon.ru/context/detail/id/147833454/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/e04c3682a1450d0e7e99f4784632c9a7.webp)
«Глубокое обучение на Python» от Франсуа Шолле
Книга написана для желающих освоить технологии глубокого обучения с нуля или расширить свои знания. В ней найдут много ценного работающие в области машинного обучения инженеры, разработчики программного обеспечения и студенты. В книге предлагается реальное практическое исследование глубокого обучения на примерах с программным кодом и подробными комментариями, практическими рекомендациями и простыми обобщенными объяснениями.
![<a href="https://www.ozon.ru/context/detail/id/144865316/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/65353bef419996b13f17b84a777cedb8.webp)
«Python для сложных задач. Наука о данных и машинное обучение» от Вандера Плас Дж.
Подробное руководство по вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки. Все желающие эффективно использовать Python в сфере Data Science найдут в этой книге ответы на связанные с подготовкой и анализом данных вопросы.
![<a href="https://www.ozon.ru/product/prikladnoe-mashinnoe-obuchenie-bez-uchitelya-s-ispolzovaniem-python-189137165/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/7de96588e30b10d435c8d61e8f8cc3bf.webp)
«Прикладное машинное обучение без учителя с использованием Python» от Патела Анкур
Автор показывает, как освоить прикладное машинное обучение без учителя на основе двух платформ: Scikit-learn и TensorFlow/Keras. Прочитавшие книгу специалисты в области Data Science смогут выявлять скрытые закономерности в информационных массивах, более глубоко анализировать деловые данные, обнаруживать аномалии, выполнять автоматическое конструирование признаков и генерировать синтетические наборы данных.
На английском
![<a href="https://www.amazon.com/Data-Science-Handbook-Insights-Scientists/dp/0692434879" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/da54cca58368195ebb89c6e32020b9f3.jpg)
«The Data Science Handbook: Advice and Insights from 25 Amazing Data Scientists» от Карла Шан, Уильяма Чен, Генри Ванг и Макса Сонг
Сборник интервью с 25-ю ведущими экспертами в Data Science: от бывшего главного директора по данным в США и руководителей data-teams в известных компаниях, до начинающих ученых в области данных, предлагающих уникальный взгляд на отрасль. Советы новичкам по развитию карьеры и рассказы о типичных ошибках начинающего специалиста.
![<a href="https://books.google.fr/books/about/The_Art_of_Data_Science.html?id=ZDH9DAEACAAJ&source=kp_book_description&redir_esc=y" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/597aa343d904140bb87da5bae958a91c.jpg)
«The Art of Data Science» от Роджера Д. Пэн и Элизабет Мацуи
Книга фокусируется на процессе анализа данных и их фильтрации для поиска интересный data insights. Авторы используют свой опыт управления проектами по обработке данных для обучения начинающих специалистов. Они также подробно обсуждают свои ошибки и подводные камни проектов, которые могут помешать достижению желаемых результатов.
![<a href="https://www.oreilly.com/" target="_blank" rel="noopener noreferrer nofollow">Источник</a>](https://media.proglib.io/posts/2020/10/27/7a3acdd557b94aa81f2d09edd84cbb5e.jpg)
«Data Jujitsu: The Art of Turning Data into Product» от DJ Patil
Книга DJ Patil – легенды Data Science и бывшего главного специалиста по данным Управления по Науке и Технике Соединенных Штатов. В ней выделены проблемы, возникающие в ориентированных на использование данных отраслях.
Видеокурсы для начинающих
На русском
Data Science для начинающих: обзор сферы и профессий от Нетологии
Видеолекция о том, как устроена работа с данными и почему она так востребована.
Введение в Data Science и Machine Learning от Hillel
Лекция Михаила Константинова – Data Scientist в ELEKS, о том, что из себя представляют Data Science и машинное обучение.
На английском
Learn Data Science от David Langer
Серии лекций Дэвида Лангра – специалиста по Data Science и основателя Dave on Data. Введение в анализ и визуализацию данных с помощью R.
Intro to Data Science – Crash Course for Beginners от freeCodeCamp
Основы Data Science для новичков и погружение в отрасль. Курс включает в себя основы статистики, визуализацию данных и программирование.
What is Data Science? | Introduction to Data Science | Data Science for Beginners от Simplilearn
Этот видеоучебник поможет понять, что такое Data Science и зачем она нужна. Предпосылки для изучения и жизненный цикл науки о данных с примерами и возможностями карьерного роста.
Learn Data Science Tutorial – Full Course for Beginners от freeCodeCamp
Учебный курс для абсолютных новичков. Основные принципы, практики и инструменты, которые делают Data Science мощным средством для критического анализа в бизнесе и исследованиях.
Introduction to Data Science от Linkedin Learning
Построенный на видеолекциях курс, с помощью которого вы получите знания о практических методах, вроде исследовательского анализа, очистки и визуализации данных. Он позволит наработать необходимые навыки для выполнения базового анализа данных и составления отчетов.
Видеокурсы для более продвинутых специалистов
Data Science Training Videos от Edureka
Большая серия видеолекций о Data Science, которые охватывают основные аспекты необходимых в профессии навыков.
Data Visualization in Python от sentdex
Учебная серия видеолекций о визуализации данных с помощью библиотеки Python Matplotlib.
Machine Learning от Andrey Ng
Видеолекции курса машинного обучения от одного из основателей Coursera и адъюнкт-профессора компьютерных наук в Стэнфордском университете.
Harvard Stats 110: Probability от Harvard University
Знаменитые лекции Гарвардского университета для специалистов, которые хотят усовершенствовать познания в статистике для оптимизации алгоритмов и моделей анализа данных.
Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?
Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:
- подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
- углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
- узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
- освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.
Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.
Комментарии