Книги по Data Science
Разберись в Data Science. Как освоить науку о данных и научиться думать как эксперт
Авторы: Алекс Дж. Гатман, Джордан Голдмейер
Эта книга научит вас:
- Мыслить как дата-сайентист и понимать роль статистики и аналитики в вашей деятельности.
- Говорить на языке Data Science и задавать правильные вопросы, связанные с анализом данных.
- Ориентироваться в таких областях, как машинное обучение, анализ текстов, глубокое обучение и искусственный интеллект.
- Избегать типичных ошибок при работе с данными и их интерпретации.
Достоинства
- Дает общее представление о Data Science и аналитике данных, хотя и содержит некоторые противоречия. Материал изложен увлекательно, хоть и может показаться сложным для чтения.
- Отличное введение в Data Science. Книга увлекательна, а авторы смогли разъяснить суть Data Science без использования сложного математического аппарата. Особенно ценно наличие плана дальнейшего изучения методов машинного обучения.
- Подробно разбираются важные тонкости и нюансы.
- Изложение простое и доступное, кажется, что читаешь легкую беллетристику. Однако в сочетании с другой литературой по аналитике данных материал обретает новые грани и смыслы.
Недостатки
- Присутствует излишнее многословие, много отвлеченных рассуждений авторов.
Вывод
Книга представляет собой удачное введение в Data Science и аналитику данных для начинающих. Простой и увлекательный стиль изложения в сочетании с разбором важных тонкостей и наличием плана дальнейшего обучения делают ее ценным ресурсом. Однако следует учитывать наличие некоторых противоречий и излишнего многословия в некоторых местах.
Глубокое обучение на Python. 2-е межд. издание
Автор: Шолле Франсуа
Вас ждет увлекательное погружение в мир глубокого обучения на языке Python под руководством ведущего эксперта в этой области.
В книге вы найдете:
- Основы глубокого обучения, изложенные доступным и понятным языком.
- Детальное рассмотрение задач классификации и сегментации изображений с применением современных методов.
- Методы прогнозирования временных рядов с использованием глубоких нейронных сетей.
- Передовые техники генерации текста, переноса стилей в изображениях и генерации изображений с помощью нейросетей.
Достоинства
- Качественное издание с мягкой обложкой и отличной печатью.
- Автор излагает материал ясно и доступно, не требуя от читателя глубоких предварительных знаний. Примеры кода не перегружены лишней информацией.
- Отличная подача материала, широкий охват современных тем. Качество издания соответствует стоимости с учетом сложности материала и объема книги.
- Увлекательная подача материала, удобные отступы. Книга написана создателем Keras, что делает ее уникальной.
Недостатки
- Иллюстрации черно-белые, и не всегда понятно, что на них изображено. Однако наличие QR-кодов частично решает эту проблему.
Вывод
Книга охватывает широкий круг актуальных тем. Структурированная подача информации, увлекательный стиль автора и уникальность книги, написанной создателем Keras, делают ее ценным ресурсом. Единственным недостатком можно считать черно-белые иллюстрации, но наличие QR-кодов позволяет частично решить эту проблему.
Математика в машинном обучении
Авторы: Дайзенрот Марк Питер, Фейзал А. Альдо, Он Чен Сунь
Книга самодостаточна – читатель сначала знакомится с базовыми математическими концепциями, а затем переходит к четырем основным методам машинного обучения: линейной регрессии, методу главных компонент, гауссову моделированию и методу опорных векторов. Такой подход позволяет развить интуицию и получить практический опыт применения математики для новичков, а для читателей с базовым математическим образованием книга послужит отправной точкой для более глубокого изучения машинного обучения.
Достоинства
- Великолепная книга для тех, кто хочет погрузиться в математические основы машинного обучения. Обязательный ресурс для изучения перед непосредственным освоением машинного обучения, особенно для читателей без глубокого высшего математического образования.
- Отличное пособие для повторения и закрепления математического материала, необходимого для машинного обучения.
- Подходит для освежения знаний, полученных в университете, и их адаптации к требованиям машинного обучения.
Недостатки
- В книге присутствует значительное количество ошибок в формулах и опечаток, что требует сверки с оригинальным изданием. Иллюстрации переведены в черно-белый формат, из-за чего некоторые из них становятся менее понятными.
- Незначительное просвечивание рисунков с оборотной стороны страницы, но это не является критичным недостатком.
Вывод
Книга подходит как для первоначального освоения материала, так и для повторения и закрепления знаний. Единственным существенным недостатком является наличие ошибок и низкое качество иллюстраций в данном издании.
Грокаем машинное обучение
Автор: Серрано Луис
Данная уникальная книга объясняет базовые концепции машинного обучения на доступных примерах, увлекательных упражнениях и наглядных иллюстрациях. Изложение ведется понятным языком без излишнего академического жаргона – для понимания достаточно знаний алгебры школьного уровня. В процессе чтения вы создадите модели для идентификации спама, распознавания изображений и других интересных проектов на Python.
Достоинства
- Познавательная и практичная книга, материал которой можно использовать при курсовом и дипломном проектировании.
- Материал изложен интересным и доступным образом, без использования сверхсложной терминологии и алгебры.
- Превосходная обзорная книга по машинному обучению для начинающих или тех, кто хочет освежить знания. Сложные формулы объясняются пошагово на наглядных примерах, без углубления в сложные математические выкладки.
Недостатки
- Не выявлены.
Вывод
Материал преподносится интересным образом, без чрезмерного усложнения терминологией и сложными математическими выкладками. Книга заслуживает самых высоких рекомендаций как для начинающих, так и для тех, кто хочет освежить свои знания в этой области.
Грокаем глубокое обучение
Автор: Траск Эндрю
Книга «Грокаем глубокое обучение» научит создавать нейронные сети с нуля! Эндрю Траск детально рассматривает все нюансы этой сложной задачи. С помощью Python и NumPy вы сможете обучить свои нейросети распознавать изображения, переводить тексты на любые языки и даже генерировать текст наравне с Шекспиром.
В книге вы найдете:
- Теоретические основы глубокого обучения
- Создание и обучение нейронных сетей
- Работу с естественным языком
- Федеративное обучение и конфиденциальные данные
Для освоения материала достаточно школьных знаний математики и базовых навыков программирования.
Достоинства
- Максимально сведено к минимуму излишнее погружение в математические детали.
- Книга неплохая, читается легко и является отличной отправной точкой для начинающих, желающих изучать искусственный интеллект и глубокое обучение.
- Материал излагается доступным образом, объясняется методично и не требует глубоких предварительных знаний. Повторение основных идей, которое некоторые считают недостатком, на самом деле является плюсом, позволяющим лучше усвоить объем материала.
- Подача материала превосходна, книгу интересно читать.
Недостатки
- Излишне упрощенная подача материала, отсутствие математических разделов, присутствие которых ожидалось.
Вывод
Главными достоинствами книги являются доступность изложения, отсутствие необходимости глубоких предварительных знаний и увлекательная подача материала. Единственным существенным недостатком можно считать недостаток математических разделов для более глубокого погружения в тему.
Курсы
Confetti AI
Confetti AI предназначен для начинающих осваивать машинное обучение инженеров. Этот ресурс подготовит вас к тестовым вопросам по теории, включая математику, метрики и Deep Learning. Если вы ищете новую работу или просто хотите освежить знания, Confetti AI предлагает интересный и интерактивный способ это сделать.
Elements of AI
The Elements of AI – серия бесплатных онлайн-курсов от Reaktor и Университета Хельсинки. Курс предназначен для широкой публики и людей, которые хотят узнать, что такое искусственный интеллект простыми словами. Программа сочетает теорию с практическими упражнениями и включает множество примеров с иллюстрациями.
Collaborative Working in a Remote Team
Двухнедельный курс, с помощью которого вы узнаете об использовании технологий и инструментов для эффективного общения с командой во время удаленной работы. Программа включает стратегии планирования проектов, а также способы, которые помогут вам успешно настроить удаленное рабочее пространство.
Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?
Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:
- подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
- углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
- узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
- освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.
Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.
Видеолекции
Learn Data Science Tutorial – Full Course for Beginners
Вас познакомят с принципами, практиками и инструментами, которые делают Data Science мощным средством для получения ценных знаний в бизнесе и исследованиях. Вы получите прочную основу для дальнейшего обучения и применения полученных знаний в своей работе.
Intro to Deep Learning (ML Tech Talks)
Структурированный обзор глубокого обучения от разработчика Google ML. Эксперт проводит разбор обучения признакам, рассказывает о семействе нейронных сетей и их приложениях, а также приводит множество примеров кода и концепций из TensorFlow.
Introduction | Deep Learning Tutorial
Этот плейлист представляет собой полный курс по глубокому обучению для начинающих. Все, что вам нужно знать – это Python, Pandas.
Data Professor
YouTube-канал Чанин Нантасенамата, профессора биоинформатики в Исследовательском университете, где он также возглавляет лабораторию, занимающаяся разработками в области больших данных в медицине. Чанин имеет многолетний опыт работы в области науки о данных. На своем канале с помощью видеолекций и практических тьюториалов он помогает студентам и энтузиастам Data Science освоить машинное обучение, построение нейронных сетей, веб-скрейпинг и многое другое.
Data Science vs Machine Learning vs Artificial Intelligence vs Big Data
Канал Александра Кондуфорова, руководителя направления Data Science Competence в компании AltexSoft. Здесь обсуждаются различия между Data science, машинным обучением, искусственным интеллектом и большими данными.
Deepfake Tutorial | How to Create Deepfake using AI
Из этого туториала для начинающих вы узнаете, как с помощью искусственного интеллекта создать Deepfake с нуля. В урок также включено демо с примером кода.
DeepMind x UCL | Deep Learning Lectures | 7/12 | Deep Learning for Natural Language Processing
В лекции ученого-исследователя DeepMind Феликса Хилла обсуждается мотивация моделирования языка с помощью нейронных сетей. Рассматриваются такие концепции, как Elman's Finding Structure во времени и в простых рекуррентных сетях, важность контекста и трансформаторов, а также неконтролируемое и репрезентативное обучение языку от Word2Vec до BERT.
Блоги
Inside Big Data
Блог посвящен аспектам машинного обучения в области науки о данных и больших данных в ИТ и бизнесе. Особо интересны в нем интервью с выдающимися специалистами, которые делятся опытом работы в индустрии. В этом блоге есть специальные разделы, охватывающие Hadoop, Spark, Developers, Data Science 101, а также публикуются вакансии.
Dataconomy
Блог с множеством ресурсов для начинающих специалистов по Data Science. Здесь можно найти подборки и руководства для новичков, а также бесплатные библиотеки ИТ-исследований.
Simply Statistics
Этот блог ведут три профессора биостатистики: здесь есть статьи по основам статистики для новичков, а также раздел интервью с опытными младшими специалистами по обработке данных и старшими преподавателями. Основатели блога также являются авторами курсов Data analysis for life sciences и Data Science Specialization on Coursera.
Datafloq
Научный блог, созданный Марком Ван Рейменамом – востребованным международным спикером и стратегом в области больших данных, блокчейна и искусственного интеллекта, а также автором трех книг по менеджменту.
Information is beautiful
Дэвид Маккэндлесс из Information is Beautiful использует свой блог, чтобы представить проекты в области анализа данных и показать варианты эффективной визуализации. Это отличный пример симбиотической связи между данными и дизайном: цвета, формы и размеры передают массу информации, не занимая много места и увлекая читателя.
Storytelling with data
Блог Коул Нуссбаумер Кнафлик – автора одноименной книги, которая использует глубокий, основанный на сторителлинге подход к визуализации данных. Команда SWD привлекает пользователей регулярными статьями, популярным подкастом и развитым пользовательским сообществом.
Flowing Data
Основатель блога, статистик Натан Яу, помогает читателям превратить визуализацию данных в непрерывный диалог между читателем и создателем. Его проекты являются блестящими примерами визуализации даже случайной информации.
The Pudding
С помощью различных данных Pudding создает ориентированные на взаимодействие с читателем визуальные эссе. Сочетая журналистику данных, визуализацию и веб-инжиниринг, команда Pudding использует экспериментальный и очень индивидуальный подход к визуализации. На сайте вы сможете найти инструменты, примеры кода и туториалы.
Заключение
Даже опытные специалисты по Data Science не перестают учится, продолжая искать новые ресурсы и осваивать актуальные знания. Чтобы постоянно следить за обновлениями и новостями отрасли, нужно использовать всевозможные источники – от книг и блогов до подкастов и обзоров конференций.
Комментарии