yuliianikolaenko 21 августа 2020

📈 Стать аналитиком Big Data: пошаговое руководство 2024

Рассказываем, какие знания, онлайн-курсы, подкасты и книги помогут начать карьеру в сфере Big Data без специального образования.
📈 Стать аналитиком Big Data: пошаговое руководство 2024

Что такое Big Data

Анализ больших данных – относительно новая, но довольно востребованная сфера рынка труда. Спрос на специалистов по работе с данными постоянно растет. Big Data – это наборы данных очень больших размеров, которые также характеризуются многообразием и высокой скоростью обновления.

Аналитик больших данных – это специалист, который выявляет и исследует закономерности в данных с помощью специальных программных средств.

О том, чем занимаются специалисты по анализу больших данных, мы писали в статье Big Data: размер имеет значение. В этом материале, подготовленном при поддержке Факультета Аналитики Big Data онлайн-университета GeekBrains, мы сосредоточимся на навыках, необходимых для овладения профессией.

Необходимые знания

Английский язык

Актуальная информация по анализу больших данных в первую очередь появляется в англоязычных сообществах. Знание английского языка необходимо не только для чтения литературы по теме, но и для общения с зарубежными коллегами.

Soft skills

Работа в проектах над большими данными обычно разделяется между специалистами из разных сфер. Поэтому немаловажным является умение работать в команде. Развить свои soft skills помогут следующие курсы и книги:

Математика

Если вы начинаете свой карьерный путь из другой сферы, необходимо прокачать знания в дискретной математике и статистике. Так вы сможете лучше понимать алгоритмы обработки и методы анализа больших данных.

На русском:

На английском:

Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?

Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:

  • подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
  • углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
  • узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
  • освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.

Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.

Программирование

📈 Стать аналитиком Big Data: пошаговое руководство 2024

Далее нужно изучить SQL – язык создания, модификации и управления базами данных.

Чаще всего для обработки и анализа больших данных используются такие языки программирования, как Python или R, или Rust. Изучить их основы совершенно бесплатно можно с помощью онлайн-платформ.

На русском:

🐍 Самоучитель по Python для начинающих

Самоучитель содержит 25 глав и 230 практических заданий:

  1. Особенности, сферы применения, установка, онлайн IDE
  2. Все, что нужно для изучения Python с нуля – книги, сайты, каналы и курсы
  3. Типы данных: преобразование и базовые операции
  4. Методы работы со строками
  5. Методы работы со списками и списковыми включениями
  6. Методы работы со словарями и генераторами словарей
  7. Методы работы с кортежами
  8. Методы работы со множествами
  9. Особенности цикла for
  10. Условный цикл while
  11. Функции с позиционными и именованными аргументами
  12. Анонимные функции
  13. Рекурсивные функции
  14. Функции высшего порядка, замыкания и декораторы
  15. Методы работы с файлами и файловой системой
  16. Регулярные выражения
  17. Основы скрапинга и парсинга
  18. Основы ООП: инкапсуляция и наследование
  19. Основы ООП – абстракция и полиморфизм
  20. Графический интерфейс на Tkinter
  21. Основы разработки игр на Pygame
  22. Основы работы с SQLite
  23. Основы веб-разработки на Flask
  24. Основы работы с NumPy
  25. Основы анализа данных с Pandas

Теория

📈 Стать аналитиком Big Data: пошаговое руководство 2024

Для того чтобы строить и интерпретировать прогностические модели, необходима сильная теоретическая база. В соответствующих онлайн-курсах включены основы статистики, высшей математики, необходимая теория и практические задания.

На русском:

На английском:

В дополнение:

Книги по Big Data

После просмотра курсов и освоения базы приступайте к чтению научно-технической литературы по теме. Не стесняйтесь читать и научно-популярную литературу – это позволит посмотреть на область свежим взглядом.

Подкасты

📈 Стать аналитиком Big Data: пошаговое руководство 2024

Подкасты и Youtube-каналы – одни из лучших способов быть в курсе последних новостей Big Data.

На русском:

На английском:

  • Data Skeptic эксперты о статистике, машинном обучении, ИИ и Big Data;
  • Code Newbie об успешных программистах и людях, сумевших стать профессионалами с нуля;
  • Learn to Code with Me – для новичков об основах программирования;
  • Coding Blocks – о лучших практиках программирования, алгоритмах и ООП;
  • Programming Throwdown – для разработчиков о работе на разных языках программирования;
  • Arrested DevOps – новое о практиках разработки;
  • Software Engineering Daily – о работе программного обеспечения.
  • Super Data Science – Ведущий Джон Крон (Jon Krohn) рассказывает о последних тенденциях в отрасли, советах по карьерному росту и влиянии технологий на нашу жизнь.
  • Data Engineering Podcast – еженедельные обсуждения DS с участием инженеров и предпринимателей, формирующих отрасль.

Практика

После знакомства с теорией и основами программирования закрепите полученные знания на практике. Начните анализировать реальные данные. В этом вам помогут онлайн-курсы и популярные ресурсы:

  • Kaggle – самый известный ресурс для практики навыков анализа данных, участие в соревнование будет отличным дополнением к резюме;

Потребуются также и специальные инструменты для решения проблем, связанных с огромными объемами данных и их распределенной обработки:

Погружение в сферу

LinkedIn

В первую очередь подпишитесь на сообщество Big Data and Analytics на LinkedIn. Там собраны не только курсы и офферы для аналитиков, но и вся актуальная информация от ведущих экспертов области. А также советуем следить за публикациями Ronald van Loon, Jules Polonetsky, DJ Patil и Bernard Marr. Они активно рассказывают о своем карьерном пути и делятся новостями из мира Data Science.

Сообщество

📈 Стать аналитиком Big Data: пошаговое руководство 2024
  • Stack Overflow Big Data – огромный ресурс с вопросами и ответами о проблемах, связанных с кодом;
  • Хабрахабр Big Data – статьи по анализу данных и машинному обучению;
  • Women in Big Data – форум для женщин в сфере больших данных;
  • MachineLearning.ru – вики-страница, посвященная машинному обучению на русском;
  • Cross Validated – вопросы и ответы по статистике и выбору лучших моделей;
  • R-bloggers – все, что вы хотели знать о R.

Телеграм-каналы по Data Science

Комментарии

ВАКАНСИИ

Добавить вакансию
Разработчик C++
Москва, по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ