yuliianikolaenko 22 ноября 2020

👨‍🎓️📈Как выбрать специализацию и начать обучение Data Science

Рассказываем об этапах обучения, которые необходимо пройти новичку для начала карьеры в Data Science. Путь от выбора специализации до выработки практических навыков будет непростым.
👨‍🎓️📈Как выбрать специализацию и начать обучение Data Science

О необходимых специалисту по анализу данных ресурсах мы писали в статьях «Data Science с нуля: обзор книг и видеокурсов для начинающих» и «10 навыков, необходимых в профессии Data Scientist». Сегодня подробнее расскажем о необходимых для овладения профессией Data Scientist этапах.

Выберите специализацию

<a href="https://i2.wp.com/blog.udacity.com/wp-content/uploads/2014/11/Data-Science-Skills-Udacity-Matrix.png?zoom=1.25&amp;resize=640%2C521&amp;ssl=1" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

В Data Science существует множество ролей: специалист по визуализации данных, специалист по машинному обучению, специалист по обработке данных, инженер по обработке данных и т. д. Делайте выбор в зависимости от вашего образования, опыта и личного интереса. Поговорите с людьми, которые работают в отрасли, чтобы выяснить, какие обязанности придется выполнять и каких навыков потребует желаемая должность.

При выборе специализации не спешите сразу к ней переходить. Изучите смежные с вашей нынешней профессией сферы, это поможет вам легче сменить род занятий. Например, разработчику программного обеспечения не составит труда перейти к разработке данных.

Об основных специализациях и обязанностях Data Scientist мы подробно рассказали в статье «Data Science и Big Data: сходства и различия».

Выберите инструменты и язык программирования

<a href="https://revolution-computing.typepad.com/.a/6a010534b1db25970b01b7c926d776970b-800wi" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Судя по описаниям вакансий, наиболее фундаментальными навыками и инструментами науки о данных являются следующие:

  • Программирование на Python или R (выбору языка посвящена статья «От "R против Python" к "R и Python"»);
  • Владение популярными инструментами для задач Data science. Если вы выбрали Python, придется изучить такие библиотеки, как Pandas, NumPy, Matplotlib или Plotly и scikit-learn;
  • Очистка и предобработка (data engineering), анализ и визуализация данных;
  • Написание SQL-запросов;
  • Основы статистики и прикладной математики;
  • Навыки машинного обучения и моделирования;
  • Тонкости рабочего процесса и навыки совместной работы (Git, командная строка/bash и т. д.).

Пройдите курсы

<a href="https://i.pinimg.com/originals/58/2d/ab/582dabc4a3bf8e09fdf2c8f69f5c1a2f.png" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Нужные знания можно получить самостоятельно, но проще пройти специализированные курсы. Систематизированная программа позволит более полно освоить ключевые навыки Data Scientist: основы прикладной математики и статистики, программирование, предобработку данных и работу с алгоритмами. Стоит также обратить внимание на курсы по выбранной вами специализации, например по обработке естественного языка, по анализу временных рядов, по обучению с подкреплением и т. д.

Статистика и математика:

Курсы Python:

Курсы R:

SQL

Предобработка данных

Алгоритмы:

Применяйте знания на практике

<a href="https://miro.medium.com/max/640/0*ftOal7fKVCNtJr4N.png" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Во время прохождения курсов и тренингов сосредоточьте усилия на практическом применении изученного. Даже если вы изначально не понимаете лежащих в основе метода сложных математических концепций, начните со способов интерпретации результатов. Вы всегда сможете развить глубокое понимание на более позднем этапе обучения.

Другой способ закрепить полученные знания – участие в конкурсах, соревнованиях (например, Kaggle) и хакатонах по Data Science. Освоение технологий машинного обучения, нейронных сетей, распознавания образов и других передовых методов имеет значение, но большая часть работы над проектом заключается в очистке и подготовке данных к анализу. Участие в соревнованиях позволит закрепить навыки работы с различными типами данных и подготовиться к реальным проектам.

Присоединитесь к сообществу Data Science

<a href="https://image.slidesharecdn.com/alexeynatekin-171122132352/95/open-data-science-beyond-traditional-scientific-communities-by-alexey-natekin-1-638.jpg?cb=1511357048" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Когда вы освоили необходимые навыки и попробовали применить их на практике, следующий важный шаг – присоединение к сообществу Data Science. Освоение новой области может показаться немного пугающим, когда вы делаете это в одиночку, но единомышленники ответят на ваши вопросы и помогут решить возникающие проблемы.

Несколько примеров посвященных Data Science комьюнити, в которые стоит вступить:

Развивайте коммуникативные навыки

<a href="https://blog.vantagecircle.com/content/images/2019/04/7-Reasons-Why-Internal-Communication-is-Important-in-the-Workplace.png" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Умение донести идею – один из самых важных soft skills в профессии Data Scientist. Чтобы эффективно делиться идеями с коллегами или доказывать свою точку зрения на собраниях, вы должны знать, как донести сложные концепции до широкой аудитории. Это особенно важно в бизнес-сфере, где заказчики проекта могут не владеть техническими навыками и терминологией. Для презентации результатов потребуется умение донести идею простым языком.

Если вам сложно передавать сложные концепции, стоит сделать следующее:

  • Попытайтесь научить менее технически подкованных друзей базовым концепциям науки о данных. Обучая других, вы будете учиться сами;
  • Участвуя в хакатонах и митапах по Data Science, тренируйтесь задавать правильные вопросы и презентовать результаты проектов;
  • Используйте GitHub для размещения проектов и обмена идеями;
  • Будьте активны в сообществах Data Science, задавайте вопросы и оставляйте комментарии.

Не переставайте учиться

<a href="https://www.valamis.com/documents/10197/783138/life-long-learning.png" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Работа в Data Science требует постоянного изучения новых технологий и методов работы с данными. Наиболее полезными источниками актуальной информации являются блоги и посты в социальных сетях (обратите внимание на лидеров комьюнити Data Science в LinkedIn), которые ведут влиятельные специалисты. Они постоянно публикуют посты о последних веяниях в этой области, своем опыте, достижениях и ошибках на карьерном пути. Уделяйте время прочтению новостей каждый день.

Найдите наставника

<a href="https://content.thriveglobal.com/wp-content/uploads/2019/05/Top-7-qualities-of-the-best-mentors-in-a-business.png" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Один из заключительных пунктов, который, возможно, является одним из самых важных: найдите хорошего наставника, готового ответить на ваши вопросы о необходимых в профессии навыках и тонкостях работы в команде Data Science. Наука о данных, машинное обучение и инженерия данных – относительно новые области знания. Новичку может потребоваться поддержка и советы опытного специалиста.

Составьте резюме и подготовьтесь к собеседованию

<a href="https://business.caw.ac.uk/wp-content/uploads/2020/03/How-to-Write-a-CV-Blog-Facebook-Image.jpg" target="_blank" rel="noopener noreferrer nofollow">Источник</a>
Источник

Качественное резюме – первый шаг на пути к работе мечты. При его составлении необходимо выполнить ряд требований:

  • Указать освоенные навыки в соответствии с желаемой вакансией и ролью;
  • Написать про участие в проектах и соревнованиях (это важнее формальных сертификатов);
  • Указать языки программирования, а также пакеты и инструменты, которыми вы владеете;
  • Указать профили на GitHub и Kaggle;
  • Проверить общее качество резюме: убедитесь, что шрифты и формат являются стандартными, стремитесь классическому деловому стилю;
  • Убрать лишнее. По мнению большинства рекрутеров, небольшое по объему, но емкое по содержанию резюме повышает шансы соискателя получить приглашение на собеседование.

Вы можете создать свое уникальное резюме с нуля, но проще использовать стандартные шаблоны. Несколько примеров c бесплатным доступом: Creddle, VisualCV, CVMKR и SlashCV.

После поиска вакансий и отправки резюме, основательно подготовьтесь к собеседованию. В статьях «Профессия Data Scientist и 20 вопросов на собеседовании» и «Собеседование для Data Scientists: вопросы и ответы» мы рассказали, какие подводные камни будут ждать вас на этом этапе.

***

Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?

Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:

  • подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
  • углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
  • узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
  • освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.

Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.

Комментарии

ВАКАНСИИ

Добавить вакансию
Разработчик C++
Москва, по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ