19 июня 2021

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

Разработчик ПО (системы PDM/PLM) с 1993 года, компания "ИНТЕРМЕХ" (www.intermech.ru). В 2020-м успешно закончил курсы "Основы Data Science" (минская IT Academy) Референт-переводчик технической литературы с английского языка.
Виды собеседований на должность Data Scientist'а, их течение и советы для успеха.
🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

Текст публикуется в переводе. Автор оригинальной статьи – Emma Ding.

Если вы ошеломлены подготовкой к собеседованию на должность Data Scientist'а, вы не одиноки. Поиск "собеседование в Data Science" вернет вам бесконечное количество ссылок, включая статьи о Python, R, статистике, A/B тестированию, машинному обучению, Big Data. Вам посоветуют прочитать бесконечное количество книг. К сожалению, мы и сами давали такие же обширные рекомендации другим.

В реальности вам не нужно готовиться ко всему, чтобы получить свою первую работу Data Scientist'ом.

В этой статье мы расскажем вам о четырех ключевым вещах:

  • Виды должностей Data Scientist'ов.
  • Виды собеседований, к которым вы должны приготовиться.
  • Чего ожидать в процессе собеседования.
  • Что оценивают собеседующие.

Давайте погрузимся в эти темы.

Разбираемся в видах должностей Data Scientist'ов

Мы часто слышим жалобы на запутанные названия должностей. Этих названий очень много, например: Product Data Scientist, Machine Learning Data Scientist, Data Science Engineer, Data Analyst, и этот список постоянно растет. Если вы не знакомы с отраслью, будет очень трудно понять, на какую должность подавать заявление.

В общем, есть четыре вида должностей: Аналитика, Статистика, Инженерия данных и Алгоритмы. Это разделение построено на примере крупных компаний с большими командами Data Science (например, Facebook, Lyft, Airbnb, Netflix).

Виды должностей и примеры должностей для каждого вида
Виды должностей и примеры должностей для каждого вида

Опишем каждый вид должностей подробнее.

  • Аналитика. Сотрудники на этих должностях оказывают влияние на бизнес, делая рекомендации на основе изучения данных. Их обязанности включают в себя помощь заинтересованным лицам в принятии информированных решений на основе данных, проведение исследовательских анализов, определение бизнес-метрик и визуализация данных (напр., создание информационных панелей).
  • Статистика. Эти должности определяют возможности масштабировать эксперименты и применять статистические подходы (напр., казуальные модели) для решения проблем бизнеса.
  • Инженерия данных. Эти специалисты создают масштабируемые конвейеры данных, которые делают возможными принятие решений на основе этих данных, обычно для потребителей, разбирающихся в данных (аналитиков и Data Scientist'ов). Такие специалисты похожи на типичных инженеров данных, но обычно работают в команде data science, а не обслуживают широкий круг заинтересованных лиц (таких, как инженеры и product manager'ы).
  • Алгоритмы. Эти специалисты создают бизнес-ценности, разрабатывая статистические, оптимизационные модели и модели машинного обучения. Они часто проводят исследовательский анализ данных, чтобы получить глубокое понимание бизнес-задачи и выпустить модели в продакшн.

Хотя каждый вид должностей кажется уникальным, их обязанности часто перекрываются. В реальной жизни часто приходится выполнять обязанности нескольких должностей, в зависимости от состава команды и потребностей бизнеса (особенно в небольших компаниях). Изучение обязанностей и проектов будущей должности, о которых вы можете узнать, спросив у рекрутера или менеджера, поможет вам понять, насколько вы подходите для этой должности, и насколько она подходит для вас.

Следующая диаграмма показывает распределение видов должностей на рынке труда. Она построена на основе примерно тысячи вакансий, опубликованных на LinkedIn с сентября по ноябрь 2020-го года.

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

Очевидно, что доминирующим видом должностей является Аналитика, а Статистика востребована меньше прочих. То есть, если вы только начинаете свою карьеру Data Scientist'а, Аналитика будет отличным стартовым вариантом.

Однако какой вид должностей лучше всего соответствует вашим навыкам, интересам и имеющимся возможностям? Выберите один из них и сконцентрируйте свое внимание на навыках, необходимых для этого вида, о которых мы поговорим чуть позже. А пока давайте поговорим о том, чего вам следует ожидать на протяжении собеседования.

Процесс собеседования: 5 стадий

В этом разделе мы рассмотрим типичные стадии процесса собеседования. Заметьте, что хотя эти стадии есть почти во всех компаниях, порядок их следования может различаться.

Сейчас мы рассмотрим каждую из этих стадий, включая цели компании на каждой стадии, и чего вы должны на ней ожидать. В следующем разделе мы детально расскажем о видах вопросов, задаваемых на собеседовании каждого типа.

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

1. Онлайн-отсев. Обычная продолжительность: от 30 минут до 1 часа. Вид собеседования: кодирование. Вероятность: 1 случай из 3.

Цель компании: компании используют онлайн-отсев, чтобы избавиться от неподходящих кандидатов, а также от тех, кто не обладает минимальными техническими навыками. Отсев обычно проводится на веб-сайте кодирования (например, HackerRank) и не включает назначения личного собеседования, так что он помогает более эффективно фильтровать кандидатов.

2. Беседа с рекрутером по телефону. Обычная продолжительность: 30 минут. Вид собеседования: Поведение и Многофункциональный. Вероятность: 3 случая из 3.

Цель компании: рекрутер хочет убедиться, что ваши интересы, жизненные планы и требования (напр., виза) подходят для этой вакансии. Этот этап – возможность определить, что кандидат не подходит для данной вакансии или наоборот.

Рекрутер начнет с описания компании, должности и, возможно, команды, в которой вам предстоит работать. После этого он может спросить вас о вашей биографии, жизненных планах и о том, что вы рассчитываете получить, работая на этой должности (включая бонусы и компенсации). Это очень удобная возможность задать вопросы, которые помогут развеять вашу обеспокоенность.

3. Тестовое задание на обработку данных. Обычная продолжительность: 1 день – 2 недели. Вид собеседования: кодирование. Вероятность: 2 случая из 3.

Цель компании: тестовое задание отсеивает непригодных кандидатов и проверяет технические навыки, умение решать задачи и общаться.

Тестовое задание на обработку данных обычно требует решить бизнес-задачу и предоставить рекомендации на основе предоставленных данных. Иногда вас попросят написать итоговый отчет или сделать презентацию. В других случаях вам могут задать несколько вопросов, на которые вы должны ответить. Вам часто придется применять гибкие методы решения задач, поскольку на этом этапе проверяется ваша способность решать возникающие задачи, а не уровень владения конкретным языком или инструментом. Тем не менее, самые популярные языки, которые вы можете использовать – это SQL, Python и R. Некоторые компании просят вас сдать промежуточные результаты, чтобы определить, будете ли вы двигаться дальше, тогда как другие этого не требуют. В обоих случаях, вас обычно попросят предоставить свою работу на следующем раунде собеседования.

4. Телефонный разговор с техническим специалистом. Обычная продолжительность: 30 минут – 1 час. Вид собеседования: кодирование. Вероятность: 2.5 случая из 3.

Цель компании: телефонный разговор с техническим специалистом отсеивает кандидатов, не сумевших продемонстрировать минимальные технические навыки, необходимые для этой должности.

Как правило, у вас будет собеседование с Data Scientist'ом или нанимающим менеджером. Для начала они могут представиться и попросить вас рассказать о своем предыдущем опыте работы.

После этого собеседующий может углубиться в технические вопросы. Виды вопросов зависят от должности и могут включать в себя извлечение данных (SQL), метрики, статистику и теорию вероятности, машинное обучение и вопросы по кодированию. Обычно вам зададут вопросы не более чем из двух областей. Например, если вы претендуете на должность в Аналитике, вам могут задать вопросы об извлечении данных и метриках. Поскольку это собеседование может быть очень разным, мы рекомендуем перед ним спросить собеседующего о том, чего вам следует ожидать.

5. Собеседование в компании (обычно 4-6 раундов). Обычная продолжительность: 4-6 часов. Вид собеседования: все. Вероятность: 3 случая из 3.

Цель компании: тесты на сайте состоят из нескольких собеседований, проверяющих большинство навыков, требуемых для этой должности.

Тестирование в компании – это последний и самый сложный этап перед получением предложения о работе (offer). Это тестирование обычно более полное, чем предыдущие собеседования, поскольку оно состоит из нескольких собеседований (обычно 4-6). До COVID-19 большинство тестирований проводилось в кампусах компаний, но теперь они стали виртуальными. Комбинация собеседований зависит от вида должности, на которую вы претендуете. Например, тесты на роль Аналитика могут включать несколько собеседований по разным задачам бизнеса, но не включать машинного обучения. Мы обсудим это подробнее в следующем разделе.

Несмотря на то, что мы описали общую последовательность, виды собеседований внутри нее могут сильно различаться. Давайте рассмотрим их поближе.

Семь видов собеседований

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

В этом разделе мы представим семь популярных видов собеседований. Мы также опишем, что пытаются найти компании, и дадим советы, как показать себя в наилучшем свете. Каждое собеседование обычно оценивает 1-2 навыка или параметра поведения. Иногда рекрутеры сами скажут вам, на что обратить внимание, чтобы вы могли подготовиться.

Собеседования можно разделить на технические и не-технические. Технические собеседования сосредоточены на проверке "hard-навыков", необходимых для работы, а не-технические – на "soft-навыках" (например, умение общаться и руководить командой), а также пригодность для будущей команды.

Ниже мы предоставим краткие описания, примеры задаваемых вопросов и ресурсы для каждого типа собеседований.

1. Собеседование кодирования

Это собеседование покрывает широкий диапазон таких вопросов, как прикладные задачи извлечения данных/манипуляции данными, фундаментальные знания в Computer Science (алгоритмы, структуры данных и лучшие практики программирования) и алгоритмы машинного обучения.

Вопросы могут быть очень разными, в зависимости от должности. Поскольку SQL требуется практически для всех должностей, его знание тестируют очень часто.

Примеры вопросов:

  • Найдите среднюю стоимость покупок для каждого пользователя (SQL).
  • Найдите медианный доход, сгруппированный по странам, не используя функции медианы и процентные функции.
  • Найдите медиану несортированного массива (Python).
  • Закодируйте классический алгоритм машинного обучения – напр., метод k-средних или k ближайших соседей (Python).

Основные советы:

  • Перед началом кодирования сначала обсудите свой план работы с собеседующим, чтобы утрясти все вопросы и получить одобрение своего плана.
  • Вы должны знать основы, но не обязаны помнить всё наизусть.

Ресурсы:

  • Полезные советы, чтобы блистать на собеседовании по SQL (видео).
  • Полное руководство по подготовке к вопросам по Python (блог).

2. Тест обработки данных

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

На этом собеседовании кандидата просят проанализировать набор данных (обычно предоставленный в виде файла CSV) и выдать рекомендации по решению бизнес-задачи. Это обычно делается в виде домашнего задания, но вас могут попросить показывать свой экран, чтобы видеть процесс решения задачи. Задачи могут варьироваться от разведочного анализа данных до очистки и извлечения данных (SQL), конструирования признаков и моделирования (напр., предсказание или кластеризация).

Примеры вопросов:

  • По набору данных поведения клиентов определите отток клиентов и факторы, которые могут на него влиять.
  • По набору данных о покупках определите тренд процента конверсии покупателей в лояльных и приведите рекомендации по его улучшению.

Основные советы:

  • Получите четкое представление о задаче, прежде чем исследовать данные. Представьте такое решение, которое будет концентрироваться на поставленной задаче.
  • Не считайте, что данные очищены, если вам этого не сказали. Подумайте о проверке крайних значений и выбросов. Если у вас нет времени проверять данные, четко объявите свои предположения об их чистоте.
  • Сделайте отчет о своей работе и опишите дальнейшие шаги (напр., области для дополнительных исследований).

Ресурсы:

  • Онлайн-сообщество по решению разных задач с данными (Kaggle).
  • Блестящее решение домашних заданий по Data Science (блог).

3. Собеседование метрик/кейсов

По заданному бизнес-сценарию обсудите свой подход к задаче и сделайте предложения по ее решению. Задачи могут быть разными, в том числе: обнаружение сдвигов метрик, как измерять успех (мозговой штурм метрики), как оценить признак с компромиссами, и как улучшить продукт.

Примеры вопросов:

  • Как бы вы исследовали негативный сдвиг метрики дохода?
  • Каковы "за" и "против" использования Ежедневных Активных Пользователей (Daily Active Users, DAU) в качестве метрики успеха?
  • Как бы вы устроили эксперимент для признака X?
  • Если A/B тест показывает, что желаемая метрика (напр., показатель кликабельности) растет при понижении другой метрики (напр., количества кликов), как бы вы подошли к решению вопроса о запуске?

Основные советы:

  • Вытяните из собеседующего контекст и цель задачи, прежде чем отвечать или задавать уточняющие вопросы.
  • Пару минут расспрашивайте собеседующего, чтобы записать его ответы, и структурируйте ваше общение, прежде чем говорить.
  • Прежде чем давать полный ответ, подумайте о том, чтобы кратко описать несколько подходов и спросить собеседующего, что нужно рассказать более подробно.

Ресурсы:

  • Полное руководство по прохождению собеседований по бизнес-кейсам для Data Scientist'ов (часть 1, часть 2).
  • Чаще всего задаваемые вопросы о метриках и фреймворках (видео).
  • Реальные вопросы и ответы о метриках (видео плейлист).
  • Семь часто задаваемых вопросов и ответов по A/B тестированию с собеседований (блог).

4. Собеседование по статистике и теории вероятностей

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

Это собеседование тестирует ваше понимание прикладной статистики (напр., проведения экспериментов) и теории вероятностей (напр., теоремы Байеса).

Примеры вопросов:

  • Как бы вы объяснили 10-летнему ребенку, что такое p-value и доверительные интервалы?
  • Какова вероятность заражения пациента, если его тест позитивен, а вероятность заболевания в его популяции составляет 0.1%?
  • Чему равны среднее значение и дисперсия биномиального распределения?
  • Как смоделировать бросок жульнической монеты с помощью обычной монеты?

Основные советы:

  • Вам не всегда нужно знать точную формулу расчета заданной метрики. Однако вы должны знать, какие переменные в нее входят, и как они влияют на итоговое значение метрики (напр., доверительные интервалы увеличиваются при повышении дисперсии и уменьшении размера выборки).
  • Вы зачастую сможете ответить на вопросы по теории вероятностей, нарисовав все возможные варианты (напр., в виде дерева) и сложив вероятности. Не страшно, если из-за ошибки в вычислениях вы получите неправильный ответ, особенно если ваш подход к задаче был правильным.

Ресурсы:

5. Собеседование по машинному обучению

Это собеседование включает вопросы по основам машинного обучения и решению задач с помощью стандартных методов.

Примеры вопросов:

  • Что такое переобучение? Как с ним бороться?
  • Что бы вы делали с несбалансированным набором данных?
  • Расскажите, что такое сдвиг против разброса (bias vs variance).
  • Расскажите, что такое классификатор Случайного Леса (Random Forest).
  • В каких случаях вы бы использовали регуляризацию L1 и L2?

Основные советы:

  • Давайте четкие определения в 2-3 предложениях. Приведите один-два примера, чтобы убедить собеседующего, что вы не только знаете теорию, но и имеете опыт ее применения.
  • При необходимости предоставьте несколько широко используемых решений задачи.

Ресурсы:

  • Полное руководство, как блистать на собеседованиях по машинному обучению (блог).
  • 4 вида задач машинного обучения на собеседованиях по Data Science (видео).
  • Реализация алгоритмов машинного обучения с нуля (плейлист).

6. Собеседование по опыту

На этом собеседовании вы обсудите свой предшествующий профессиональный опыт с нанимающим менеджером или вашими будущими коллегами. При этом в основном задают не технические вопросы, а вопросы о поведении. Поскольку это собеседование обычно проводит член команды, в которой вы хотите работать, на нем могут задавать вопросы, относящиеся к задачам, проблемам или ситуациям этой команды.

Примеры вопросов:

  • Расскажите о ситуации, в которой вы сыграли важную роль. В чем заключалась проблема, каковы были обстоятельства, как вы подошли к ее решению, и как вы с ним справились?
  • Расскажите о конфликте, который вам удалось разрешить, или о заинтересованном человеке, которого вы переубедили.

Основные советы:

  • Часто делайте паузы и спрашивайте собеседующего, нет ли у него вопросов, и не хочет ли он, чтобы вы рассказали о чем-то подробнее.
  • Готовясь к этому собеседованию, выделите 3-5 проектов, которые можно было бы использовать для большинства собеседований о поведении. Запишите ситуацию, проблему, ваш способ ее решения и его важность, чтобы вам не пришлось импровизировать на собеседовании.

Ресурсы:

7. Многофункциональные собеседования и собеседования о ценностях компании

На этом собеседовании вас будут спрашивать, как вы взаимодействовали с другими людьми в прошлом, и что бы вы сделали в различных гипотетических сценариях. Оно обычно проводится для нахождения кандидатов, хорошо соответствующих моральным и культурным ценностям компании.

Примеры вопросов:

  • Расскажите о случае, когда ваша рекомендация противоречила рекомендации другого человека. Как вы пришли к решению?
  • Расскажите о случае, когда вам пришлось расставлять приоритеты для нескольких очень срочных проектов. Как вы с этим справились?

Основные советы:

  • Просмотрите "ценности компании" (обычно на веб-сайте компании). Подготовьте ситуации, в которых вы действовали в соответствии с этими ценностями.
  • Заранее узнайте, кто будет проводить собеседование, если это возможно. Визуализируйте их проблемы (например, product manager'ы склонны интересоваться тем, как предоставлять данные заинтересованным лицам) и найдите в своем прошлом ситуации, имеющие отношение к этим проблемам.

Ресурсы:

Выбираем важнейшие области подготовки

Эти семь видов собеседований могут ошеломить кого угодно! В этом разделе мы расскажем о том, как выбирать важнейшие для вашей вакансии области, чтобы готовиться к собеседованиям организованно и эффективно.

Вот несколько общих советов:

  • Изучите, как сохранять организованность в процессе подготовки к собеседованию (видео).
  • Перед началом подготовки спросите рекрутера, какие виды собеседований вас ждут (видео).
  • Если вы узнали последовательность собеседований, готовьтесь к ним в порядке их следования (напр., если первым будет собеседование по опыту, сначала готовьтесь к нему). Если же вы только начали готовиться, сначала готовьтесь к собеседованиям кодирования.

Наконец, в зависимости от вида должности, на которую вас собеседуют, вы должны уделить одним видам собеседований больше внимания, чем другим. Схема, приведенная ниже, может предоставить вам догадки насчет областей, на которых стоит сконцентрировать свое внимание.

🗣 Собеседование на вашу первую работу Data Scientist'ом: чего ожидать и к чему готовиться

Вы можете заметить, что кодирование и не-технические собеседования требуются для всех видов должностей, но некоторым видам Data Scientist'ов не приходится полностью готовиться к собеседованиям всех типов. Например, Аналитики могут меньше внимания уделять Машинному обучению, но больше – собеседованиям метрик/кейсов.

Эта схема должна помочь вам определить приоритеты в подготовке к собеседованию, исходя из ваших сильных и слабых сторон, а также должности, на которую вы претендуете.

Имейте в виду: оцениваемые качества

Хотя подготовка в области "hard-навыков" полезна, ее часто бывает недостаточно. На протяжении всего процесса собеседования будут оцениваться и ваши дополнительные качества. Несмотря на то, что различные компании имеют разные схемы оценки этих навыков, они, как правило, пытаются найти одни и те же качества. В общем, компании хотят, чтобы кандидаты в процессе собеседования продемонстрировали следующие качества:

  • Коммуникация – способность эффективно общаться в устном и письменном виде с технической и не-технической аудиторией. Это можно продемонстрировать, отвечая на вопросы последовательным и логическим образом, и объясняя технические концепции с помощью примеров и аналогий.
  • Проницательность в бизнесе / Чувство продукта – способность думать стратегически и практически о "большой картине", чтобы разрабатывать решения задач, принимая в расчет основные соображения насчет продукта и бизнеса, такие, как экономика, организационные ограничения и точка зрения заинтересованных лиц. Это можно продемонстрировать, вплетая соображения бизнеса и организации в ваши ответы на вопросы.
  • Решение задач – способность разбивать задачу на составные части и разрабатывать подходящие решения, исходя из заданных ограничений. Это можно продемонстрировать на основании полноты и глубины ваших ответов.
  • Сотрудничество и влияние – способность исследовать разные точки зрения и достигать консенсуса с партнерами. Это можно продемонстрировать вашим умением реагировать на обратную связь в процессе собеседования и внедрением нескольких точек зрения в ваши ответы.

К демонстрации этих качеств трудно приготовиться, но при некоторой практике вы можете этого добиться. Вот три полезных совета:

  • Говорите, не забывая о контексте и аудитории. Различные виды собеседников имеют разные интересы. Например, менеджеры более заинтересованы в идеях высокого уровня и влиянии на бизнес, а индивидуальные участники проекта могут быть более заинтересованы в технических деталях. Большинство собеседников потребуют серьезного погружения в ситуацию и детали.
  • Не торопитесь. Потратьте минуту на то, чтобы записать свои мысли сгруппировать их в "корзины", которые вы будете использовать при беседе. Это спасет вас от бессвязной болтовни и поможет собеседующему следовать за вашими мыслями. Не бойтесь общаться с собеседующим! Часто задавайте вопросы и сделайте ваше собеседование диалогом.
  • Продемонстрируйте свой интерес к компании, поделившись своими догадками. Докажите, что вы провели исследования, прочитав сведения о компании и ее маркетинговые материалы, а также протестировали продукт. Говорите на языке собеседующего.

Заключение и мысли под занавес

В этой статье мы прошлись по видам должностей в Data Science, широко используемых видам собеседований, процессу собеседования и дали полезные советы для достижения успеха. Надеюсь, это помогло вам понять, чего следует ожидать, и как лучше подойти к своей миссии поиска работы.

Если вы находитесь в самом начале этого пути, вот какие шаги вы должны сделать:

  1. Выберите одну должность, к которой вы стремитесь, и уделяйте особое внимание собеседованиям, наиболее важным для этой должности. Если вы новичок в этой отрасли, мы рекомендуем должности Аналитиков, концентрируясь на подготовке к собеседованиям Кодирования (SQL) и собеседованиям Метрик/кейсов.
  2. Планируйте наперед. Процесс собеседования обычно занимает не менее 3 недель, от подачи заявления до получения предложения работы. Зачастую он занимает месяцы. Вы должны стараться получить предложения сразу от нескольких компаний одновременно, чтобы максимизировать диапазон ваших возможностей и поднять себе цену.
  3. Приготовьтесь потратить немало времени на собеседования. Да, поиск новой работы – это почти вторая работа на полный рабочий день!
  4. Практикуйтесь, практикуйтесь и практикуйтесь! Попросите своих друзей, уже работающих в отрасли, устроить вам тестовые собеседования. Обязательно просите у них обратную связь, чтобы совершенствоваться.

Источники

МЕРОПРИЯТИЯ

Комментарии

ВАКАНСИИ

Добавить вакансию
Java Team Lead
Москва, по итогам собеседования
Senior Java Developer
Москва, по итогам собеседования
Разработчик С#
от 200000 RUB до 400000 RUB

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ