Ilya Ginsburg 07 января 2021

📊 9 причин, по которым вы никогда не станете Data Scientist'ом

Откровенно о том, какие качества нужны настоящему специалисту по науке о данных.
Для этого нужно изменить свой образ мыслей

Оговорка: эта статья написана не для того, чтобы лишить вас уверенности в себе. Вместо этого она послужит вам чем-то вроде пристального взгляда в зеркало.

Итак, вы – энтузиаст Data Science, вы уже прочитали пару десятков статей и закончили несколько занятий онлайн. Теперь вы мечтаете о карьере в этой области. В конце концов, это же самая привлекательная работа 21-го века, если верить Harvard Business Review.

Но, несмотря на весь ваш энтузиазм, вполне возможно, что Data Science не для вас. В данный момент вы питаете иллюзии и верите ложным стереотипам.

Сейчас ваша задача проста: избавиться от того, что вам мешает! После этого вы удивитесь, с какой скоростью вы будете двигаться вперед.

1. Вы считаете, что вашего образования достаточно

У вас есть диплом вуза по "сопутствующей специальности", или даже PhD (примерно соответствует кандидату наук – прим. переводчика). И вот вы хотите начать карьеру в Data Science.

Но использовали ли вы когда-нибудь оболочку? Испытывали то пугающее чувство, когда интерфейс командной строки выдает вам ошибки? Работали ли вы когда-нибудь с большими базами данных – размерами в терабайты?

Если вы ответили "нет" хотя бы на один из этих вопросов, вы еще не готовы. Вам нужно поработать над реальными проектами и получить опыт работы в реальном мире. Только после этого вы познакомитесь с проблемами, которые вы будете встречать каждый день в качестве Data Scientist'а, и только после этого вы выработаете навыки, необходимые для их решения.

Поздравляю вас с вашим дипломом. А теперь пора приниматься за тяжелую работу.

Статья на тему: "Можете ли вы стать Data Scientist'ом без диплома в сопутствующей специальности".

От переводчика
Если вы не изучали Data Science/Machine Learning специально, ваш курс математики мог не включать важные для освоения науки о данных разделы. Рекомендую замечательную книгу "Mathematics for Machine Learning". Лучшие книги и курсы по математике перечислены здесь. Особенно полезна шпаргалка по теории вероятностей и статистике.

2. Вам не хватает увлеченности

Вы когда-нибудь тратили все выходные на самодельный проект, который вас увлек? Проводили ли вы когда-нибудь ночи напролет за поисками на GitHub, пока ваши друзья развлекались на вечеринке? Отказывались ли вы когда-нибудь от любимого хобби, предпочитая писать код?

Если вы не можете ответить "да" ни на один из этих вопросов, вы недостаточно увлечены. Быть Data Scientist'ом – значит сражаться с по-настоящему сложными задачами и не отступать, пока задача не будет решена. Если вы недостаточно увлечены, вы будете сдаваться при первой же сложности.

Подумайте о том, что влечет вас стать Data Scientist'ом. Эффектное название профессии? Или перспектива постоянно перекапывать тонны данных в поисках догадок? В последнем случае – вы идете в правильном направлении.

Без увлеченности вы не добьетесь успеха
Без увлеченности вы не добьетесь успеха
От переводчика
Сложности – обычно нахождение реальных зависимостей между данными и избегание мнимых зависимостей. К сожалению, курсы Data Science редко заостряют на этом внимание, предпочитая обучать загрузке данных и построению моделей. Ваша модель работает, но ее качество явно недостаточно – что дальше? А дальше и начинаются сложности.

3. Вы недостаточно сумасшедший

Только сумасшедшие идеи достаточно хороши. И в качестве Data Scientist'а, вам понадобится их много. Вы должны быть не просто "открыты для неожиданных результатов" – они случаются часто!

Но вам также придется придумывать решения действительно сложных задач. Это потребует такого уровня необычности, которого вы не сможете добиться с помощью обычных идей.

Если люди постоянно говорят, что у вас поехала крыша, вы движетесь в правильном направлении. Если же нет, вам нужно поработать над своим безумием.

Конечно, это требует определенной смелости. Как только вы выпустите своё сумасшествие на волю, некоторые люди начнут крутить пальцем у виска и отвернутся от вас.

Но дело того стоит, потому что вы просто показали свою истинную сущность. И вы зажгли ту искру великолепия, которое вам потребуется в качестве Data Scientist'а.

4. Вы учитесь по учебникам и онлайновым урокам

Не поймите меня неправильно: учебники и онлайновые уроки – прекрасный путь, чтобы начать учиться. Но только чтобы начать!

Вам нужно как можно быстрее начать работу над реальными проектами. Само собой, нет смысла начинать проект на Python'е, если вы не можете написать на нем ни одной строки. Но как только вы освоите приличный базовый уровень, принимайтесь за дело.

Ключ к успеху – это обучаться за работой.

Начните собирать свое портфолио на GitHub. Поучаствуйте в хакатонах и соревнованиях Kaggle. И напишите о своем опыте в блоге.

Каждый может прочитать учебники, и даже выполнить упражнения к ним. Чтобы стать Data Scientist'ом, вы должны сделать намного больше.

5. Вам кажется, что в какой-то момент вы "научитесь всему"

Вы подписались на пару онлайновых курсов по Data Science и прочитали пару учебников. Теперь вы думаете, что как только вы их освоите, вы будете знать достаточно, чтобы прорваться в Data Science.

Неверно. Это еще даже не начало. Если вам кажется, что сейчас вы изучаете много материала, подумайте о том, сколько вы изучите за следующие три года.

Если вы все-таки станете Data Scientist'ом, вы будете учиться в десять раз быстрее, чем сейчас. Это постоянно меняющаяся область, где всегда нужны самые новые технологии. Если вы перестанете учиться, как только получите работу, из начинающего Data Scientist'а вы очень быстро превратитесь в никудышного.

Если вы хотите стать отличным Data Scientist'ом (а если вы это читаете – значит, хотите), вам придется принять тот факт, что кривая вашего обучения со временем будет только расти. Если вы не любите учиться тысяче новых вещей одновременно, перестаньте мечтать о Data Science.

Быть фанатиком данных недостаточно
Быть фанатиком данных недостаточно

6. У вас нет опыта в других областях

Итак, вы кое-что смыслите в компьютерных науках, и ваши математические навыки не так уж плохи. Сможете ли вы получить работу в Data Science?

Нет, не сможете. Ваши навыки в IT и Data Science имеют основополагающее значение, но этого недостаточно, чтобы выделить вас из толпы прочих энтузиастов Data Science.

Data Scientist'ы работают в компаниях всех видов в любой области индустрии. Чтобы выдать ключевые догадки для своих клиентов, вам нужны знания об их сфере деятельности.

Например, Кейт Мэри Льюис из следующей истории получила работу Data Scientist'а за шесть месяцев. Решающим оказалось то, что, будучи нейрофизиологом, она обладала знанием сферы деятельности здравоохранения.

Статья на тему: "Как я прошла путь от нулевых навыков кодирования до Data Scientist'а за шесть месяцев".

В какой области вы хороши? В каких сферах деятельности у вас есть опыт?

Старайтесь позиционировать себя как специалиста в какой-то области, а не просто "универсального Data Scientist'а". Именно так вы обычно получаете работу.

От переводчика
Требовать от Data Scientist'а, который и так должен очень много знать, еще и знания вашей предметной области глупо: лучше нанять более перспективного, а предметную область он освоит в процессе работы. На постсоветском пространстве такое встречается редко, зато широко распространена другая глупость: всем нужны "сеньоры" с опытом работы не ниже 6 лет. Шесть лет назад здесь никто даже не учил Data Science! Чтобы стать женой генерала, надо выйти замуж за лейтенанта, а чтобы получить настоящего Senior Data Scientist'а, отлично знающего вашу предметную область, надо взять перспективного новичка и пару лет обучать его.

7. Вам не хватает бизнес-навыков

Итак, вы скорее аналитик. Вы любите числа и сопутствующий анализ, и ненавидите социальные навыки и общение с другими людьми.

Это не сделает вас хорошим Data Scientist'ом, друг мой. Социальные навыки важны даже на математической работе. Социальные навыки – это именно то, благодаря чему вы будете блистать на собеседовании.

Статья на тему: "Чему каждый Data Scientist должен научиться у бизнес-лидеров".

Из всех социальных навыков, которые вы можете усвоить, бизнес-навыки требуют прокачки больше всего. Помните, что ваши клиенты – это лидеры бизнеса, и поэтому им нужны люди, разбирающиеся в бизнесе. Только таким путем вы сможете генерировать идеи, которые будут иметь какое-то значение для их бизнеса.

От переводчика
Крайне важно и ваше умение красиво представлять свои результаты руководству. Диаграммы, гистограммы, графики – все это вы должны уметь делать красиво. Многие соискатели получили работу лишь потому, что их результаты были оформлены лучше прочих.

8. У вас нет значимых связей

Вы хотите получить работу в этой области, но у вас нет ни одного друга-Data Scientist'а? Пора вылезать из своей скорлупы, друг мой.

Ходите на митапы. Вступите в тематические группы на LinkedIn. Знакомьтесь с людьми на хакатонах. Станьте follower'ом нужных людей в Twitter. Встречайтесь с участниками общих GitHub-проектов. Сделайте что-нибудь впечатляющее!

Как и при любом поиске работы, 90% вашего успеха определяются не тем, насколько обширны ваши навыки, а тем, кто может вас рекомендовать и тем, кто может представить вас руководству.

Если ваши связи в LinkedIn заканчиваются на вашей маме и коллегами по вашей бесперспективной работе, пора прокачивать свой профиль. Если количество ваших follower'ов в Twitter можно пересчитать на пальцах одной руки, начинайте твитить. Если у вашего блога нет читателей, попробуйте продвижение в поисковых системах (SEO) или кросс-платформный маркетинг.

Связи придут. Но сначала надо вылезти из своей скорлупы.

Встречайтесь с людьми. Общайтесь. Стройте свою сеть.
Встречайтесь с людьми. Общайтесь. Стройте свою сеть.

9. Вы не любите грязную работу

Вы слышали всю эту шумиху вокруг Машинного Обучения и Искусственного Интеллекта. Вы думаете, что Data Science может открыть двери к ультрасовременным технологиям.

Может быть, вы и займетесь этими технологиями. Но я гарантирую, что вы будете этим заниматься не более 5% вашего рабочего времени.

Как только вы получите работу вашей мечты, вы проведете большую часть своей жизни за очисткой данных. Поздравляю, вы добились работы уборщика!

Если это вам не нравится, ступайте домой – вам вообще незачем читать эту статью. Если, прочитав все это, вы все еще хотите стать Data Scientist'ом, сейчас самое время полюбить всю эту "грязную работу".

Статья на тему: "Data Scientist – самая грязная работа 21-го века".

От переводчика
Ручаюсь, вы думаете, что автор преувеличивает. Ничего подобного! 90% времени Data Scientist'а действительно уходит на исследовательский анализ данных (EDA), их очистку и подготовку. Выбор оптимальной модели и гиперпараметров обучения оказывают намного меньшее влияние на качество модели, чем правильная подготовка данных.

Data Science – это не просто выбор карьеры. Это призвание.

Data Scientist'ы очень нужны всем, что и стимулирует множество людей баловаться с этой областью. Но для получения работы в этой области баловаться недостаточно – придется поработать, и поработать тяжело.

Если после чтения этой статьи вы все еще уверены, что хотите стать Data Scientist'ом, поздравляю вас! Может быть, вы в начале большого пути.

Если же вы еще не уверены, сможете ли стать Data Scientist'ом, определите самые важные причины своих сомнений, и начинайте работать над улучшением ситуации. Вы справитесь!

Источники

МЕРОПРИЯТИЯ

Комментарии 0

ВАКАНСИИ

Добавить вакансию

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ

BUG