⚕ Какие специалисты по Data Science требуются в медицинских проектах и что им нужно знать?

Что может быть прибыльнее, чем вести войну, торговать оружием и промышлять в даркнете? Правильно – лечить людей и продавать лекарства. Рассказываем, что нужно знать и уметь, чтобы влиться в выгодную и легальную индустрию здравоохранения.

Кто сталкивался с чем-то посложнее простуды знает, что при нестандартных симптомах шансы на успешное лечение резко падают по нескольким причинам:

  1. Врачи работают по стандартам. С одной стороны, это хорошо, так как в основе стандарта лежит доказательная медицина и врач использует проверенную методологию. С другой стороны, тело и взаимосвязь тела и психики все еще плохо изучены, поэтому при чистых анализах и нестандартных симптомах пациенту вряд ли помогут. В таких случаях намекают на психосоматику и выписывают успокоительные средства. Таким образом врач сообщает: «не знаю, что делать».
  2. Ограниченное время на одного пациента. В РФ терапевту выделяется около 15 минут на пациента, за которые толком ничего не узнаешь.
  3. Врач может ошибиться, ведь он тоже человек. Врачебные ошибки приводят к осложнениям и в некоторых случаях к смерти в среднем у 70 тыс. россиян в год.
  4. Узкая специализация. Врачи узких специализаций рассматривают только свою область компетенций, изолированную от других направлений, в то время как в теле человека все связано и причина болезни может находиться не там, где прописано в стандарте или вообще в другой медицинской области.

Как исправить ситуацию: анализ данных

Часто одни заболевания по симптоматике похожи на другие и поставить верный диагноз невозможно, особенно на ранних стадиях развития болезни. У врача нет времени днями и ночами читать научные статьи на иностранных языках, чтобы сказать пациенту с редким заболеванием или со смазанными симптомами: «В Японии был похожий случай в 2011 г. Лечили вот так и так». Врач не может за несколько минут просмотреть историю болезней пациента за всю его жизнь и найти корреляцию с его текущим состоянием. А машина может с некоторой долей вероятности.

Работа по стандарту подразумевает наличие алгоритма:

  • Узнать симптоматику.
  • Провести диагностику и сделать анализы.
  • Определить диагноз.
  • Назначить лечение.

Эти четыре шага может выполнить машина на основе массива данных.

Наука о данных использует большие объемы информации, полученной из разрозненных источников, таких как медицинские карты пациентов, результаты диагностики, планы и результаты лечения, чтобы создать базу данных симптомов и успешных планов лечения, которая поможет врачам принимать правильные решения.

Что нужно знать

  • Питон или язык R;
  • библиотеки Pandas, PyTorch, TensorFlow, Numpy, Matplotlib, Scikit-learn;
  • основы реляционных баз данных. MySQL;
  • обработку естественного языка;
  • прикладную статистику в медицине;
  • уметь визуализировать данные.

Бесплатные курсы:

Чем еще может помочь наука о данных?

1. Фармакология

В контексте фармацевтической промышленности науку о данных можно определить как дисциплину, находящуюся на стыке статистики, информатики и открытия лекарств.

Одной из основных парадигм механизма действия лекарств является теория «замка и ключа». Белок – это «замок», а поиск лекарства заключается в поиске правильного «ключа» для отпирания замка. Лекарство избирательно связывается с определенным местом в белке-мишени, ответственной за заболевание и модулирует – увеличивает или уменьшает – активность мишени.

Что нужно знать

  • Питон на продвинутом уровне;
  • создавать и оценивать модели машинного обучения;
  • обучать нейронные сети;
  • материаловедение, квантовую химию и биологию на начальном уровне.

Популярные библиотеки:

Бесплатные курсы:

2. Послеоперационный период

В послеоперационный период IoT-устройства, представленные в виде носимых устройств, могут передавать данные о сердцебиении, потреблении калорий, уровне кислорода в крови и другие медицинские параметры пользователей для контроля состояния здоровья.

Что нужно знать

  • Питон или C/C++ на среднем уровне;
  • основы схемотехники;
  • разбираться в датчиках;
  • уметь паять и собирать контроллеры самому;
  • программировать контроллеры: Arduino, ESP, STM или Raspberry Pi.

Бесплатные курсы:

3. Геномика

Геномика изучает геном – весь наследственный материал живого организма, совокупность генов. Она изучает функцию генов и строение важных белковых молекул и определяет связь между генами и заболеванием.

Что нужно знать

  • Питон на среднем+ уровне;
  • библиотеки Pandas, NumPy, SciPy, Scikit-learn, PyTorch или TensorFlow;
  • догмы молекулярной биологии;
  • алгоритмы для секвенирования ДНК;
  • математическую биологию на начальном уровне.

Популярные библиотеки:

Бесплатные курсы:

4. Распознавание изображений

Наука о данных в здравоохранении используется для поиска патологий на изображениях, полученных в результате лучевой диагностики: рентгена, КТ и МРТ.

Что нужно знать

  • Питон на среднем уровне и выше;
  • принципы ООП, библиотеки NumPy, SciPy и Scikit-learn;
  • алгоритмы и структуры данных на Python;
  • основы высшей математики;
  • уметь работать с библиотекой PyTorch или TensorFlow;
  • строить нейронные сети и проводить сегментацию изображений.

Популярные библиотеки:

Бесплатные курсы:

***

Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?

Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:

  • подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
  • углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
  • узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
  • освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.

Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ

matyushkin
07 апреля 2020

ТОП-15 книг по Python: от новичка до профессионала

Книги по Python (и связанным с ним специальным темам) на русском языке. Рас...
admin
14 июля 2017

Пишем свою нейросеть: пошаговое руководство

Отличный гайд про нейросеть от теории к практике. Вы узнаете из каких элеме...