Кто сталкивался с чем-то посложнее простуды знает, что при нестандартных симптомах шансы на успешное лечение резко падают по нескольким причинам:
- Врачи работают по стандартам. С одной стороны, это хорошо, так как в основе стандарта лежит доказательная медицина и врач использует проверенную методологию. С другой стороны, тело и взаимосвязь тела и психики все еще плохо изучены, поэтому при чистых анализах и нестандартных симптомах пациенту вряд ли помогут. В таких случаях намекают на психосоматику и выписывают успокоительные средства. Таким образом врач сообщает: «не знаю, что делать».
- Ограниченное время на одного пациента. В РФ терапевту выделяется около 15 минут на пациента, за которые толком ничего не узнаешь.
- Врач может ошибиться, ведь он тоже человек. Врачебные ошибки приводят к осложнениям и в некоторых случаях к смерти в среднем у 70 тыс. россиян в год.
- Узкая специализация. Врачи узких специализаций рассматривают только свою область компетенций, изолированную от других направлений, в то время как в теле человека все связано и причина болезни может находиться не там, где прописано в стандарте или вообще в другой медицинской области.
Как исправить ситуацию: анализ данных
Часто одни заболевания по симптоматике похожи на другие и поставить верный диагноз невозможно, особенно на ранних стадиях развития болезни. У врача нет времени днями и ночами читать научные статьи на иностранных языках, чтобы сказать пациенту с редким заболеванием или со смазанными симптомами: «В Японии был похожий случай в 2011 г. Лечили вот так и так». Врач не может за несколько минут просмотреть историю болезней пациента за всю его жизнь и найти корреляцию с его текущим состоянием. А машина может с некоторой долей вероятности.
Работа по стандарту подразумевает наличие алгоритма:
- Узнать симптоматику.
- Провести диагностику и сделать анализы.
- Определить диагноз.
- Назначить лечение.
Эти четыре шага может выполнить машина на основе массива данных.
Что нужно знать
- Питон или язык R;
- библиотеки Pandas, PyTorch, TensorFlow, Numpy, Matplotlib, Scikit-learn;
- основы реляционных баз данных. MySQL;
- обработку естественного языка;
- прикладную статистику в медицине;
- уметь визуализировать данные.
Бесплатные курсы:
- Электронное здравоохранение (eHealth). Основные понятия
- Персонализированная медицина
- Биотех: ИИ в медицине
- Как построить бизнес в фармацевтике
Чем еще может помочь наука о данных?
1. Фармакология
В контексте фармацевтической промышленности науку о данных можно определить как дисциплину, находящуюся на стыке статистики, информатики и открытия лекарств.
Одной из основных парадигм механизма действия лекарств является теория «замка и ключа». Белок – это «замок», а поиск лекарства заключается в поиске правильного «ключа» для отпирания замка. Лекарство избирательно связывается с определенным местом в белке-мишени, ответственной за заболевание и модулирует – увеличивает или уменьшает – активность мишени.
Что нужно знать
- Питон на продвинутом уровне;
- создавать и оценивать модели машинного обучения;
- обучать нейронные сети;
- материаловедение, квантовую химию и биологию на начальном уровне.
Популярные библиотеки:
Бесплатные курсы:
2. Послеоперационный период
В послеоперационный период IoT-устройства, представленные в виде носимых устройств, могут передавать данные о сердцебиении, потреблении калорий, уровне кислорода в крови и другие медицинские параметры пользователей для контроля состояния здоровья.
Что нужно знать
- Питон или C/C++ на среднем уровне;
- основы схемотехники;
- разбираться в датчиках;
- уметь паять и собирать контроллеры самому;
- программировать контроллеры: Arduino, ESP, STM или Raspberry Pi.
Бесплатные курсы:
- Введение в Интернет Вещей
- Основы IoT на ArduinoUno
- Основы программирования микроконтроллеров семейства Arduino
- Основы робототехники
3. Геномика
Геномика изучает геном – весь наследственный материал живого организма, совокупность генов. Она изучает функцию генов и строение важных белковых молекул и определяет связь между генами и заболеванием.
Что нужно знать
- Питон на среднем+ уровне;
- библиотеки Pandas, NumPy, SciPy, Scikit-learn, PyTorch или TensorFlow;
- догмы молекулярной биологии;
- алгоритмы для секвенирования ДНК;
- математическую биологию на начальном уровне.
Популярные библиотеки:
Бесплатные курсы:
- Python для науки о геномных данных
- Введение в Биоинформатику: Метагеномика
- Введение в молекулярную биологию и биомедицину
4. Распознавание изображений
Наука о данных в здравоохранении используется для поиска патологий на изображениях, полученных в результате лучевой диагностики: рентгена, КТ и МРТ.
Что нужно знать
- Питон на среднем уровне и выше;
- принципы ООП, библиотеки NumPy, SciPy и Scikit-learn;
- алгоритмы и структуры данных на Python;
- основы высшей математики;
- уметь работать с библиотекой PyTorch или TensorFlow;
- строить нейронные сети и проводить сегментацию изображений.
Популярные библиотеки:
Бесплатные курсы:
Хочу подтянуть знания по математике, но не знаю, с чего начать. Что делать?
Если базовые концепции языка программирования можно достаточно быстро освоить самостоятельно, то с математикой могут возникнуть сложности. Чтобы помочь освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science, на котором вы:
- подготовитесь к сдаче вступительных экзаменов в Школу анализа данных Яндекса;
- углубитесь в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
- узнаете роль чисел, формул и функций в разработке алгоритмов машинного обучения.
- освоите специальную терминологию и сможете читать статьи по Data Science без постоянных обращений к поисковику.
Курс подойдет как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.
Комментарии