Спонсорский материал

? Сможет ли программа заменить Data Scientist: платформы для машинного обучения без программирования

Было бы здорово, если бы модель машинного обучения можно было просто перетащить иконкой в проект, drag-and-drop. Стоп… но ведь такое уже есть! Рассказываем о восьми сервисах автоматизации задач Data Science.

Искусственный интеллект (ИИ) уже давно не только забава. С помощью ИИ создают новые лекарства и материалы, детектируют и классифицируют объекты на фотографиях, распознают скрытые паттерны в массивах данных и оптимизирует процессы финансового управления.

Однако залогом успешного результата применения ИИ является квалифицированное обучение моделей машинного обучения. Соответствующая потребность в аналитиках данных привела к стремительному росту стоимости их работы. Но далеко не каждый проект может позволить себе дата-сайентиста, а тем более – команду специалистов.

Как следствие, развитие получили средства ИИ, не требующие познаний в Data Science – NoCode-платформы. В таких системах ключевые этапы обработки данных визуализированы и «упакованы» во встраиваемые готовые решения. Никаких сложных математических моделей и многострочного кода.

За счет NoCode-платформ компании могут создавать и использовать собственные наборы данных, обучать и развертывать модели с минимальными познаниями в программировании или даже вовсе без них. Это отличный вариант и для продвинутых разработчиков – во всякой области есть своя специфика, а для изучения Data Science нужно немало времени. Например, мобильные разработчики могут использовать NoCode-системы, чтобы внедрить технологии машинного обучения в приложения. Понимая специфику использования программ на смартфонах, они лучше осознают, как построить обучение и использовать такие алгоритмы.

Далее мы рассмотрим несколько примеров NoCode-инструментов машинного обучения, доступных уже сейчас. Некоторые из них бесплатны, другие взимают плату при выходе за бесплатный лимит пробной версии. Но все они позволяют лучше понять возможности Data Science и попробовать эти технологии на практике в повседневных задачах.

Материал подготовлен при поддержке онлайн-школы SkillFactory – экспертов по образованию в IT и Data Science. В школе ведется набор на курс «Data Science с нуля». Студенты получат необходимые для освоения профессии знания, а также консультации специалистов карьерного центра по составлению резюме, поиску вакансий и прохождению собеседований.

1. Apple: Create ML

Одним из свежих коммерческих внедрений NoCode-идей стал инструмент CreateML, поставляемый в числе Developer Tools для среды разработки Xcode (начиная с 11-й версии). Есть набор предобученных шаблонизированных моделей, достаточно лишь выбрать тип модели и передать в требуемом формате данные для обучения и теста: таблицы, текст, изображения, звук или видео.

В соответствии с перечисленными видами данных можно создать классификатор изображений, модель переноса стиля, обработчик текста, систему рекомендаций и т. д. Для ограничения времени обучения задается число итераций или требуемое значение показателя метрики.

В результате работы CreateML будет создана CoreML-модель, которую можно развертывать в собственных приложениях. CoreML-модели оптимизированы для работы на устройствах Apple с учетом объема памяти и энергопотребления.

2. Google: AutoML

Cloud AutoML от Google умеет примерно то же самое, что CreateML от Apple, но все делает в облаке. Есть и аналогичное категориальное разделение: инструмент позволяет проводить классификацию изображений, обработку естественного языка, перевод текстов, обработку табличных данных, изображений и видео. Облачный AutoML устраняет не только необходимость знания алгоритмов машинного обучения, но и проблемы с хранением информации.

Обученные модели можно экспортировать в форматы .pb, TensorFlow Lite (.tflite), CoreML (то есть формат Apple) и др.

3. Сегментация изображений: MakeML

MakeML – NoCode-инструмент создания моделей детектирования и сегментации изображений, аннотации объектов, управления соответствующими наборами данных.

На платформе есть хранилище датасетов, в том числе бесплатные наборы данных для задач компьютерного зрения и обучения нейронных сетей. Там же имеется множество туториалов для разработчиков, еще не сталкивавшихся с машинным обучением.

Кстати, если хочется изучить эти вопросы детальнее, то освоить соответствующие нейросетевые алгоритмы и создать собственный проект по компьютерному зрению, можно на 3-м и 4-м семестрах курса Data Science от SkillFactory. Там же присутствует и соответствующий кейс по распознаванию объектов на фотографиях с помощью алгоритмов глубокого обучения. Такую модель можно связать с сервером и обернуть в телеграм-бота.

4. Мобильные приложения: Fritz AI

Fritz AI – платформа машинного обучения, нацеленная на преодоление разрыва между разработчиками мобильных приложений и аналитиками данных. Разработчики iOS и Android смогут быстро обучить и развернуть модель или даже использовать уже обученный SDK с поддержкой анализа изображений.

Есть инструменты аннотации и синтетические данные для создания собственных датасетов. Платформа предоставляет решения для дообучения моделей, аналитики, простого развертывания и защиты информации от злоумышленников.

5. Генерация контента: RunwayML

RunwayML – платформа машинного обучения для создателей контента. Есть интерфейс для быстрого обучения моделей: от генерации текста и изображений до захвата движения, обнаружения объектов и т. д. Имеются модели для переноса стиля и удаления фона.

Хотя за экспорт моделей из приложения взимается плата, обученную генеративно-состязательную нейросеть можно бесплатно использовать для синтеза новых изображений. Приложение доступно на macOS, Windows и в браузере (на стадии бета-тестирования).

6. Табличные данные: Obviously AI

Obviously AI используется для решения задач с пользовательскими данными в табличном-формате CSV. Загружаем набор данных и выбираем столбец переменной, для которой хотим сделать прогноз. Вводим на обычном, естественном языке вопрос – что мы хотим узнать, например, каким будет доход в следующем месяце или как изменится спрос на товар. Платформа самостоятельно выбирает подходящий алгоритм и обучает модель.

В результате мы получаем прогностический отчет, даже не задумываясь о том, что такое регрессия, решающие деревья или метод наименьших квадратов. Но, конечно, сами эти модели очень важны, и после детального изучения и практики не покажутся такими уж сложными. О соответствующих библиотеках для анализа данных рассказывается на втором семестре курса Профессия Data Scientist.

7. Предварительная обработка изображений: SuperAnnotate

Помимо обучения модели, при разработке проектов машинного обучения существенное время отнимает предобработка данных, их очистка и маркировка. Особенно когда дело касается тысяч изображений. SuperAnnotate – платформа для ускорения процесса аннотации данных с помощью готовых прогностических моделей.

Создание наборов данных для обнаружения объектов и сегментации изображений станет проще и быстрее. Особенно хорошо командой продумана работа с видеоданными.

8. Teachable Machine

Teachable Machine – еще одна NoCode-платформа машинного обучения от программистов Google. В отличие от AutoML – инструмента, заточенного под разработчиков – Teachable Machine легко обучить прямо в браузере. Сейчас можно тренировать модели распознавать изображения, звуки и позы.

Обучение проводится как на загружаемых файлах, так и с помощью веб-камеры. Teachable Machine использует библиотеку Tensorflow.js и гарантирует, что данные об обучении останутся на устройстве. Окончательную модель можно экспортировать в форматы Tensorflow.js или tflite и использовать на собственном веб-сайте или в приложении.

Заключение

Хотя универсального решения не существует, вы всегда можете выбрать платформу исходя из текущих потребностей и знаний в области. Конечно, в NoCode-платформах машинное обучение никуда не исчезает – просто спрятано под капотом. Чтобы построить более гибкую систему, необходимо познакомиться со спрятанными внутри таких платформ алгоритмами. Если некоторые знания о профессии у вас уже есть, достаточно их систематизировать. А если вы находитесь в самом начале пути, во всём разобраться помогут квалифицированные наставники с опытом в индустрии.

Наши коллеги из Skillfactory запускают курс, на котором учат профессии Data Scientist с нуля. В нем есть все необходимые уроки, кейсы и тренажеры. С первых недель обучения ментор помогает определить карьерные цели и не сойти с намеченного пути, а карьерный центр подскажет, как оформить резюме и попасть на собеседование.

Классный специалист по Data Science нужен вне зависимости от индустрии, а спрос на рынке труда, как мы заметили в начале статьи, значительно превышает предложение.

Источники

РУБРИКИ В СТАТЬЕ

МЕРОПРИЯТИЯ

Комментарии 0

ВАКАНСИИ

Ведущий программист Unity3D
Москва, по итогам собеседования
Unity3D Developer (Middle/Senior)
Ростов-на-Дону, по итогам собеседования
Unity Tech Lead
по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ

BUG