10 марта 2023

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Веб-разработчик, фрилансер... Пишу об ИТ и смежных технологиях.
Обсудим принципы создания нейронных сетей на примере перцептрона — одного из простейших бинарных классификаторов, который отделяет два класса друг от друга.
🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Начнем разбирать нейронные сети с детской задачки, где нужно посчитать количество представленных на рисунке шаров разного цвета.

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Вы скажите, что это слишком легко даже для детей и будете правы. Но что, если мы захотим, чтобы эту задачу решил компьютер? Возможно ли это? Задавшись этим вопросом один из профессоров Корнельского университета Фрэнк Розенблатт в 1958 году продемонстрировал программу успешно отделяющую разные по форме и цвету карты (после 50 попыток), и ученые всего мира стали считать это первым шагом на пути к созданию искусственного интеллекта.

При чем здесь Персептрон?

Персептрон — один из простейших бинарных классификаторов, отделяющий два класса друг от друга после изучения их особенностей. Принцип его действия можно понять на примере небезызвестного набора данных цветка Ириса с признаками ширины, длины чашелистиков и лепестков для трех классов: Iris setosa, virginica и versicolor. Этот набор, собранный американским ботаником доктором Эдгаром Андерсоном, содержит 150 экземпляров растений, каждый из которых имеет четыре значения длины и соответствующий класс цветов.

Источник: Freepik.com
Источник: Freepik.com
Источник: Freepik.com
Источник: Freepik.com

Для простоты рассмотрим только два признака: длину лепестков (см) и длину чашелистиков (см) для двух цветков Iris setosa и Iris versicolor. И если мы нанесем эти функции на график, это будет выглядеть так:

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Внимательно изучите график и обратите внимание, что мы можем легко отделить два цветка друг от друга на основе двух характеристик.

Другими словами, можно легко провести прямую линию между ними и установить пороговые значения для двух длин для каждого из цветков. Персептрон решает эту проблему с помощью линейного уравнения. Он берет признаки экземпляра (x = {x1, x2, x3, ..., xn}) из набора данных, умножает каждое значение признака на определенный вес (w = {w1, w2, w3, . .., wn}) и добавляет к нему коэффициент смещения (b). Такая функция, h(x), сопоставляет входной вектор с результатом функции, определяющим, к какому классу принадлежит экземпляр. Если результат больше нуля, мы говорим, что экземпляр x принадлежит классу A1. В противном случае, если на выходе отрицательное число, он принадлежит к классу A2. Математически мы можем записать это так:

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Вы можете удивиться, как такой простой алгоритм почти всегда может давать правильный ответ.

Теперь можно перейти к нейронным сетям, в основе алгоритма которых и лежит, упомянутый нами выше, персептрон.

Что такое нейронные сети?

Нейронная сеть представляет собой сеть нейронов, в которой каждый нейрон ведет себя как персептрон. Алгоритм основан на работе биологической нервной системы. Он направлен на распознавание закономерности между входными характеристиками и ожидаемым выходным значением путем минимизации ошибки между прогнозируемым результатом и фактическим. И здесь нам нельзя не упомянуть такую научную концепцию как Deep Learning (Глубокое обучение).

Глубокое обучение — это область машинного обучения, состоящая из алгоритмов, имитирующих работу человеческого мозга. И в основе большинства таких алгоритмов лежит нейронная сеть, способная решить огромное количество насущных проблем человечества. От распознавания лиц и обнаружения объектов и до прогнозирования взлета и падения акций крупных компаний. К тому же современные приложения-нейросети не ограничиваются созданием изображений и чисел, теперь они стали понимать естественный язык и иногда, в некоторых сферах жизни, довольно эффективно могут заменить человека.

Популярные нейронки

О возможностях современных нейросетей можно судить по двум нашумевшим ИИ-проектам последних двух лет: Notion AI и ChatGPT. Давайте разберем каждый более подробно:

Notion AI — виртуальный помощник, использующий комбинацию обработки естественного языка и машинного обучения, необходимый для упрощения создания точного творческого контента. Известное приложение Notion, предназначенное в основном для работы с текстовыми документами, теперь претерпело существенные преобразования при помощи внедрения в него искусственного интеллекта. Инструмент использует GPT-3 (Generative Pre-trained Transformer третьего поколения) — модель, обученную с помощью интернет-данных, понимать и генерировать естественный текст на человеческом языке.

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Notion AI поможет пользователю быстрее создать нужный контент и не важно, работаете ли вы в сфере маркетинга, в качестве писателя или просто постите в соцсетях. Он способен обрабатывать данные любой направленности и автоматически извлекать основные моменты из найденного контента, генерируя сводку высокого уровня для быстрого ознакомления. В настоящее время поддерживает следующие языки: английский, корейский, китайский, японский, испанский, русский, французский, португальский, немецкий, итальянский, голландский, индонезийский и вьетнамский.

ChatGPT — новая ИИ-технология, способная генерировать разговоры с людьми в реальном времени. Инструмент уникален тем, что он может учиться на своих разговорах, что позволяет ему со временем становиться более точным.

Он использует продвинутый алгоритм глубокого обучения, позволяющий понимать контекст разговора, выдавая соответствующие ответы на основе того, что уже было сказано или задано. Из минусов нейросети можно отметить, что ответы, полученные на заданные вопросы, не всегда являются точными даже если звучат правдоподобно.

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Технология учитывает предпочтения пользователя при выдаче ответов, предоставляя любому человеку, взаимодействующему с чат-ботом, более персонализированный опыт. В дополнение к алгоритмам Deep Learning, ChatGPT использует метод обработки естественного языка (NLP) — анализ настроений, чтобы лучше определять намерения пользователя при ответе на его запросы. Также нейросеть может быть полезна для разработчиков, ведь она легко находит и исправляет ошибки в любом блоке кода, тем самым экономя драгоценное время на отладку и исправление багов вручную.

Инструмент также способен за считаные секунды создавать письменный контент: сообщения в блогах, сценарии, академические статьи, придумывать оригинальные песни и тексты. Наконец, он может объяснять слова и темы и предлагать интерпретации контента, который вы ему представляете.

Как попасть в эту сферу?

Вот смешная вакансия компании OpenAI, разработчика ChatGPT, где они ищут так называемого «инженера-выключателя», в обязанности которого входит спасение мира на случай, если что-то пойдет не так.

🤖 ChatGPT и Notion AI: что лежит в основе нейронок

Согласно содержанию документа, такой работник должен обладать недюженным терпением и нормальной психикой. Зарплата баснословная: от 300 тыс. до 500 тыс. $ в год. И несмотря на юмор, проявленный эйчарами компании при составлении вакансии — цифры здесь указываются реальные, ведь направление — очень перспективное.

Для того чтобы попасть в эту индустрию, помимо знания программирования, кандидату-соискателю обязательно нужен хороший математический фундамент, ориентированный главным образом для работы с наукой о данных. И если базовые концепции языка программирования можно освоить достаточно быстро, то с математикой могут возникнуть сложности.

Чтобы помочь вам освоить математический инструментарий, «Библиотека программиста» совместно с преподавателями ВМК МГУ разработала курс по математике для Data Science. Программа курса позволяет:

  • научиться структурно работать с большим объемом данных, решать сложные задачи и усилить свои компетенции;
  • углубиться в математический анализ, линейную алгебру, комбинаторику, теорию вероятностей и математическую статистику;
  • освоить специальную терминологию и научиться читать статьи по Data Science без постоянных обращений к поисковику;
  • подготовиться к сдаче вступительных экзаменов в Школу анализа данных Яндекса.

Курс подходит как начинающим специалистам, так и действующим программистам и аналитикам, которые хотят повысить свой уровень или перейти в новую область.

Потенциал науки о данных — огромен и специалисты с глубокими знаниями в этой области — крайне востребованы на международном рынке. Поэтому не теряйте времени, начните изучение Data Science с основ, чтобы попасть в перспективную отрасль цифровой экономики. Удачи!

МЕРОПРИЯТИЯ

Комментарии

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ