Интересное на GitHub: Алгоритм поиска Bing от Microsoft

Хочешь уверенно проходить IT-интервью?

Готовься к IT-собеседованиям уверенно с AI-тренажёром T1!

Мы понимаем, как сложно подготовиться: стресс, алгоритмы, вопросы, от которых голова идёт кругом. Но с AI тренажёром всё гораздо проще.

💡 Почему Т1 тренажёр — это мастхэв?

  • Получишь настоящую обратную связь: где затык, что подтянуть и как стать лучше
  • Научишься не только решать задачи, но и объяснять своё решение так, чтобы интервьюер сказал: "Вау!".
  • Освоишь все этапы собеседования, от вопросов по алгоритмам до диалога о твоих целях.

Зачем листать миллион туториалов? Просто зайди в Т1 тренажёр, потренируйся и уверенно удиви интервьюеров. Мы не обещаем лёгкой прогулки, но обещаем, что будешь готов!

Реклама. ООО «Смарт Гико», ИНН 7743264341. Erid 2VtzqwP8vqy


Сегодня алгоритм поиска - это больше, чем просто соответствие ключевых слов.

Алгоритм поиска Bing от Microsoft

Например, ты можешь задать вопрос, например, «Какова высота башни в Париже?» - и поиск скажет тебе, что Эйфелева башня имеет высоту 324 метра. Поисковая система может это сделать, хотя, на самом деле, точный вопрос так и не был сформулирован.

Как алгоритм поиска это делает? Как и все остальное в наши дни, поисковые системы используют машинное обучение. Машинное обучение используется для построения векторов - по существу, длинных списков чисел - которые (в некотором смысле) представляют их входные данные, будь то текст на веб-странице, изображения, звук или видео. Bing получает миллиарды таких  векторов для всех видов медиа, которые он индексирует. Для поиска векторов Microsoft использует алгоритм, который называется SPTAG («Дерево и граф пространственных разделов» - Space Partition Tree and Graph). Входной запрос преобразуется в вектор, а SPTAG используется для быстрого поиска «примерных ближайших соседей» (ANN, approximate nearest neighbors), то есть векторов, похожих на входные.

Примерно так (с огромным количеством допущений) поиск отвечает на вопрос об Эйфелевой башне. Для запроса "Какова высота башни в Париже?" ближайшие страницы будут рассказывать о башнях, Париже и о том, какой высоты вещи. В совокупности такие страницы почти наверняка будут об Эйфелевой башне.

Сегодня Microsoft опубликовала свой SPTAG-алгоритм под открытой MIT-лицензией на GitHub. Этот код уже используется для ответов на вопросы в Bing (и доступен в качестве сервиса Azure). Разработчики могут использовать этот алгоритм для быстрого поиска своих векторов. Один компьютер может обрабатывать 250 миллионов векторов и отвечать на 1,000 запросов в секунду. В AI Lab у Microsoft есть несколько примеров и пояснений.

https://youtu.be/Yl1XPoL48ZQ

Генеральный директор Microsoft Сатья Наделла неоднократно говорил о своем желании «демократизировать ИИ». Его идея сделать из ИИ не "закрытое" специализированное средство, требующее больших знаний, а доступный широкому кругу разработчиков для решения множества вопросов инструмент.

Посмотрите SPTAG на GitHub.

Что еще интересного есть на GitHub:

МЕРОПРИЯТИЯ

Комментарии

ВАКАНСИИ

Добавить вакансию
Hotel Search Team Lead (Golang)
по итогам собеседования
Golang-разработчик
Пермь, по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ