Обработка естественного языка: с чего начать и что изучать дальше

1
11704
Добавить в избранное

Если вас интересует, что такое обработка естественного языка, как в ней разобраться и  как начать его использовать, то эта статья для вас.

Где-то я читала, что если ты встречаешь какой-то вопрос дважды, то возможно хорошая идея — написать об этом в блог. Следуя этому правилу и желанию сохранить в будущем немного времени, вот мой ответ на стандартный вопрос: «Я изучал *такую-то* науку и мне интересно NLP (Natural Language Processing — обработка естественного языка), как мне начать его изучать?»

 

Перед тем, как вы начнёте, хочу заметить, что приведённый ниже список скорее всего является неполным и служит лишь отправной точкой. Для лучшего ориентирования в потоке информации также приведены краткое описание и оценка сложности. Рекомендуется иметь базовые навыки программирования (например, на Python).

Онлайн курсы

Библиотеки и открытые ресурсы

  • spaCy (websiteblog) — Python; новая открытая библиотека с превосходными примерами, API документацией и демо-приложениями.
  • Natural Language Toolkit (NLTK) (websitebook) — Python; практическое введение в программирование для NLP, в основном используемое для обучения.
  • Stanford CoreNLP (website) — Java; высококачественный инструментарий для анализа.

Блоги

Книги

Другие источники

Что вы можете сделать сами?

  • Создайте определитель частей речи с использованием скрытой Марковской модели.
  • Используйте алгоритм Кока — Янгера — Касами для распознавания контекстно-свободных грамматик.
  • Проанализируйте семантическое сходство между двумя словами в тексте.
  • Попробуйте использовать Наивный байесовский классификатор, чтобы фильтровать спам.
  • Используйте систему проверки правописания, основанную на алгоритме вычисления расстояния редактирования.
  • Изучите тематическое моделирование с использованием латентного размещения Дирихле

Автор: Melanie Tosik

Обработка естественного языка: другие материалы по теме

Основы машинного обучения за неделю

 

Интересуетесь Data Science?

Подпишитесь на нашу рассылку, чтобы получать больше интересных материалов:

И не беспокойтесь, мы тоже не любим спам. Отписаться можно в любое время.




Один комментарий

  1. Может найдётся время. Я новичок, вчера купил Обработка естественного языка на Java Автор Ричард Риз
    И в чём суть терминологии ? Deep Learning и не дип.
    Читаем : Artificial Intelligence (AI) and Machine Learning (ML) are some of the hottest topics right now.
    Artificial Intelligence vs Machine Learning
    Если это объективные трудности ? А вдруг нет. А эта статья перекочёвывает на другие интернет-источники

    Компании борются за программистов, способных писать код для машинного обучения и глубокого обучения. Если вам интересны эти темы, возможно, стоит присмотреться к лучшим библиотекам Java, посвящённым машинному обучению, уже сегодня? Эллеонора Керри ( автор топика ) возможно не знает, что 5 лет уходит на изучение этой темы. Поэтому сейчас образовался дефицит специалистов.
    С уважением. Сергей. Мой почтовый адрес [email protected]

Добавить комментарий