ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° (natural language processing, NLP) β ΠΎΠ±Π»Π°ΡΡΡ computer science, Π½Π°Ρ ΠΎΠ΄ΡΡΠ°ΡΡΡ Π½Π° ΡΡΡΠΊΠ΅ ΠΈΡΠΊΡΡΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅Π»Π»Π΅ΠΊΡΠ° ΠΈ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΠΊΠΈ. Π ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΎΠΌ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΠΈ NLP Π·Π°Π½ΠΈΠΌΠ°Π΅ΡΡΡ ΡΠΎΠ·Π΄Π°Π½ΠΈΠ΅ΠΌ ΡΠ΄ΠΎΠ±Π½ΡΡ ΡΠΎΡΠΌ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΡ ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ° ΠΈ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊΠ° β ΡΡΠΎΠ±Ρ ΠΊΠΎΠΌΠΏΡΡΡΠ΅Ρ ΠΌΠΎΠ³ ΠΏΠΎΠ½ΡΡΡ, ΡΡΠΎ ΠΌΡ ΠΎΡ Π½Π΅Π³ΠΎ Ρ ΠΎΡΠΈΠΌ, ΠΏΡΠΎΡΡΠΎ ΡΠΊΠ°Π·Π°Π² Π΅ΠΌΡ ΡΡΠΎ.
ΠΡΠΈΠΌΠ΅Ρ Π°Π»Π³ΠΎΡΠΈΡΠΌΠ° NLP, ΠΊ ΠΊΠΎΡΠΎΡΠΎΠΌΡ ΠΌΡ ΠΎΠ±ΡΠ°ΡΠ°Π΅ΠΌΡΡ Π΅ΠΆΠ΅Π΄Π½Π΅Π²Π½ΠΎ β ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ ΠΏΠΎΠΈΡΠΊ. ΠΠΎΠ³Π΄Π° ΠΌΡ ΡΡΠΎ-ΡΠΎ Π²Π²ΠΎΠ΄ΠΈΠΌ Π² ΠΏΠΎΠΈΡΠΊΠΎΠ²ΡΡ ΡΡΡΠΎΠΊΡ Google ΠΈΠ»ΠΈ Π―Π½Π΄Π΅ΠΊΡ, ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΡΠ΅Ρ ΡΡΡΠΎΠΊΡ Π² ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ Π² Π²ΠΈΠ΄Π΅ Π΄ΠΈΡΠΊΡΠ΅ΡΠ½ΡΡ ΡΡΡΡΠΊΡΡΡ: ΡΠ΅Π½Π·ΠΎΡΠΎΠ², Π²Π΅ΠΊΡΠΎΡΠΎΠ², Π΄Π΅ΡΠ΅Π²ΡΠ΅Π² ΠΈ Π³ΡΠ°ΡΠΎΠ². Π ΠΎΠ΄ΡΡΠ²Π΅Π½Π½ΡΠ΅ ΡΠΈΡΡΠ΅ΠΌΡ Π°Π½Π°Π»ΠΈΠ·ΠΈΡΡΡΡ ΡΠΌΠΎΡΠΈΠΎΠ½Π°Π»ΡΠ½ΡΡ ΠΎΠΊΡΠ°ΡΠΊΡ ΡΠ΅ΠΊΡΡΠ°, Π²ΡΡΠ»Π΅Π½ΠΈΡΡ ΡΠ°ΠΊΡΡ, Π³Π»Π°Π²Π½ΡΡ ΠΌΡΡΠ»Ρ ΠΈ Ρ.Π΄. ΠΠ° ΠΈ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡΡΡΡ ΡΠ΅ΠΊΡΡ, Π½ΠΎ ΠΈ Π³Π΅Π½Π΅ΡΠΈΡΡΡ Π΅Π³ΠΎ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π² ΡΠ°Ρ-Π±ΠΎΡΠ°Ρ . ΠΠ»ΠΈ ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄ΡΡ ΡΠ΅ΡΡ Ρ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π½Π° Π΄ΡΡΠ³ΠΎΠΉ.
Π ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Π½ΠΎΠΉ ΠΏΠΎΠ΄Π±ΠΎΡΠΊΠ΅ ΠΌΡ ΡΠΎΠ±ΡΠ°Π»ΠΈ Π΄Π΅ΡΡΡΠΊΡ Π°ΠΊΡΡΠ°Π»ΡΠ½ΡΡ ΠΊΠ½ΠΈΠ³, ΠΈΠ·Π΄Π°Π½Π½ΡΡ ΠΏΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎ Π² ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π΄Π²Π°-ΡΡΠΈ Π³ΠΎΠ΄Π°. Π‘ΡΠΎΠΈΡ ΠΎΠ³ΠΎΠ²ΠΎΡΠΈΡΡΡΡ, ΡΡΠΎ Π±ΠΎΠ»ΡΡΠΈΠ½ΡΡΠ²ΠΎ ΠΈΠ·Π΄Π°Π½ΠΈΠΉ Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΠΎΡΠ½ΠΎΠ²Π½ΠΎΠ³ΠΎ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° ΠΏΠΎΠ΄ΡΠ°Π·ΡΠΌΠ΅Π²Π°Π΅Ρ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΠΉ, ΠΎΠ΄Π½Π°ΠΊΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΠΎΠ΄Ρ ΠΎΠ΄Ρ ΠΏΠ΅ΡΠ΅Π½ΠΎΡΠΈΠΌΡ, β ΠΏΡΡΡΡ ΠΈ Ρ ΠΎΠ³ΠΎΠ²ΠΎΡΠΊΠ°ΠΌΠΈ β Π½Π° Π΄ΡΡΠ³ΠΈΠ΅ ΡΠ·ΡΠΊΠΈ, Π²ΠΊΠ»ΡΡΠ°Ρ ΡΡΡΡΠΊΠΈΠΉ.
NLP Π΄Π»Ρ Π½ΠΎΠ²ΠΈΡΠΊΠΎΠ²
ΠΠ΅ΠΉΠ½, Π₯Π°ΠΏΠΊΠ΅, Π₯ΠΎΠ²Π°ΡΠ΄. ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π² Π΄Π΅ΠΉΡΡΠ²ΠΈΠΈ (2020)
ΠΡΡΠΈΡΠΎΡΡΡΡΠ°Π½ΠΈΡΠ½ΠΎΠ΅ ΠΏΠΎΡΠΎΠ±ΠΈΠ΅ Natural Language Processing in Action ΠΏΠ΅ΡΠ΅Π²Π΅Π΄Π΅Π½ΠΎ ΠΈ Π²ΡΠΏΡΡΠ΅Π½ΠΎ Π² 2020 Π³. ΠΈΠ·Π΄Π°ΡΠ΅Π»ΡΡΡΠ²ΠΎΠΌ ΠΠΈΡΠ΅Ρ. ΠΡΠ½ΠΎΠ²Π½ΠΎΠΉ Π°ΠΊΡΠ΅Π½Ρ ΡΠ΄Π΅Π»Π°Π½ Π½Π° ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΡ ΡΠ΅ΠΏΠ΅ΡΡ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΠ΅Π²ΡΡ ΠΏΠΎΠ΄Ρ ΠΎΠ΄Π°Ρ . ΠΠ²ΡΠΎΡΡ ΡΡΠΏΠ΅Π»ΠΈ Π·Π°Ρ Π²Π°ΡΠΈΡΡ ΠΈ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΠΉ ΡΠ΅ΠΏΠ΅ΡΡ ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌ Π²Π½ΠΈΠΌΠ°Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΠΈΠΉΡΡ Π΄Π»Ρ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠ΅ΠΊΡΡΠ°. ΠΡΠΎΠΌΠ΅ ΠΎΠ±ΡΠΈΡ Π²ΠΎΠΏΡΠΎΡΠΎΠ² ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½Ρ Π·Π°Π΄Π°ΡΠΈ Π²ΡΠ΄Π΅Π»Π΅Π½ΠΈΡ ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½ΡΡ ΡΡΡΠ½ΠΎΡΡΠ΅ΠΉ ΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π΄ΠΈΠ°Π»ΠΎΠ³ΠΎΠ²ΡΡ ΡΠΈΡΡΠ΅ΠΌ.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- ΠΠΎΠ»ΡΡΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΊΠΎΠ΄Π° Π½Π° Python ΠΈ Π΄ΠΎΡ ΠΎΠ΄ΡΠΈΠ²ΡΡ ΠΏΠΎΡΡΠ½Π΅Π½ΠΈΠΉ.
- Π Π°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡΡΡ ΠΈ ΡΡΠ°Π΄ΠΈΡΠΈΠΎΠ½Π½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΈ ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠ΅ Π΄ΠΎΡΡΠΈΠΆΠ΅Π½ΠΈΡ ΠΎΠ±Π»Π°ΡΡΠΈ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠΎΠΏΡΠΎΡ ΡΠ°ΡΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΠΈΠ²Π°Π½ΠΈΡ Π²ΡΡΠΈΡΠ»Π΅Π½ΠΈΠΉ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½ ΡΠ»ΠΈΡΠΊΠΎΠΌ ΠΏΠΎΠ²Π΅ΡΡ Π½ΠΎΡΡΠ½ΠΎ.
Π ΠΈΠ·. ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π½Π° Java (2016)
ΠΠΏΠΈΡΠ°Π½Ρ ΠΏΡΠΎΡΡΡΠ΅ ΡΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΎΡΡ Java, ΠΏΡΠΈΠΊΠ»Π°Π΄Π½ΡΠ΅ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΡΠ΅ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΡ NLP, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ NLP API Π΄Π»Ρ ΠΏΠΎΠΈΡΠΊΠ° ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ², ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΡ ΡΠ°ΡΡΠ΅ΠΉ ΡΠ΅ΡΠΈ, ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², Π½Π°Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·Π΅ΠΉ.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- Π Π΅Π΄ΠΊΠΈΠΉ ΠΏΡΠΈΠΌΠ΅Ρ ΠΊΠ½ΠΈΠ³ΠΈ ΠΎ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ NLP-ΡΠΈΡΡΠ΅ΠΌ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Java.
- Π‘ΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Ρ ΠΌΠ½ΠΎΠ³ΠΎΡΠΈΡΠ»Π΅Π½Π½ΡΠΌΠΈ Π»ΠΈΡΡΠΈΠ½Π³Π°ΠΌΠΈ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- Π‘ΡΠ°Π²Π½ΠΈΡΠ΅Π»ΡΠ½ΠΎ Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠΉ ΠΎΠ±ΡΠ΅ΠΌ ΠΊΠ½ΠΈΠ³ΠΈ (264 Ρ.) ΠΈ ΡΠ·ΠΊΠΈΠΉ ΠΊΡΡΠ³ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°Π΅ΠΌΡΡ ΡΠ΅ΠΌ.
ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Π² ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ΅ Data Science ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊΠΎΠ²
ΠΠ°Π½Π΅Π³Π΅Π΄Π°ΡΠ°. ΠΠ±ΡΠ°Π±ΠΎΡΠΊΠ° Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° Ρ TensorFlow (2020)
TensorFlow β ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅ΒΠ½ΠΈΡ, ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½ΡΠΉ ΠΈ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅ΠΌΡΠΉ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠ΅ΠΉ Google. Π ΠΊΠ½ΠΈΠ³Π΅ ΠΎΠΏΠΈΡΠ°Π½Ρ ΠΌΠ΅ΡΠΎΠ΄Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ NLP Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΡΡΠ½ΠΊΡΠΈΠΉ TensorFlow Π΄Π»Ρ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ ΡΠ΅ΡΠ΅ΠΉ; ΡΡΡΠ°ΡΠ΅Π³ΠΈΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π±ΠΎΠ»ΡΡΠΈΡ ΠΎΠ±ΡΠ΅ΠΌΠΎΠ² Π΄Π°Π½Π½ΡΡ ΠΈ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΠ»ΠΎΠ² Π΄Π»Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π² ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡΡ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ; ΡΠ΅Ρ Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΡΠ»ΡΡΡΠ΅Π½Π½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΈ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠ΅ΠΊΡΡΠ° ΠΏΡΠΈ ΠΏΠΎΠΌΠΎΡΠΈ ΡΠ²Π΅ΡΡΠΎΡΠ½ΡΡ ΠΈ ΡΠ΅ΠΊΡΡΡΠ΅Π½ΡΠ½ΡΡ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΠ΅ΠΉ; ΠΈΡ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π΄Π»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ ΠΊΠΎΠΌΠΏΠ»Π΅ΠΊΡΠ½ΠΎΠΉ Π·Π°Π΄Π°ΡΠΈ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠ΅ΠΊΡΡΠ°; ΠΏΡΠΈΠ½ΡΠΈΠΏΡ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄Π°; ΡΠ΅Π½Π΄Π΅Π½ΡΠΈΠΈ ΠΎΠ±Π»Π°ΡΡΠΈ.
ΠΡΠΈΠ³ΠΈΠ½Π°Π» Π½Π°ΠΏΠΈΡΠ°Π½ Π² 2018 Π³., ΠΏΠ΅ΡΠ΅Π²Π΅Π΄Π΅Π½ΠΎ ΠΈ ΠΈΠ·Π΄Π°Π½ΠΎ ΠΠΠ ΠΡΠ΅ΡΡ Π² 2020 Π³.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- ΠΠΎΠ»ΡΡΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΠ΅ΡΠ΅Π²Π΅Π΄Π΅Π½Π½ΡΡ ΠΈΠ»Π»ΡΡΡΡΠ°ΡΠΈΠΉ ΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΊΠΎΠ΄Π° Π½Π° Python.
- ΠΠ°Π³Π»ΡΠ΄Π½ΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Π°, Π±Π΅Π· ΠΈΠ·Π»ΠΈΡΠ½Π΅Π³ΠΎ ΡΠΎΡΠΌΠ°Π»ΠΈΠ·ΠΌΠ°, Π½ΠΎ Ρ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ΠΈΠ΅ΠΌ ΡΠ°ΡΡΠ΅ΡΠ½ΡΡ ΡΠΎΡΠΌΡΠ», ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΎΡΠ½ΠΎΠ²Ρ Π²ΡΠ½Π΅ΡΠ΅Π½Ρ Π² ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅.
- ΠΠ½ΠΈΠΌΠ°ΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΠ΅ ΠΊ ΠΎΡΠ΅Π½ΠΊΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- Π ΡΠΈΠ»Ρ ΡΠΏΠ΅ΡΠΈΡΠΈΠΊΠΈ ΠΊΠ½ΠΈΠ³ΠΈ ΠΎΠ±ΡΠΈΠΌ Π²ΠΎΠΏΡΠΎΡΠ°ΠΌ NLP ΡΠ΄Π΅Π»Π΅Π½ΠΎ ΠΌΠ΅Π½ΡΡΠ΅Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΡΠ΅ΠΌ Π² ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Π½ΡΡ Π²ΡΡΠ΅ ΠΈΠ·Π΄Π°Π½ΠΈΡΡ .
ΠΠ°ΠΊΠΌΠ°Ρ Π°Π½, Π Π°ΠΎ. ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ PyTorch (2020)
ΠΠ½ΠΈΠ³Π° ΠΠ°ΠΊΠΌΠ°Ρ Π°Π½Π° ΠΈ Π Π°ΠΎ ΠΏΠΎΡΠ²ΡΡΠ΅Π½Π° Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΠΎΠΌΡ ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊΡ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Python β PyTorch, ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½ΠΎΠ³ΠΎ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠ΅ΠΉ Facebook. ΠΡΠΎΡ ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊ ΡΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎ Π±ΠΎΠ»Π΅Π΅ ΠΈΠ½ΡΠ΅Π³ΡΠΈΡΠΎΠ²Π°Π½ Ρ Python ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ ΡΠ»ΡΡΠ°ΡΡ ΠΎΠ±Ρ ΠΎΠ΄ΠΈΡΡΡΡ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΠΎΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΎΠΉ ΡΠ·ΡΠΊΠ°.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- ΠΠ½ΠΎΠ³ΠΎΡΠΈΡΠ»Π΅Π½Π½ΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΡ ΡΠ°Π±ΠΎΡΡ Ρ PyTorch, Π²ΡΠ»ΠΎΠΆΠ΅Π½Ρ Π½Π° GitHub.
- ΠΠΎΠ΄ΡΠΎΠ±Π½ΡΠ΅ ΠΎΠ±ΡΡΡΠ½Π΅Π½ΠΈΡ ΡΠ°Π±ΠΎΡΡ ΠΈ Π½Π°Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΎΡΡΡΠ²ΠΊΠΎΠ² ΠΊΠΎΠ΄Π°.
- ΠΠ°ΠΆΠ΄Π°Ρ Π³Π»Π°Π²Π° ΡΠ½Π°Π±ΠΆΠ΅Π½Π° ΠΈΠ»Π»ΡΡΡΡΠ°ΡΠΈΡΠΌΠΈ Ρ ΠΏΠ΅ΡΠ΅Π²Π΅Π΄Π΅Π½Π½ΡΠΌ ΡΠ΅ΠΊΡΡΠΎΠΌ ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΠ³ΡΠ°ΡΠΈΠ΅ΠΉ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠ½ΠΈΠ³Π° Π² Π±ΠΎΠ»ΡΡΠ΅ΠΉ ΠΌΠ΅ΡΠ΅ ΠΏΡΠ΅Π΄Π½Π°Π·Π½Π°ΡΠ΅Π½Π° Π΄Π»Ρ Π½ΠΎΠ²ΠΈΡΠΊΠΎΠ², ΡΠΎΠ»ΡΠΊΠΎ Π·Π½Π°ΠΊΠΎΠΌΡΡΠΈΡ ΡΡ Ρ PyTorch Π½Π° ΠΏΡΠΈΠΌΠ΅ΡΠ΅ NLP, ΠΈ ΠΏΠΎΡΡΠΎΠΌΡ ΠΌΠ΅ΡΡΠ°ΠΌΠΈ ΡΠ»ΠΈΡΠΊΠΎΠΌ ΠΌΠ½ΠΎΠ³ΠΎΡΠ»ΠΎΠ²Π½Π°.
- Π ΠΊΠΎΠ΄Π΅ Π²ΡΡΡΠ΅ΡΠ°ΡΡΡΡ Π½Π΅Π·Π½Π°ΡΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΠΎΠΏΠ΅ΡΠ°ΡΠΊΠΈ (Π²ΠΎ Π²ΡΡΠΊΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ Π² ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄Π½ΠΎΠΉ Π²Π΅ΡΡΠΈΠΈ).
Bird, Klein, Loper. Natural Language Processing with Python
NLTK β ΠΏΠ°ΠΊΠ΅Ρ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ ΠΈ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌ Π΄Π»Ρ ΡΠΈΠΌΠ²ΠΎΠ»ΡΠ½ΠΎΠΉ ΠΈ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°, Π½Π°ΠΏΠΈΡΠ°Π½Π½ΡΡ Π½Π° Python. NLTK ΡΠΎΠΏΡΠΎΠ²ΠΎΠΆΠ΄Π°Π΅ΡΡΡ ΠΎΠ±ΡΠΈΡΠ½ΠΎΠΉ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅ΠΉ, Π²ΠΊΠ»ΡΡΠ°Ρ ΠΎΠ±ΡΠ΅Π΄ΠΎΡΡΡΠΏΠ½ΡΡ ΠΊΠ½ΠΈΠ³Ρ Ρ ΠΎΠ±ΡΡΡΠ½Π΅Π½ΠΈΠ΅ΠΌ ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΉ NLP.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- NLTK ΡΠ²Π»ΡΠ΅ΡΡΡ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· ΡΠ°ΠΌΡΡ ΠΈΠ·Π²Π΅ΡΡΠ½ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ NLP Π½Π° Python, ΠΈ ΠΊΠ½ΠΈΠ³Π° Π² ΠΏΠΎΠ»Π½ΠΎΠΉ ΠΌΠ΅ΡΠ΅ ΡΠ°ΡΠΊΡΡΠ²Π°Π΅Ρ ΠΊΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π·Π°Π΄Π°ΡΠΈ, Ρ ΠΊΠΎΡΠΎΡΡΠΌΠΈ ΡΡΠ°Π»ΠΊΠΈΠ²Π°ΡΡΡΡ Π°Π½Π°Π»ΠΈΡΠΈΠΊΠΈ ΡΠ·ΡΠΊΠΎΠ²ΡΡ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ½ΡΠ΅ Π»ΠΈΠ½Π³Π²ΠΈΡΡΡ.
- ΠΠΎΡ ΠΎΠ΄ΡΠΈΠ²ΠΎΠ΅ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Ρ ΠΌΠ½ΠΎΠ³ΠΎΡΠΈΡΠ»Π΅Π½Π½ΡΠΌΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠ°ΠΌΠΈ ΠΈ ΡΠΏΡΠ°ΠΆΠ½Π΅Π½ΠΈΡΠΌΠΈ Π΄Π»Ρ ΡΠ°ΠΌΠΎΠΊΠΎΠ½ΡΡΠΎΠ»Ρ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠΎΡΠ»Π΅ Π²ΡΡ ΠΎΠ΄Π° Π±ΡΠΌΠ°ΠΆΠ½ΠΎΠΉ ΠΊΠ½ΠΈΠ³ΠΈ Π² O'Reilly (2009 Π³.) ΠΏΡΠΎΡΠ»ΠΎ ΠΌΠ½ΠΎΠ³ΠΎ Π²ΡΠ΅ΠΌΠ΅Π½ΠΈ. ΠΡΠΈΠΌΠ΅ΡΡ ΠΊΠΎΠ΄Π° Π² Π²Π΅Π±Π΅ Π°Π΄Π°ΠΏΡΠΈΡΠΎΠ²Π°Π½Ρ Π΄Π»Ρ ΡΡΠ΅ΡΡΠ΅ΠΉ Π²Π΅ΡΠΊΠΈ Python ΠΈ Π°ΠΊΡΡΠ°Π»ΡΠ½ΠΎΠΉ Π²Π΅ΡΡΠΈΠΈ NLTK. ΠΠ΄Π½Π°ΠΊΠΎ Π² ΠΎΡΡΠ°Π»ΡΠ½ΠΎΠΌ ΡΡΡΡΠΊΡΡΡΠ° ΠΊΠ½ΠΈΠ³ΠΈ Π½Π΅ ΠΌΠ΅Π½ΡΠ»Π°ΡΡ, ΠΏΠΎΡΡΠΎΠΌΡ ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΡ Π΄ΠΎΡΡΠΈΠΆΠ΅Π½ΠΈΠΉ Π² ΠΎΠ±Π»Π°ΡΡΠΈ NLP Π² Π½Π΅ΠΉ Π½Π΅ ΡΠ°ΡΠΊΡΡΡΡ.
Alex Tomas. Natural Language Processing with Spark NLP (2020)
Apache Spark β ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊ Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ Π΄Π»Ρ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠΈ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»ΡΠ½Π½ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Big Data. Spark NLP β ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡ Π΄Π»Ρ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ Apache Spark ΠΊ Π·Π°Π΄Π°ΡΠ°ΠΌ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π±ΠΎΠ»ΡΡΠΈΡ ΠΌΠ°ΡΡΠΈΠ²ΠΎΠ² ΡΠ΅ΠΊΡΡΠΎΠ²ΡΡ Π΄Π°Π½Π½ΡΡ . ΠΠ·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΠ΅ ΡΠΎ Spark NLP ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° ΠΏΡΠΈΠΌΠ΅ΡΠ΅ Python-Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ PySpark. Π ΠΏΠ΅ΡΠ²ΠΎΠΉ ΡΠ°ΡΡΠΈ ΠΊΠ½ΠΈΠ³ΠΈ Π΄Π°Π΅ΡΡΡ Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ΡΠ°Π±ΠΎΡΡ ΡΠΎ Spark, Π²ΠΎ Π²ΡΠΎΡΠΎΠΉ β ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΡΡΠΎΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π±Π»ΠΎΠΊΠΈ, Π° Π² ΡΡΠ΅ΡΡΠ΅ΠΉ ΠΈ ΡΠ΅ΡΠ²Π΅ΡΡΠΎΠΉ β ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΈ ΠΊΡΡΠΏΠ½ΡΠ΅ ΡΠΈΡΡΠ΅ΠΌΡ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Spark NLP.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- Π―ΡΠ½Π°Ρ ΠΎΡΠ³Π°Π½ΠΈΠ·Π°ΡΠΈΡ ΠΊΠ½ΠΈΠ³ΠΈ, Π±ΠΎΠ»ΡΡΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΈΠ»Π»ΡΡΡΡΠ°ΡΠΈΠΉ ΠΈ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΊΠΎΠ΄Π°.
- ΠΠ°ΡΡΠΎΠ½ΡΡΡ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π°ΡΠΏΠ΅ΠΊΡΡ ΠΈΠ½ΡΠ΅Π³ΡΠ°ΡΠΈΠΈ Spark ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠ»Π°Π²Ρ 17-19 ΡΠΎΠ²ΡΠ΅ΠΌ ΠΊΠΎΡΠΎΡΠΊΠΈΠ΅, ΠΈ Π΄Π°ΡΡ ΡΠ»ΠΈΡΠΊΠΎΠΌ ΠΎΠ±ΡΠ΅Π΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅, Π΄Π»Ρ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠΈΠΊΠΈ Π½Π΅ Ρ Π²Π°ΡΠ°Π΅Ρ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ².
ΠΡΠΎΠ΄Π²ΠΈΠ½ΡΡΡΠΉ ΡΡΠΎΠ²Π΅Π½Ρ
ΠΠΎΠ»ΡΠ΄Π±Π΅ΡΠ³. ΠΠ΅ΠΉΡΠΎΡΠ΅ΡΠ΅Π²ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ Π² ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° (2019)
ΠΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ²ΠΎ ΠΏΠΎ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡ Π½Π΅ΠΉΡΠΎΡΠ΅ΡΠ΅Π²ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ΅ Π΄Π°Π½Π½ΡΡ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°. ΠΠ΅ΡΠ΅Π²ΠΎΠ΄ Π½Π° ΡΡΡΡΠΊΠΈΠΉ ΡΠ·ΡΠΊ Π²ΡΠΏΡΡΠ΅Π½ ΠΠΠ ΠΡΠ΅ΡΡ Π² 2019 Π³. ΠΏΠΎ ΠΈΠ·Π΄Π°Π½ΠΈΡ 2017 Π³. ΠΠ½ΠΈΠ³Π° ΡΠ°Π·Π΄Π΅Π»Π΅Π½Π° Π½Π° ΡΠ΅ΡΡΡΠ΅ ΡΠ°ΡΡΠΈ: 1) ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ Ρ ΡΡΠΈΡΠ΅Π»Π΅ΠΌ ΠΈ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΠ΅ ΡΠ΅ΡΠΈ ΠΏΡΡΠΌΠΎΠ³ΠΎ ΡΠ°ΡΠΏΡΠΎΡΡΡΠ°Π½Π΅Π½ΠΈΡ, 2) ΡΠ°Π±ΠΎΡΠ° Ρ Π΄Π°Π½Π½ΡΠΌΠΈ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ°, 3) ΡΠΏΠ΅ΡΠΈΠ°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΡ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΡ ΡΠ΅ΡΠ΅ΠΉ, 4) Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΡΠ΅ΠΌΡ. ΠΠ»Ρ ΠΏΡΠΎΡΡΠ΅Π½ΠΈΡ ΠΆΠ΅Π»Π°ΡΠ΅Π»ΡΠ½Ρ Π±Π°Π·ΠΎΠ²ΡΠ΅ Π·Π½Π°Π½ΠΈΡ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°Π»Π³Π΅Π±ΡΡ ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΉ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ Π½ΠΎΡΠ°ΡΠΈΠΈ.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- Π‘ΡΡΠΎΠ³ΠΈΠΉ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ ΠΊ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Π° ΡΠΎ ΡΡΡΠ»ΠΊΠ°ΠΌΠΈ Π½Π° ΠΎΡΠΈΠ³ΠΈΠ½Π°Π»ΡΠ½ΡΠ΅ Π½Π°ΡΡΠ½ΡΠ΅ ΠΏΡΠ±Π»ΠΈΠΊΠ°ΡΠΈΠΈ.
- ΠΠΌΠΊΠΎΠ΅, Π½Π΅ Β«ΡΠ°Π·Π΄ΡΡΠΎΠ΅Β» ΠΎΠΏΠΈΡΠ°Π½ΠΈΠ΅ ΠΊΠ»ΡΡΠ΅Π²ΡΡ ΠΊΠΎΠ½ΡΠ΅ΠΏΡΠΈΠΉ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠ΅ΡΠ²Π°Ρ ΡΠ°ΡΡΡ Π΄Π°Π΅Ρ Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ»ΠΎΠ³ΠΈΡ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ. Π Π°ΡΡΠΌΠΎΡΡΠ΅Π½ΠΈΠ΅ NLP Π½Π°ΡΠΈΠ½Π°Π΅ΡΡΡ ΡΠΎΠ»ΡΠΊΠΎ ΡΠΎ Π²ΡΠΎΡΠΎΠΉ Π³Π»Π°Π²Ρ. ΠΠΎ ΡΠ°ΠΊΠΎΠ² ΠΏΠΎΠ΄Ρ ΠΎΠ΄ ΠΊ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Π° β ΠΊΡΠΎ Π·Π½Π°ΠΊΠΎΠΌ Ρ ΠΌΠ°ΡΠΈΠ½Π½ΡΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ΠΌ, ΠΌΠΎΠΆΠ΅Ρ ΡΡΡ Π³Π»Π°Π²Ρ ΠΏΡΠΎΠΏΡΡΡΠΈΡΡ.
- ΠΠ΅ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡΡΡ Π°Π½Π½ΠΎΡΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π΄Π°Π½Π½ΡΡ ΠΈ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Π΄Π»Ρ ΠΎΡΠ΅Π½ΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΡΠ°Π±ΠΎΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ².
Jurafsky, Martin. Speech and Language Processing (2020)
Π‘Π²ΠΎΠ΅ΠΎΠ±ΡΠ°Π·Π½Π°Ρ Π±ΠΈΠ±Π»ΠΈΡ NLP β ΡΠ΅Π³ΡΠ»ΡΡΠ½ΠΎ ΠΎΠ±Π½ΠΎΠ²Π»ΡΠ΅ΠΌΠ°Ρ ΠΎΠ½Π»Π°ΠΉΠ½-ΠΊΠ½ΠΈΠ³Π° ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ Π² ΠΎΠ±Π»Π°ΡΡΠΈ NLP ΠΈ ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ½ΠΎΠΉ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΠΊΠΈ ΠΡΠ½Π° ΠΡΡΠ°ΡΡΠΊΠΈ (Π‘ΡΡΠ½ΡΠΎΡΠ΄) ΠΈ ΠΠΆΠ΅ΠΉΠΌΡΠ° ΠΠ°ΡΡΠΈΠ½Π° (ΡΠ½ΠΈΠ²Π΅ΡΡΠΈΡΠ΅Ρ ΠΠΎΠ»ΠΎΡΠ°Π΄ΠΎ).
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- Π¨ΠΈΡΠΎΠΊΠΈΠΉ ΠΊΡΡΠ³ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°Π΅ΠΌΡΡ ΡΠ΅ΠΌ ΡΠΎ ΡΡΡΠ»ΠΊΠ°ΠΌΠΈ Π½Π° ΠΏΠ΅ΡΠ²ΠΎΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΈ ΠΈ ΠΊΡΠ°ΡΠΊΠΎΠΉ ΠΈΡΡΠΎΡΠΈΠ΅ΠΉ ΡΠ°Π·Π²ΠΈΡΠΈΡ Π²ΠΎΠΏΡΠΎΡΠ°.
- ΠΠΌΠΊΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Π°.
- ΠΠ΅ΠΊΠΎΡΠΎΡΡΠ΅ Π³Π»Π°Π²Ρ ΡΠΎΠΏΡΠΎΠ²ΠΎΠΆΠ΄Π°ΡΡΡΡ ΡΠΏΡΠ°ΠΆΠ½Π΅Π½ΠΈΡΠΌΠΈ Π΄Π»Ρ ΡΠ°ΠΌΠΎΠΊΠΎΠ½ΡΡΠΎΠ»Ρ.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- Π ΠΏΠ»Π°Π½Π΅ ΠΊΠΎΠ΄Π° ΠΊΠ½ΠΈΠ³Π° Π½Π΅ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ Π³ΠΎΡΠΎΠ²ΡΡ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΡΡ ΡΠ΅ΡΠ΅Π½ΠΈΠΉ. ΠΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ ΠΏΡΠ΅Π²Π΄ΠΎΠΊΠΎΠ΄ ΠΈΠ»ΠΈ ΠΌΠ°ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ ΠΊ ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. ΠΠ΄Π½Π°ΠΊΠΎ ΠΈ ΡΠ°ΠΌΠ° ΠΊΠ½ΠΈΠ³Π° Π½ΠΎΡΠΈΡ ΡΡΠ½Π΄Π°ΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΡΠΉ Ρ Π°ΡΠ°ΠΊΡΠ΅Ρ.
Rothman. Transformers for Natural Language Processing (2021)
ΠΠ½ΠΈΠ³Π° ΠΏΡΠΎΡΠ΅ΡΡΠΎΡΠ° Π‘ΠΎΡΠ±ΠΎΠ½Π½Ρ ΠΠ΅Π½ΠΈΡΠ° Π ΠΎΡΠΌΠ°Π½Π° ΠΏΠΎΡΠ²ΡΡΠ΅Π½Π° ΠΈΡΠΊΠ»ΡΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΎΠ΄Π½ΠΎΠΉ ΡΠ΅ΠΌΠ΅ β ΡΠ΅ΠΌΠ΅ΠΉΡΡΠ²Ρ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π²ΡΡΡΡΡ Π½ΡΠ²ΡΠΈΡ Π² ΠΊΠΎΠ½ΡΠ΅ Π΄Π΅ΡΡΡΡΡ Π³ΠΎΠ΄ΠΎΠ² ΠΎΠ±Π»Π°ΡΡΡ NLP β ΠΌΠΎΠ΄Π΅Π»ΡΠΌ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΠΌ Π½Π° ΠΌΠ΅Ρ Π°Π½ΠΈΠ·ΠΌΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΡ ΠΈ Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ΅ Transformer. ΠΡΠ»ΠΈ Ρ Π²Π°Ρ Π΅ΡΡΡ ΠΎΠΏΡΡ Π² NLP ΠΈ Π²Ρ Ρ ΠΎΡΠΈΡΠ΅ Π½Π° ΠΏΡΠ°ΠΊΡΠΈΠΊΠ΅ ΡΠ°Π·ΠΎΠ±ΡΠ°ΡΡΡΡ Π² ΡΠ΅ΠΊΡΡΠ΅ΠΌ state-of-the-art, ΠΊΠ½ΠΈΠ³Π° Π ΠΎΡΠΌΠ°Π½Π° ΡΡΠ°Π½Π΅Ρ ΠΎΡΠ»ΠΈΡΠ½ΡΠΌ Π²ΡΠ±ΠΎΡΠΎΠΌ.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- ΠΠ° ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²Π΅ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΊΠΎΠ΄Π° Python ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π½ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (ΠΈ ΠΈΡ Π²Π°ΡΠΈΠ°ΡΠΈΠΉ) BERT, GLUE, GPT-2 Π½Π° GPU, Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅ ΠΈ Π·Π°Π΄Π°ΡΠΈ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ ΡΠ΅ΠΊΡΡΠ°.
ΠΠ΅Π΄ΠΎΡΡΠ°ΡΠΊΠΈ
- ΠΠ΅ΡΡΠ°ΠΌΠΈ ΠΊΠΎΠ΄ ΠΏΡΠ΅Π²Π°Π»ΠΈΡΡΠ΅Ρ Π½Π°Π΄ ΠΏΠΎΡΡΠ½Π΅Π½ΠΈΡΠΌΠΈ β ΠΆΠ΅Π»Π°ΡΠ΅Π»ΡΠ½ΠΎ ΠΈΠΌΠ΅ΡΡ ΠΎΠ±ΡΠ΅Π΅ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΠ΅ ΠΎ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ, ΡΠΌΠ΅ΡΡ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ Jupyter ΠΈ Data Science Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ°ΠΌΠΈ.
Vajjala ΠΈ Π΄Ρ. Practical Natural Language Processing (2020)
ΠΠ½ΠΈΠ³Π° ΡΠ°Π·Π΄Π΅Π»Π΅Π½Π° Π½Π° ΡΠ΅ΡΡΡΠ΅ ΡΠ°ΡΡΠΈ: Π²Π²Π΅Π΄Π΅Π½ΠΈΠ΅, ΠΎΡΠ½ΠΎΠ²Ρ, ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ, ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Ρ. Π ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΡΠ·ΡΠΊΠ° ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΏΡΠΈΠΌΠ΅Π½ΡΠ΅ΡΡΡ Python. ΠΠΎΠ»ΡΡΠΎΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΡΠ΄Π΅Π»Π΅Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ NLP ΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Π° ΠΏΡΠΎΠ΅ΠΊΡΠ° ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ β ΠΎΡ ΠΏΠΎΠ»ΡΡΠ΅Π½ΠΈΡ Π΄Π°Π½Π½ΡΡ Π½Π° Π²Ρ ΠΎΠ΄Π΅ Π΄ΠΎ ΡΡΠ΅Π±ΡΠ΅ΠΌΠΎΠ³ΠΎ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ°.
ΠΡΠ΅ΠΈΠΌΡΡΠ΅ΡΡΠ²Π°
- Π‘ΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅, ΠΌΠ½ΠΎΠ³ΠΎΡΠΈΡΠ»Π΅Π½Π½ΡΠ΅ ΡΠ²Π΅ΡΠ½ΡΠ΅ ΠΈΠ»Π»ΡΡΡΡΠ°ΡΠΈΠΈ, ΡΡΡΠ»ΠΊΠΈ Π½Π° Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΡ Π»ΠΈΡΠ΅ΡΠ°ΡΡΡΡ.
- ΠΠ°ΡΠ΅Π»Π΅Π½Π½ΠΎΡΡΡ Π½Π° ΠΏΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΈ ΡΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΊΠΎΠΌΠΌΠ΅ΡΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΏΡΠΎΠ΄ΡΠΊΡΠ°, ΠΌΠ½ΠΎΠΆΠ΅ΡΡΠ²ΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ NLP.
Π§ΡΠΎΠ±Ρ ΠΎΡΡΠ°Π²Π°ΡΡΡΡ Π² ΠΊΡΡΡΠ΅ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ ΠΈ Π½ΠΎΠ²ΡΡ ΠΊΠ½ΠΈΠ³ ΠΌΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΠΌ ΠΏΠΎΠ΄ΠΏΠΈΡΠ°ΡΡΡΡ Π½Π° ΡΠ΅Π»Π΅Π³ΡΠ°ΠΌ-ΠΊΠ°Π½Π°Π»Ρ ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° Data Scientist'Π° (@dsproglib) ΠΈ ΠΠ½ΠΈΠ³ΠΈ Π΄Π»Ρ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΈΡΡΠ° (@progbook).
ΠΠ΅ ΡΡΠ΅ΡΠ½ΡΠΉΡΠ΅ΡΡ ΠΏΠΎΠ΄Π΅Π»ΠΈΡΡΡΡ Π² ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΡΡ ΡΠ²ΠΎΠΈΠΌΠΈ Π»ΡΠ±ΡΠΌΠΈ ΠΏΠΎΡΠΎΠ±ΠΈΡΠΌΠΈ ΠΏΠΎ NLP.