Π§ΡΠΎ ΡΠ°ΠΊΠΎΠ΅ Kaggle?
ΠΠ΅ΡΠ΅Π΄ ΡΠ΅ΠΌ, ΠΊΠ°ΠΊ Π½Π°ΡΠ°ΡΡ ΡΠ°Π±ΠΎΡΠ°ΡΡ, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ Π·Π°ΡΠ΅Π³ΠΈΡΡΡΠΈΡΠΎΠ²Π°ΡΡΡΡ Π½Π° ΡΠ°ΠΉΡΠ΅. ΠΠ°Ρ ΠΎΠ΄ΠΈΠΌ ΠΏΠΎ ΡΡΡΠ»ΠΊΠ΅, Π½Π°Ρ ΠΎΠ΄ΠΈΠΌ ΠΊΠ½ΠΎΠΏΠΊΡ Register ΠΈ Π·Π°ΠΏΠΎΠ»Π½ΡΠ΅ΠΌ ΠΏΠΎΠ»Ρ. Π£Π²Π΅ΡΠ΅Π½, ΡΡΠΎ Π²Ρ ΡΠ°ΠΌΠΈ Ρ ΡΡΠΈΠΌ ΠΎΡΠ»ΠΈΡΠ½ΠΎ ΡΠΏΡΠ°Π²ΠΈΡΠ΅ΡΡ. ΠΠΎΡΠ»Π΅ ΡΠ΅Π³ΠΈΡΡΡΠ°ΡΠΈΠΈ, ΠΏΠΎΠ΄ΡΠ²Π΅ΡΠΆΠ΄Π΅Π½ΠΈΡ ΠΈ Π»ΠΎΠ³ΠΈΠ½Π° ΠΏΠΎΠΏΠ°Π΄Π°Π΅ΠΌ Π½Π° Π³Π»Π°Π²Π½ΡΡ ΡΡΡΠ°Π½ΠΈΡΡ ΡΠ΅ΡΡΡΡΠ°.
Π‘Π»Π΅Π²Π° Π² ΡΡΠΎΠ»Π±ΡΠ΅ ΠΌΡ Π²ΠΈΠ΄ΠΈΠΌ ΡΠ°Π·Π΄Π΅Π»Ρ:
- Home β Π½ΠΎΠ²ΠΎΡΡΠ½Π°Ρ Π»Π΅Π½ΡΠ°, Π² ΠΊΠΎΡΠΎΡΡΡ ΠΏΠΎΠΏΠ°Π΄Π°ΡΡ ΠΏΡΠ±Π»ΠΈΠΊΠ°ΡΠΈΠΈ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠ³ΡΡ Π²Π°Ρ Π·Π°ΠΈΠ½ΡΠ΅ΡΠ΅ΡΠΎΠ²Π°ΡΡ. Π§Π΅ΠΌ Π²ΡΡΠ΅ Π°ΠΊΡΠΈΠ²Π½ΠΎΡΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ Π½Π° ΡΠ°ΠΉΡΠ΅, ΡΠ΅ΠΌ ΡΠΎΡΠ½Π΅Π΅ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΈ.
- Competitions β ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΡ Π² ΠΎΠ±Π»Π°ΡΡΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ . ΠΠ΄Π΅ΡΡ ΠΆΠ΅ Π½Π°Ρ ΠΎΠ΄ΡΡΡΡ ΡΡΠ΅Π±Π½ΡΠ΅ ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΠΎΠΌΠ΅ΡΠ΅Π½Ρ ΡΠ»ΠΎΠ²ΠΎΠΌ Knowledge.
- Datasets β ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ Π½Π°Π±ΠΎΡΡ Π΄Π°Π½Π½ΡΡ , Ρ ΠΊΠΎΡΠΎΡΡΠΌΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠΈΠ³ΡΠ°ΡΡΡΡ. Π’Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π²ΡΠΊΠ»Π°Π΄ΡΠ²Π°ΡΡ ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΡΠ΅ Π΄Π°ΡΠ°ΡΠ΅ΡΡ.
- Code β ΡΠ°Π·Π΄Π΅Π», Π² ΠΊΠΎΡΠΎΡΠΎΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°ΡΡ Jupyter Notebook ΠΈΠ»ΠΈ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ ΡΡΠΆΠΎΠΉ.
- Discussions β ΠΌΠ΅ΡΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΎΠ³ ΡΠΎΡΡΠΌΠΎΠ².
- Courses β ΡΡΠ΅Π±Π½ΡΠ΅ ΠΊΡΡΡΡ. ΠΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ ΠΏΡΠΈΠ»ΠΈΡΠ½ΡΠΉ ΠΎΠ±ΡΠ΅ΠΌ ΠΈ ΠΏΡΠΈΠ΅ΠΌΠ»Π΅ΠΌΠΎΠ΅ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ. Π Π°ΡΠΊΡΡΡΡ ΠΎΡΠ½ΠΎΠ²Π½ΡΠ΅ Π±Π°Π·ΠΎΠ²ΡΠ΅ ΡΠ°Π·Π΄Π΅Π»Ρ ML.
ΠΡΠ²Π»Π΅ΡΠ΅ΠΌΡΡ ΠΏΠΎΠΊΠ° ΠΎΡ Kaggle ΠΈ ΠΏΠΎΠ³ΠΎΠ²ΠΎΡΠΈΠΌ ΠΎ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ, Π° ΡΠ°ΠΊΠΆΠ΅ ΠΎ ΡΠ΅ΡΠ°Π΅ΠΌΡΡ Ρ Π΅Π³ΠΎ ΠΏΠΎΠΌΠΎΡΡΡ Π·Π°Π΄Π°ΡΠ°Ρ .
Π’Π΅ΠΎΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΌΠΈΠ½ΠΈΠΌΡΠΌ ΠΎ Machine Learning
Π‘ΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ ΠΎΠ³ΡΠΎΠΌΠ½ΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ. ΠΠ΄Π΅ΡΡ Ρ ΠΏΠΎΠΊΠ°ΠΆΡ Π²ΡΠ΅Π³ΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ°ΠΌΡΡ Π±Π°Π·ΠΎΠ²ΡΡ , Π° ΠΎΡΡΠ°Π»ΡΠ½ΡΠ΅ Π²Ρ ΡΠΌΠΎΠΆΠ΅ΡΠ΅ Π½Π°ΠΉΡΠΈ ΡΠ°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎ, ΠΏΡΠΎΠΉΠ΄Ρ ΠΏΠΎ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΠΎΠ²Π°Π½Π½ΡΠΌ ΡΡΡΠ»ΠΊΠ°ΠΌ Π² ΠΊΠΎΠ½ΡΠ΅.
ΠΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ ML ΠΌΠΎΠΆΠ½ΠΎ ΡΠ°Π·Π΄Π΅Π»ΠΈΡΡ Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΊΡΡΠΏΠ½ΡΡ Π³ΡΡΠΏΠΏ:
- ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅ Ρ ΡΡΠΈΡΠ΅Π»Π΅ΠΌ (ΠΎΡ Π°Π½Π³Π». Supervised learning) β Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΠΈΠ· ΡΡΠΎΠΉ Π³ΡΡΠΏΠΏΡ ΠΎΠ±ΡΡΠ°ΡΡΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π·Π°ΡΠ°Π½Π΅Π΅ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²Π»Π΅Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ , ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠΎΠ΄Π΅ΡΠΆΠ°Ρ ΠΊΠ°ΠΊ Π½Π°Π±ΠΎΡΡ Π²Ρ ΠΎΠ΄Π½ΡΡ ΠΈΡΡΠ»Π΅Π΄ΡΠ΅ΠΌΡΡ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ², ΡΠ°ΠΊ ΠΈ βΠΎΡΠ²Π΅ΡΡβ Π½Π° ΡΡΠΈ Π½Π°Π±ΠΎΡΡ. βΠΡΠ²Π΅ΡΠΎΠΌβ ΡΠ²Π»ΡΠ΅ΡΡΡ Π²ΡΡ ΠΎΠ΄Π½ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅, ΠΊΠΎΡΠΎΡΠΎΠ΅ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π²ΡΠ΄Π°ΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ ΡΠ²ΠΎΠ΅ΠΉ ΡΠ°Π±ΠΎΡΡ, Ρ.Π΅. Π°Π»Π³ΠΎΡΠΈΡΠΌ βΠΎΠ±ΡΡΠ°Π΅ΡΡΡβ. Π ΡΡΠΎΠΉ Π³ΡΡΠΏΠΏΠ΅, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡΠ½Π΅ΡΡΠΈ Π·Π°Π΄Π°ΡΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΈ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ.
- ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π±Π΅Π· ΡΡΠΈΡΠ΅Π»Ρ (ΠΎΡ Π°Π½Π³Π». Unsupervised learning) β Π³ΡΡΠΏΠΏΠ° Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ², Π² ΠΊΠΎΡΠΎΡΡΡ ΡΠΈΡΡΠ΅ΠΌΠ° ΡΠΏΠΎΠ½ΡΠ°Π½Π½ΠΎ ΠΎΠ±ΡΡΠ°Π΅ΡΡΡ Π½Π° Π²Ρ ΠΎΠ΄Π½ΡΡ Π΄Π°Π½Π½ΡΡ Π±Π΅Π· Π²ΠΌΠ΅ΡΠ°ΡΠ΅Π»ΡΡΡΠ²Π° ΠΈΠ·Π²Π½Π΅. Π ΡΡΠΎΠΉ Π³ΡΡΠΏΠΏΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡΠ½Π΅ΡΡΠΈ Π·Π°Π΄Π°ΡΠΈ ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ, ΠΏΠΎΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ.
- ΠΠ±ΡΡΠ΅Π½ΠΈΠ΅ Ρ ΠΏΠΎΠ΄ΠΊΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ (ΠΎΡ Π°Π½Π³Π». Reinforcement learning) β Π³ΡΡΠΏΠΏΠ° Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ², Π² ΠΊΠΎΡΠΎΡΡΡ ΡΠΈΡΡΠ΅ΠΌΠ° ΠΎΠ±ΡΡΠ°Π΅ΡΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡΠ²ΠΈΡ ΡΠΎ ΡΡΠ΅Π΄ΠΎΠΉ, Π² ΠΊΠΎΡΠΎΡΠΎΠΉ ΠΎΠ½Π° Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ. ΠΠΎΠ΄ΡΠΎΠ±Π½Π΅Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΡΡΡΡ Ρ ΠΎΡΡ Π±Ρ Π² Π²ΠΈΠΊΠΈ. Π ΠΌΠΎΠ΅ΠΉ ΡΡΠ°ΡΡΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΡΡΠΎΠΉ Π³ΡΡΠΏΠΏΡ Π½Π΅ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡΡΡ.
ΠΠ°Π΄Π°ΡΠΈ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ
ΠΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ
ΠΠ»Ρ Π΄Π΅ΠΌΠΎΠ½ΡΡΡΠ°ΡΠΈΠΈ ΠΏΠΎΡΠΌΠΎΡΡΠΈΠΌ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π·Π°Π΄Π°ΡΠΈ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ. ΠΠ»Π³ΠΎΡΠΈΡΠΌ ΡΠ°Π·Π΄Π΅Π»ΡΠ΅Ρ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²ΠΎ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² Π½Π° Π΄Π²Π΅ Π³ΡΡΠΏΠΏΡ.
ΠΠ»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ ΠΎΠ±ΡΡΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ: Π»ΠΎΠ³ΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΡ, KNN, SVM, Π΄Π΅ΡΠ΅Π²ΡΡ ΡΠ΅ΡΠ΅Π½ΠΈΠΉ.
Π Π΅Π³ΡΠ΅ΡΡΠΈΡ
ΠΠΎΡΠΌΠΎΡΡΠΈΠΌ Π½Π° ΡΠΈΡΡΠ½ΠΎΠΊ. ΠΠΎ ΡΡΠ΄Ρ ΠΈΠ·Π²Π΅ΡΡΠ½ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ y(x) Π±ΡΠ»Π° ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π° ΠΊΡΠΈΠ²Π°Ρ β Π»ΠΈΠ½ΠΈΡ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ. ΠΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡΠΎΠ΄Π»ΠΈΡΡ, ΡΡΠΎΠ±Ρ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·ΡΠ²Π°ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ y Π΄Π»Ρ Π½Π΅ΠΈΠ·Π²Π΅ΡΡΠ½ΡΡ x.
ΠΠ»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΠΈ ΠΌΠ΅ΡΠΎΠ΄Ρ: Π»ΠΈΠ½Π΅ΠΉΠ½Π°Ρ ΠΈ ΠΏΠΎΠ»ΠΈΠ½ΠΎΠΌΠΈΠ°Π»ΡΠ½Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ, KNN, Π΄Π΅ΡΠ΅Π²ΡΡ ΡΠ΅ΡΠ΅Π½ΠΈΠΉ.
ΠΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΡ
ΠΠΎΠ·Π½ΠΈΠΊΠ°Π΅Ρ Π»ΠΎΠ³ΠΈΡΠ½ΡΠΉ Π²ΠΎΠΏΡΠΎΡ: Π° ΡΠ΅ΠΌ ΡΠ°Π·Π»ΠΈΡΠ°ΡΡΡΡ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΠΈ ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΡ, Π²Π΅Π΄Ρ ΠΎΠ½ΠΈ ΡΠ΅ΡΠ°ΡΡ ΠΏΠΎΡ ΠΎΠΆΠΈΠ΅ Π·Π°Π΄Π°ΡΠΈ? ΠΡΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Π΅ΡΡΡ Π½Π°Π±ΠΎΡ ΠΏΡΠ΅Π΄ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΡΡ ΠΊΠ»Π°ΡΡΠΎΠ², ΠΊΠΎΡΠΎΡΡΠΌ ΠΎΠ±ΡΡΠ°Π΅ΡΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ Π½Π° Π½Π°Π±ΠΎΡΠ΅ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ². ΠΠ°Π»Π΅Π΅ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·ΡΠ²Π°Π΅Ρ, ΠΊ ΠΊΠ°ΠΊΠΎΠΌΡ ΠΊΠ»Π°ΡΡΡ ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ Π½ΠΎΠ²ΡΠΉ ΠΎΠ±ΡΠ΅ΠΊΡ. ΠΡΠΈ ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΡΡΠ°Π΅ΡΡΡ ΡΠ³ΡΡΠΏΠΏΠΈΡΠΎΠ²Π°ΡΡ Π½Π°Π±ΠΎΡ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΠΈ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ, ΡΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ Π»ΠΈ ΠΊΠ°ΠΊΠ°Ρ-Π»ΠΈΠ±ΠΎ Π²Π·Π°ΠΈΠΌΠΎΡΠ²ΡΠ·Ρ ΠΌΠ΅ΠΆΠ΄Ρ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌΠΈ, Ρ.Π΅. ΠΌΠ°ΡΠΈΠ½Π° ΡΡΠΈΡΡΡ ΡΠ°ΠΌΠ°.
ΠΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠΌ ΠΊΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΠΈ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠ°Ρ ΠΈΠ»Π»ΡΡΡΡΠ°ΡΠΈΡ.
ΠΠ»Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°ΡΠΈ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅ Π°Π»Π³ΠΎΡΠΈΡΠΌΡ ΠΈ ΠΌΠ΅ΡΠΎΠ΄Ρ: K-Means, DBSCAN.
ΠΠ΅ΡΡΠΈΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ
ΠΠ°ΡΠ½Π΅ΠΌ Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ. ΠΡΠΈ ΠΎΡΠ΅Π½ΠΊΠ΅ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ ΡΠ°Π±Π»ΠΈΡΠ΅ΠΉ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠ΅ΠΉ Π΄Π²Π° ΡΡΠΎΠ»Π±ΡΠ° (ΠΏΠΎΠΌΠΈΠΌΠΎ ΠΈΠ½Π΄Π΅ΠΊΡΠ°): ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΈ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π½ΡΠ΅. ΠΠ»Ρ ΠΏΡΠΎΡΡΠΎΡΡ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΠΌ ΡΠ΅ΡΡΡΠ΅ ΡΡΡΠΎΠΊΠΈ, ΠΈ ΠΏΡΡΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠ°ΠΌΠΈ Π±ΡΠ΄Π΅Ρ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΊΠΈΠ»ΠΎΠ³ΡΠ°ΠΌΠΌ ΠΊΠ°ΡΡΠΎΡΠΊΠΈ Π΄Π»Ρ ΡΠ΅ΡΠΈ ΡΠ΅ΡΡΠΎΡΠ°Π½ΠΎΠ². ΠΠ»Ρ ΠΏΡΠΎΡΡΠΎΡΡ ΡΠ°ΡΡΠ΅ΡΠΎΠ² Π²ΠΎΠ·ΡΠΌΠ΅ΠΌ ΠΊΡΠ°ΡΠ½ΡΠ΅ Π΄Π΅ΡΡΡΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡ.
ΠΠΎΠΌΠ΅Ρ | ΠΠ½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΈΠ· Π²ΡΠ±ΠΎΡΠΊΠΈ (ΡΠΊΠΎΠ»ΡΠΊΠΎ Π² ΡΠ΅Π°Π»ΡΠ½ΠΎΡΡΠΈ ΠΏΠΎΡΡΠ΅Π±ΠΎΠ²Π°Π»ΠΎΡΡ ΠΊΠ³ ΠΊΠ°ΡΡΠΎΡΠΊΠΈ) | ΠΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π½ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ (ΠΊΠ³) |
1 | 200 | 180 |
2 | 150 | 190 |
3 | 140 | 120 |
4 | 160 | 220 |
ΠΡΠΈ ΡΠ°ΠΊΠΎΠΌ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π΅ Π΄Π°Π½Π½ΡΡ Π΄Π°ΠΆΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡΠ΅Π½ΠΈΡΡ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ . ΠΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ ΠΏΠΎΠ΄ Π½ΠΎΠΌΠ΅ΡΠ°ΠΌΠΈ 1 ΠΈ 3 Π±ΡΠ»ΠΈ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠΎΡΠ½Ρ, Π½ΠΎΠΌΠ΅Ρ 2 ΠΏΠΎΠΊΠ°Π·Π°Π» Π±ΠΠ»ΡΡΡΡ ΠΎΡΠΈΠ±ΠΊΡ, Π° Π² ΡΡΡΠΎΠΊΠ΅ Π½ΠΎΠΌΠ΅Ρ 4 ΠΎΡΠΈΠ±ΠΊΠ° ΠΎΠΊΠ°Π·Π°Π»Π°ΡΡ ΠΎΡΠ΅Π½Ρ Π±ΠΎΠ»ΡΡΠΎΠΉ.
ΠΠ»Ρ ΡΡΡΡΡ ΡΠ°ΠΊΠΈΡ ΡΡΡΠΎΠΊ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ ΠΎΡΠ΅Π½ΠΈΡΡ ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΡ Π°Π³ΡΠ΅Π³ΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΠΏΠΎΠΊΠ°Π·Π°ΡΠ΅Π»ΠΈ.
Mean Absolute Error (MAE) β ΡΡΠ΅Π΄Π½ΡΡ Π°Π±ΡΠΎΠ»ΡΡΠ½Π°Ρ ΠΎΡΠΈΠ±ΠΊΠ°
ΠΠΎΠ²ΠΎΠ»ΡΠ½ΠΎ ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½ΡΠΉ ΡΠΏΠΎΡΠΎΠ± β ΡΠ»ΠΎΠΆΠΈΡΡ ΠΎΡΠΈΠ±ΠΊΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠΉ ΠΈ ΡΠ°Π·Π΄Π΅Π»ΠΈΡΡ Π½Π° ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠΉ. ΠΠΎΡΡΠΈΡΠ°Π΅ΠΌ Π΄Π»Ρ Π½Π°ΡΠ΅ΠΉ ΡΠ°Π±Π»ΠΈΡΡ:
Π ΡΡΠ΅Π΄Π½Π΅ΠΌ Π½Π°Ρ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΎΡΠΈΠ±Π°Π΅ΡΡΡ Π½Π° 35 ΠΊΠ³ ΠΊΠ°ΡΡΠΎΡΠΊΠΈ. ΠΠ΄Π΅-ΡΠΎ Π² ΠΏΠ»ΡΡ, Π³Π΄Π΅-ΡΠΎ Π² ΠΌΠΈΠ½ΡΡ. Π’Π°ΠΊΠ°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ° Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ ΡΡΠ΅Π΄Π½Π΅ΠΉ Π°Π±ΡΠΎΠ»ΡΡΠ½ΠΎΠΉ ΠΎΡΠΈΠ±ΠΊΠΎΠΉ, mean absolute error ΠΈΠ»ΠΈ MAE.
Π³Π΄Π΅ yi β ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π½ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, Π° xi β ΡΠ΅Π°Π»ΡΠ½ΡΠ΅ ΠΈΠ·Π²Π΅ΡΡΠ½ΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, ei - ΠΎΡΠΈΠ±ΠΊΠ° i-Π³ΠΎ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ.
Mean Square Error (MSE) β Π‘ΡΠ΅Π΄Π½ΡΡ ΠΊΠ²Π°Π΄ΡΠ°ΡΠΈΡΠ½Π°Ρ ΠΎΡΠΈΠ±ΠΊΠ°
ΠΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠ°ΡΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ ΠΏΠΎΡ ΠΎΠΆΠ°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ°, MSE. ΠΠ½Π° ΡΠ°ΡΡΡΠΈΡΡΠ²Π°Π΅ΡΡΡ ΠΏΠΎΡΡΠΈ ΡΠ°ΠΊ ΠΆΠ΅, ΡΠΎΠ»ΡΠΊΠΎ Π±Π΅ΡΠ΅ΡΡΡ Π½Π΅ ΠΌΠΎΠ΄ΡΠ»Ρ ΠΎΡΠΈΠ±ΠΊΠΈ ei, Π° Π΅Π΅ ΠΊΠ²Π°Π΄ΡΠ°Ρ.
ΠΠ»Ρ Π½Π°ΡΠ΅Π³ΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠ°:
ΠΠΎ ΠΌΡ ΠΏΠΎΠ»ΡΡΠΈΠ»ΠΈ Π½Π΅ ΠΎΡΠΈΠ±ΠΊΡ Π² ΠΊΠΈΠ»ΠΎΠ³ΡΠ°ΠΌΠΌΠ°Ρ , Π° βΠΊΠ³ Π² ΠΊΠ²Π°Π΄ΡΠ°ΡΠ΅β. Π§ΡΠΎΠ±Ρ Π²Π΅ΡΠ½ΡΡΡΡΡ ΠΊ ΠΈΡΡ ΠΎΠ΄Π½ΠΎΠΉ Π²Π΅Π»ΠΈΡΠΈΠ½Π΅, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΠΈΠ·Π²Π»Π΅ΡΡ ΠΈΠ· MSE ΠΊΠ²Π°Π΄ΡΠ°ΡΠ½ΡΠΉ ΠΊΠΎΡΠ΅Π½Ρ:
ΠΠΎ ΡΡΠ°Π²Π½Π΅Π½ΠΈΡ Ρ RMSE, ΠΌΠ΅ΡΡΠΈΠΊΠ° MAE Π±ΠΎΠ»Π΅Π΅ ΠΈΠ½ΡΡΠΈΡΠΈΠ²Π½Π°, Ρ.ΠΊ. ΡΡΡΠ΅Π΄Π½ΡΡΡΡΡ ΡΠ°ΠΌΠΈ ΠΎΡΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΡ, Π½ΠΎ RMSE ΡΠ΄ΠΎΠ±Π½Π΅Π΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΏΡΠΈ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ². Π₯ΠΎΡΡ Π΄Π»Ρ MAE ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΡΠΎΠΆΠ΅ ΡΡΠΏΠ΅ΡΠ½ΠΎ Π²ΡΠΏΠΎΠ»Π½ΡΠ΅ΡΡΡ.
ΠΡΠ΅ ΠΎΠ΄Π½Π° ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ MAE β ΠΎΠ½Π° Π±ΠΎΠ»Π΅Π΅ ΡΡΡΠΎΠΉΡΠΈΠ²Π° ΠΊ Π²ΡΠ±ΡΠΎΡΠ°ΠΌ, ΡΠ΅ΠΌ RMSE. ΠΡΠΎ ΠΎΠ·Π½Π°ΡΠ°Π΅Ρ, ΡΡΠΎ Π΅ΡΠ»ΠΈ Π΄Π»Ρ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΎΡΠΈΠ±ΠΊΠ° ΠΎΡΠ΅Π½Ρ Π±ΠΎΠ»ΡΡΠ°Ρ (ΠΎΠ±ΡΠ΅ΠΊΡ-Π²ΡΠ±ΡΠΎΡ), Π° Π΄Π»Ρ ΠΎΡΡΠ°Π»ΡΠ½ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² β ΠΌΠ°Π»Π΅Π½ΡΠΊΠ°Ρ, ΡΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ MAE ΠΏΠΎΠ΄ΡΠΊΠΎΡΠΈΡ ΠΎΡ ΡΡΠΎΠ³ΠΎ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΌΠ΅Π½ΡΡΠ΅, ΡΠ΅ΠΌ RMSE, Ρ.ΠΊ. Π² RMSE ΠΎΡΠΈΠ±ΠΊΠΈ Π²ΠΎΠ·Π²ΠΎΠ΄ΡΡΡΡ Π² ΠΊΠ²Π°Π΄ΡΠ°Ρ. Π Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠΌ-Π²ΡΠ±ΡΠΎΡΠΎΠΌ ΡΠ²Π»ΡΠ΅ΡΡΡ ΡΠ΅ΡΠ²Π΅ΡΡΠΎΠ΅ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅.
Quantile loss
ΠΡΠ΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΡΡΠΎ ΡΠΎΠ²Π°Ρ Π·Π°Π½ΠΈΠΌΠ°Π΅Ρ ΠΌΠ°Π»ΠΎ ΠΌΠ΅ΡΡΠ° (Ρ.ΠΊ. ΠΏΠ»ΠΎΡΠ°Π΄ΠΈ Ρ ΡΠ°Π½Π΅Π½ΠΈΡ Π² ΡΠ΅ΡΡΠΎΡΠ°Π½Π°Ρ Π²Π΅Π»ΠΈΠΊΠΈ) ΠΈ ΡΠ°ΡΡ ΠΎΠ΄Ρ Π½Π° Ρ ΡΠ°Π½Π΅Π½ΠΈΠ΅ Π½Π΅Π²Π΅Π»ΠΈΠΊΠΈ, ΡΠΎΠ³Π΄Π° Π»ΡΡΡΠ΅ ΠΎΡΠΈΠ±ΠΈΡΡΡΡ Π² Π±ΠΎΠ»ΡΡΡΡ ΡΡΠΎΡΠΎΠ½Ρ, ΡΠ΅ΠΌ Π² ΠΌΠ΅Π½ΡΡΡΡ. Π ΡΡΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΠΎΡΡΠΈΡΠ°ΡΠ΅Π»ΡΠ½ΡΡ ΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡΠ΅Π»ΡΠ½ΡΡ ΡΠ°Π·Π½ΠΈΡΡ Π΄ΠΎΠΌΠ½ΠΎΠΆΠ°ΡΡ Π½Π° ΡΠ°Π·Π½ΡΠ΅ ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½ΡΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π²ΠΎΠ·ΡΠΌΠ΅ΠΌ 0.5 ΠΈ 1.5.
Π Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ 1.5 Π±ΡΠ΄Π΅Ρ ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ ΠΊ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡΠΌ 1 ΠΈ 3 (180 < 200 ΠΈ 120 < 140), Π° ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ 0.5 ΠΊ ΠΎΡΡΠ°Π»ΡΠ½ΡΠΌ. Π’ΠΎΠ³Π΄Π° Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Π±ΡΠ΄Π΅Ρ ΡΠ°Π²Π½ΠΎ:
ΠΠ°Π½Π½Π°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ° Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΊΠ²Π°Π½ΡΠΈΠ»ΡΠ½ΠΎΠΉ ΠΎΡΠΈΠ±ΠΊΠΎΠΉ.
Π‘Π°ΠΌΠΎ ΠΏΠΎ ΡΠ΅Π±Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΌΠ΅ΡΡΠΈΠΊ MSE ΠΈΠ»ΠΈ MAE ΠΌΠΎΠΆΠ½ΠΎ ΡΡΠ°Π²Π½ΠΈΠ²Π°ΡΡ ΡΠΎ ΡΡΠ΅Π΄Π½ΠΈΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ΠΌ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ: Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·ΡΠ²Π°ΡΡ Π΄Π΅ΡΡΡΠΊΠΈ, ΠΏΡΠΈ ΡΡΠΎΠΌ Π΄ΠΎΠΏΡΡΡΠΈΠΌΡ ΠΎΡΠΈΠ±ΠΊΠΈ ΠΏΠΎΡΡΠ΄ΠΊΠ° Π΅Π΄ΠΈΠ½ΠΈΡ. ΠΡΠ»ΠΈ Ρ ΠΎΡΠ΅ΡΡΡ ΠΏΠΎΠ»ΡΡΠ°ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΎΡΠΈΠ±ΠΊΠΈ Π² ΠΏΡΠΎΡΠ΅Π½ΡΠ°Ρ (Β«Π°Π»Π³ΠΎΡΠΈΡΠΌ Π² ΡΡΠ΅Π΄Π½Π΅ΠΌ ΠΎΡΠΈΠ±Π°Π΅ΡΡΡ Π½Π° ΡΡΠΎΠ»ΡΠΊΠΎ-ΡΠΎ ΠΏΡΠΎΡΠ΅Π½ΡΠΎΠ²Β»), ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Ρ Π½ΠΎΡΠΌΠΈΡΠΎΠ²ΠΊΠ°ΠΌΠΈ.
Π ΠΏΡΠΈΠΌΠ΅ΡΡ, ΠΌΠ΅ΡΡΠΈΠΊΠ° MAPE (mean average percentage error) ΡΡΡΠ΅Π΄Π½ΡΠ΅Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΎΡΠΈΠ±ΠΎΠΊ, Π΄Π΅Π»Π΅Π½Π½ΡΡ Π½Π° Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ:
Π Π½Π°ΡΠ΅ΠΌ ΡΠ»ΡΡΠ°Π΅, Π°Π»Π³ΠΎΡΠΈΡΠΌ Π² ΡΡΠ΅Π΄Π½Π΅ΠΌ ΠΎΡΠΈΠ±Π°Π΅ΡΡΡ Π½Π° 22.1%.
ΠΠ°ΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°ΡΡ, ΡΡΠΎ ΠΈΠ΄Π΅Π°Π»ΡΠ½ΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ², ΠΊΠ°ΠΊ ΠΈ Π½ΡΠ»Π΅Π²ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ ΠΌΠ΅ΡΡΠΈΠΊ ΠΎΡΠΈΠ±ΠΎΠΊ, Π² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ Π½Π΅ Π±ΡΠ²Π°Π΅Ρ: ΡΠ°ΠΊΠΎΠ²Π° ΡΡΡΡ ΡΡΠΎΠΉ ΠΎΠ±Π»Π°ΡΡΠΈ, ΡΡΠΎ ΠΎΠ½Π° ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ Π²ΡΠΏΠΎΠ»Π½ΡΡΡ ΠΏΡΠΈΠ±Π»ΠΈΠ·ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ. ΠΠ΅Π»ΠΈΡΠΈΠ½Ρ ΠΌΠ΅ΡΡΠΈΠΊ ΠΎΠ±ΡΡΠ½ΠΎ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ Π·Π°ΠΊΠ°Π·ΡΠΈΠΊ.
ΠΠ΅ΡΡΠΈΠΊΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ
Accuracy β Π΄ΠΎΠ»Ρ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΡ ΠΎΡΠ²Π΅ΡΠΎΠ²
ΠΠ»Ρ ΠΏΡΠΈΠΌΠ΅ΡΠ° Π±ΡΠ΄Π΅Ρ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡ Π·Π°Π΄Π°ΡΡ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ ΡΠΎΠΊΡΠΈΡΠ½ΠΎΡΡΠΈ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅Π². Π’.Π΅. ΠΈΠΌΠ΅Π΅ΠΌ Π·Π°Π΄Π°ΡΡ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ, Π³Π΄Π΅ 0 β ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ Π½Π΅ΡΠΎΠΊΡΠΈΡΠ΅Π½, 1 β ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ ΡΠΎΠΊΡΠΈΡΠ΅Π½. ΠΠΎΠ·ΡΠΌΠ΅ΠΌ Π΄Π»Ρ ΠΏΡΠΎΡΡΠΎΡΡ ΠΏΡΡΡ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅Π² ΠΈ ΡΠ²Π΅Π΄Π΅ΠΌ Π²ΡΠ΅ Π² ΡΠ°Π±Π»ΠΈΡΡ.
ID ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΡ | ΠΠ½Π°ΡΠ΅Π½ΠΈΠ΅ Π² Π΄Π°Π½Π½ΡΡ (ΡΠΎΠΊΡΠΈΡΠ΅Π½ Π»ΠΈ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ Π² Π΄Π΅ΠΉΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ) | ΠΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½Π½ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ |
1 | 1 | 1 |
2 | 1 | 1 |
3 | 0 | 0 |
4 | 0 | 1 |
5 | 0 | 0 |
Π Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, Π°Π»Π³ΠΎΡΠΈΡΠΌ Π²ΡΠ΄Π°Π» ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΠ΅ ΠΎΡΠ²Π΅ΡΡ Π΄Π»Ρ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅Π² 1,2,3,5, Ρ.Π΅. Π² 80% ΡΠ»ΡΡΠ°Π΅Π². ΠΡΠΎ ΠΈ Π΅ΡΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ accuracy.
Accuracy β ΠΏΡΠΎΡΡΠ°Ρ ΠΈ ΠΈΠ½ΡΠ΅ΡΠΏΡΠ΅ΡΠΈΡΡΠ΅ΠΌΠ°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ°, Π½ΠΎ ΠΎΠ½Π° Π½Π΅ ΠΎΡΡΠ°ΠΆΠ°Π΅Ρ ΠΏΠΎΠ»Π½ΡΡ ΠΊΠ°ΡΡΠΈΠ½Ρ, Π² ΡΠ°ΡΡΠ½ΠΎΡΡΠΈ, Π² ΠΊΠ°ΠΊΡΡ ΡΡΠΎΡΠΎΠ½Ρ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΎΡΠΈΠ±Π°Π΅ΡΡΡ ΡΠ°ΡΠ΅. ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΡΡ ΠΌΠ΅ΡΡΠΈΠΊΡ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π½Π΅ΡΠ΄ΠΎΠ±Π½ΠΎ Π² ΡΠΈΡΡΠ°ΡΠΈΠΈ Ρ Π½Π΅ΡΠ±Π°Π»Π°Π½ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠΌΠΈ ΠΊΠ»Π°ΡΡΠ°ΠΌΠΈ, ΡΠΎ Π΅ΡΡΡ, ΠΊΠΎΠ³Π΄Π° ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΊΠ»Π°ΡΡΠ° ΠΌΠ½ΠΎΠ³ΠΎ Π±ΠΎΠ»ΡΡΠ΅, ΡΠ΅ΠΌ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² Π΄ΡΡΠ³ΠΎΠ³ΠΎ. Π ΠΏΡΠΈΠΌΠ΅ΡΡ, Π΅ΡΠ»ΠΈ Π² Π΄Π°Π½Π½ΡΡ 95% ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΠΈΠ· ΠΊΠ»Π°ΡΡΠ° 0 ΠΈ 5% ΠΈΠ· ΠΊΠ»Π°ΡΡΠ° 1, Π° Π°Π»Π³ΠΎΡΠΈΡΠΌ Π²ΡΠ΅Π³Π΄Π° ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·ΡΠ²Π°Π΅Ρ, ΡΡΠΎ ΠΎΠ±ΡΠ΅ΠΊΡ ΠΎΡΠ½ΠΎΡΠΈΡΡΡ ΠΊ ΠΊΠ»Π°ΡΡΡ 0, ΡΠΎ Π΅Π³ΠΎ accuracy Π±ΡΠ΄Π΅Ρ ΡΠ°Π²Π½ΠΎ 95%, Ρ ΠΎΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΡΠΎΠ²Π΅ΡΡΠ΅Π½Π½ΠΎ Π±Π΅ΡΠΏΠΎΠ»Π΅Π·Π½ΡΠΉ! Π ΡΠ°ΠΊΠΈΡ ΡΠ»ΡΡΠ°ΡΡ ΡΠ°ΡΡΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡ Π΄ΡΡΠ³ΠΈΠ΅ ΠΌΠ΅ΡΡΠΈΠΊΠΈ.
Precision and Recall β Π’ΠΎΡΠ½ΠΎΡΡΡ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΠ°
Π§ΡΠΎΠ±Ρ ΠΏΠΎΠ½ΡΡΡ, ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅ ΡΠΎΡΠ½ΠΎΡΡΡ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΠ°, ΡΠ°Π·Π±Π΅ΡΠ΅ΠΌΡΡ ΡΠ½Π°ΡΠ°Π»Π° Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΠΌΠΈ ΡΠΈΠΏΠ°ΠΌΠΈ ΠΎΡΠΈΠ±ΠΎΠΊ. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΎΡΠ»ΠΈΡΠ½ΠΎ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΠΈΡ ΠΊΠ°ΡΡΠΈΠ½ΠΊΠ° ΠΈΠ· Π²ΠΈΠΊΠΈΠΏΠ΅Π΄ΠΈΠΈ.
Π Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, Π΅ΡΠ»ΠΈ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΏΠΎΠΌΠ΅ΡΠΈΡ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΡΠΉ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ ΠΊΠ°ΠΊ ΡΠΎΠΊΡΠΈΡΠ½ΡΠΉ, ΡΠΎ Π½ΠΈΡΠ΅Π³ΠΎ ΠΎΡΠΎΠ±ΠΎ ΡΡΡΠ°ΡΠ½ΠΎΠ³ΠΎ Π½Π΅ ΠΏΡΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ. ΠΡΠΎΡ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ Π±ΡΠ΄Π΅Ρ Π² Π΄Π°Π»ΡΠ½Π΅ΠΉΡΠ΅ΠΉ ΠΏΡΠΎΠ²Π΅ΡΠ΅Π½ ΠΌΠΎΠ΄Π΅ΡΠ°ΡΠΎΡΠΎΠΌ. Π’Π°ΠΊΠ°Ρ ΠΎΡΠΈΠ±ΠΊΠ° Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΎΡΠΈΠ±ΠΊΠΎΠΉ ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ ΡΠΎΠ΄Π° (false positive). ΠΡΠ»ΠΈ ΠΆΠ΅ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΉ Π±ΡΠ΄Π΅Ρ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π½ ΠΊΠ°ΠΊ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΡΠΉ, Π½ΠΎ ΠΎΠ½ ΡΠΎΠΊΡΠΈΡΠ½ΡΠΉ, ΡΠΎ ΡΠ°ΠΊΠ°Ρ ΠΎΡΠΈΠ±ΠΊΠ° Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΎΡΠΈΠ±ΠΊΠΎΠΉ Π²ΡΠΎΡΠΎΠ³ΠΎ ΡΠΎΠ΄Π° (false negative). ΠΠ° ΠΌΠΎΠΉ Π²Π·Π³Π»ΡΠ΄, Π² Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΎΡΠΈΠ±ΠΊΠ° Π²ΡΠΎΡΠΎΠ³ΠΎ ΡΠΎΠ΄Π° ΡΡΡΠ°ΡΠ½Π΅Π΅, ΡΠ΅ΠΌ ΠΎΡΠΈΠ±ΠΊΠ° ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ. ΠΠΎ Π±ΡΠ²Π°Π΅Ρ ΠΈ Π½Π°ΠΎΠ±ΠΎΡΠΎΡ.
- Π’ΠΎΡΠ½ΠΎΡΡΡ ΠΈΠ·ΠΌΠ΅ΡΡΠ΅Ρ, ΠΊΠ°ΠΊΠΎΠΉ ΠΏΡΠΎΡΠ΅Π½Ρ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ², Π΄Π»Ρ ΠΊΠΎΡΠΎΡΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π» ΠΊΠ»Π°ΡΡ 1, Π΄Π΅ΠΉΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΎΡΠ½ΠΎΡΠΈΡΡΡ ΠΊ ΠΊΠ»Π°ΡΡΡ 1. Π Π½Π°ΡΠ΅ΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, ΡΠΎΡΠ½ΠΎΡΡΡ β ΡΡΠΎ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΡΠ΅Π°Π»ΡΠ½ΠΎ ΡΠΎΠΊΡΠΈΡΠ½ΡΡ ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠ΅Π² ΠΊ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Ρ ΠΏΠΎΠΌΠ΅ΡΠ΅Π½Π½ΡΡ ΠΊΠ°ΠΊ ΡΠΎΠΊΡΠΈΡΠ½ΡΠ΅. Π ΡΡΠ° ΠΌΠ΅ΡΡΠΈΠΊΠ° ΡΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ β = 66%.
- ΠΠΎΠ»Π½ΠΎΡΠ° ΠΈΠ·ΠΌΠ΅ΡΡΠ΅Ρ, Π΄Π»Ρ ΠΊΠ°ΠΊΠΎΠ³ΠΎ ΠΏΡΠΎΡΠ΅Π½ΡΠ° ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² ΠΊΠ»Π°ΡΡΠ° 1 Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π» ΠΊΠ»Π°ΡΡ 1. ΠΠ»Ρ Π½Π°ΡΠ΅Π³ΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠ° ΠΏΠΎΠ»Π½ΠΎΡΠ° ΡΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ 100%. ΠΠ»Ρ ΠΏΡΠΎΡΡΠΎΡΡ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΡ, Π² Π²ΠΈΠΊΠΈ ΡΠΎΡΠΌΡΠ»Ρ ΡΠ°ΡΡΠ΅ΡΡ ΠΏΠΎΠΊΠ°Π·Π°Π½Ρ Π²ΠΈΠ·ΡΠ°Π»ΡΠ½ΠΎ.
ΠΡΡΠ»Π΅ΠΆΠΈΠ²Π°ΡΡ ΠΎΠ±Π΅ ΠΌΠ΅ΡΡΠΈΠΊΠΈ ΡΡΠ°Π·Ρ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π½Π΅ΡΠ΄ΠΎΠ±Π½ΠΎ, ΠΈ ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΠΈΡΡΡΡ ΡΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡΠΎΠ²Π°ΡΡ ΠΈΡ Π² ΠΎΠ΄Π½ΠΎΠΉ. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡ F-ΠΌΠ΅ΡΡ β ΡΡΠ΅Π΄Π½Π΅Π΅ Π³Π°ΡΠΌΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠΎΡΠ½ΠΎΡΡΠΈ P ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ R:
Π’Π°ΠΊΠΎΠΉ ΡΠΏΠΎΡΠΎΠ± ΡΡΡΠ΅Π΄Π½Π΅Π½ΠΈΡ Π±ΡΠ» Π²ΡΠ±ΡΠ°Π½ ΠΏΠΎΡΠΎΠΌΡ, ΡΡΠΎ F-ΠΌΠ΅ΡΠ° ΠΏΡΠΈΠ½ΠΈΠΌΠ°Π΅Ρ Π²ΡΡΠΎΠΊΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ, ΡΠΎΠ»ΡΠΊΠΎ ΠΊΠΎΠ³Π΄Π° ΠΎΠ±Π΅ ΠΌΠ΅ΡΡΠΈΠΊΠΈ ΠΏΡΠΈΠ½ΠΈΠΌΠ°ΡΡ Π²ΡΡΠΎΠΊΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ. ΠΠ½ΡΠΌΠΈ ΡΠ»ΠΎΠ²Π°ΠΌΠΈ, Π΅ΡΠ»ΠΈ Ρ ΠΎΡΡ Π±Ρ ΠΎΠ΄Π½Π° ΠΈΠ· Π΄Π²ΡΡ ΠΌΠ΅ΡΡΠΈΠΊ Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ 0, F-ΠΌΠ΅ΡΠ° ΡΠΎΠΆΠ΅ Π±ΡΠ΄Π΅Ρ Π±Π»ΠΈΠ·ΠΊΠ° ΠΊ 0. ΠΡΠΎ ΡΠ²ΠΎΠΉΡΡΠ²ΠΎ Π½Π΅ Π²ΡΠΏΠΎΠ»Π½ΡΠ΅ΡΡΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, Π΄Π»Ρ ΡΡΠ΅Π΄Π½Π΅Π³ΠΎ Π°ΡΠΈΡΠΌΠ΅ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈΠ· ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΏΠΎΠ»Π½ΠΎΡΡ.
ΠΠ½ΡΠ°ΠΌΠ±Π»Π΅Π²ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ
ΠΡΠΏΠΎΠΌΠ½ΠΈΠΌ ΠΏΠΎΡΡΠ°Π½ΠΎΠ²ΠΊΡ Π·Π°Π΄Π°Ρ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ ΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ. Π ΠΎΠ±Π΅ΠΈΡ ΡΡΠ΅Π±ΡΠ΅ΡΡΡ Π½Π°Π±ΠΎΡ ΡΠ°Π±Π»ΠΈΡΠ½ΡΡ Π΄Π°Π½Π½ΡΡ : ΠΏΠΎ ΡΡΡΠΎΠΊΠ°ΠΌ ΡΠ°Π±Π»ΠΈΡΡ Π·Π°Π΄Π°Π½Ρ ΠΎΠ±ΡΠ΅ΠΊΡΡ (Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΊΠ»ΠΈΠ΅Π½ΡΡ), Π° ΠΏΠΎ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ β ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ, ΡΠΎ Π΅ΡΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ Ρ Π°ΡΠ°ΠΊΡΠ΅ΡΠΈΡΡΠΈΠΊΠΈ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² (Π²ΠΎΠ·ΡΠ°ΡΡ, Π·Π°ΡΠ°Π±ΠΎΡΠ½Π°Ρ ΠΏΠ»Π°ΡΠ°, ΡΡΠ°ΠΆ ΡΠ°Π±ΠΎΡΡ ΠΊΠ»ΠΈΠ΅Π½ΡΠ° ΠΈ Ρ. Π΄.). ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, Π½ΡΠΆΠ½Π° ΡΠ°Π·ΠΌΠ΅ΡΠΊΠ° Π΄Π°Π½Π½ΡΡ : Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΎΠ±ΡΠ΅ΠΊΡΠ° Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±ΡΡΡ ΠΈΠ·Π²Π΅ΡΡΠ½ΠΎ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ (ΠΊΠ»Π°ΡΡ Π² Π·Π°Π΄Π°ΡΠ΅ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ ΠΈΠ»ΠΈ ΡΠΈΡΠ»ΠΎ Π² Π·Π°Π΄Π°ΡΠ΅ ΡΠ΅Π³ΡΠ΅ΡΡΠΈΠΈ). ΠΠΌΠ΅Ρ Π½Π°Π±ΠΎΡ ΡΠ°Π·ΠΌΠ΅ΡΠ΅Π½Π½ΡΡ Π΄Π°Π½Π½ΡΡ , ΠΌΡ ΠΎΠ±ΡΡΠ°Π΅ΠΌ Π°Π»Π³ΠΎΡΠΈΡΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ Π±ΡΠ΄Π΅Ρ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·ΡΠ²Π°ΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π΄Π»Ρ Π½ΠΎΠ²ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠΎΠ² Π½Π° ΡΡΠ°Π΄ΠΈΠΈ Π²Π½Π΅Π΄ΡΠ΅Π½ΠΈΡ.
Π Π΅ΡΠ°ΡΡΠ΅Π΅ Π΄Π΅ΡΠ΅Π²ΠΎ β ΡΡΠΎ Π°Π»Π³ΠΎΡΠΈΡΠΌ, ΠΊΠΎΡΠΎΡΡΠΉ Π΄Π΅Π»Π°Π΅Ρ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΠ΅ΡΠΈΠΈ Π²ΠΎΠΏΡΠΎΡΠΎΠ² ΠΎΠ± ΠΎΠ±ΡΠ΅ΠΊΡΠ΅.
ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΏΠΎΠΊΠ°ΠΆΠ΅ΠΌ ΡΠ΅ΡΠ°ΡΡΠ΅Π΅ Π΄Π΅ΡΠ΅Π²ΠΎ, ΠΊΠΎΡΠΎΡΠΎΠ΅ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΠΏΡΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΠΎΡΠ΅Π½ΠΊΠΈ ΠΏΠΎ ΠΊΠ°ΠΊΠΎΠΌΡ-ΡΠΎ ΠΏΡΠ΅Π΄ΠΌΠ΅ΡΡ ΡΡΡΠ΄Π΅Π½ΡΡ.
ΠΠ½ΡΠ°ΠΌΠ±Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π·Π°ΠΊΠ»ΡΡΠ°Π΅ΡΡΡ Π² ΡΠΎΠΌ, ΡΡΠΎΠ±Ρ ΠΎΠ±ΡΡΠΈΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ Π°Π»Π³ΠΎΡΠΈΡΠΌΠΎΠ² ΠΈ ΡΡΡΠ΅Π΄Π½ΡΡΡ ΠΈΡ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ.
ΠΠ°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΡΡΠΎΠΈΡΡΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ°Π·Π½ΡΡ ΡΠ΅ΡΠ°ΡΡΠΈΡ Π΄Π΅ΡΠ΅Π²ΡΠ΅Π², ΠΈ Π±Π΅ΡΠ΅ΡΡΡ ΡΡΠ΅Π΄Π½Π΅Π΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² ΠΈΡ ΡΠ°Π±ΠΎΡΡ. ΠΠΎΠ΄ΡΠΎΠ±Π½ΠΎ ΠΏΡΠΎ Π°Π½ΡΠ°Π±Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅ Π² ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΈΡΠ°ΡΡ ΡΡΡ.
Π Π΅ΡΠ°Π΅ΠΌ Titanic Π½Π° Kaggle
Π§ΡΠΎ Π½ΡΠΆΠ½ΠΎ Π΄Π΅Π»Π°ΡΡ β ΠΏΠΎΠ½ΡΡΠ½ΠΎ. ΠΠ°ΡΠΈΠ½Π°Π΅ΠΌ ΡΠΌΠΎΡΡΠ΅ΡΡ Π½Π°ΡΠΈ Π΄Π°Π½Π½ΡΠ΅. ΠΠ΅ΡΠ΅Ρ ΠΎΠ΄ΠΈΠΌ Π½Π° Π²ΠΊΠ»Π°Π΄ΠΊΡ Code ΠΈ Π½Π°ΠΆΠΈΠΌΠ°Π΅ΠΌ New notebook.
Π’Π°ΠΊΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ, ΠΌΡ ΠΏΠΎΠ»ΡΡΠ°Π΅ΠΌ ΠΏΡΠΎΠ΄Π²ΠΈΠ½ΡΡΡΠΉ jupyter notebook. Π§ΡΠΎΠ±Ρ Π°ΠΊΡΠΈΠ²ΠΈΡΠΎΠ²Π°ΡΡ ΡΠΈΡΡΠ΅ΠΌΡ, Π½Π°ΠΆΠΌΠ΅ΠΌ Π½Π° Π·Π½Π°ΡΠΎΠΊ Play ΡΠ»Π΅Π²Π° ΠΎΡ Π²Π΅ΡΡ Π½Π΅ΠΉ ΡΡΠ΅ΠΉΠΊΠΈ Π½ΠΎΡΡΠ±ΡΠΊΠ°. Π‘ΠΈΡΡΠ΅ΠΌΠ° Π±ΡΠ΄Π΅Ρ Π·Π°ΠΏΡΡΠ΅Π½Π° ΠΈ Π² ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅, ΠΏΠΎΠ΄ ΡΡΠ΅ΠΉΠΊΠΎΠΉ ΡΠ²ΠΈΠ΄ΠΈΠΌ ΠΏΡΡΠΈ Π΄ΠΎ csv ΡΠ°ΠΉΠ»ΠΎΠ².
ΠΠΎΠΆΠ½ΠΎ ΠΏΡΠΈΡΡΡΠΏΠ°ΡΡ. ΠΡΠ»ΠΈ Π²Ρ Π½Π΅ Π·Π½Π°ΠΊΠΎΠΌΡ Ρ jupyter notebook ΠΈ pandas, ΡΠΎ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΡ ΡΠ½Π°ΡΠ°Π»Π° ΠΏΡΠΎΡΠΈΡΠ°ΡΡ Π΄Π°Π½Π½ΡΠΉ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π».
Π§ΡΠ΅Π½ΠΈΠ΅ ΠΈ Π°Π½Π°Π»ΠΈΠ· Π΄Π°ΡΠ°ΡΠ΅ΡΠ° Titanic
ΠΠ΅ΡΠ²ΡΠΌ Π΄Π΅Π»ΠΎΠΌ, Π·Π°Π³ΡΡΠΆΠ°Π΅ΠΌ Π² Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΡ ΡΠ°ΠΉΠ»Ρ .csv.
ΠΡΠΎΠ²Π΅ΡΠΈΠΌ, ΡΡΠΎ Π²ΡΠ΅ Ρ Π½Π°Ρ ΡΠ΄Π°ΡΠ½ΠΎ ΠΈ Π²Π·Π³Π»ΡΠ½Π΅ΠΌ Π½Π° ΡΡΠΈ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΡ. ΠΠ»Ρ ΠΏΡΠΈΠΌΠ΅ΡΠ° ΠΏΡΠΈΠ²Π΅Π΄Ρ train_data
.
ΠΠ΅ΡΠ²ΡΠΌ Π΄Π΅Π»ΠΎΠΌ ΠΎΡΠ΅Π½ΠΈΠΌ ΡΠ°Π·ΠΌΠ΅ΡΡ Π΄Π°ΡΠ°ΡΡΠ΅ΠΉΠΌΠ°. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΠ²ΠΎΠΉΡΡΠ²ΠΎ shape
.
Π ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ ΠΏΠΎΠ»ΡΡΠ°Π΅ΠΌ (891, 12), Ρ.Π΅. 12 ΡΡΠΎΠ»Π±ΡΠΎΠ² ΠΈ 891 ΡΡΡΠΎΠΊΡ.
Π‘Π»Π΅Π΄ΡΡΡΠΈΠΌ ΡΡΠ°ΠΏΠΎΠΌ Π½Π΅ΠΏΠ»ΠΎΡ ΠΎ Π±ΡΠ»ΠΎ Π±Ρ ΠΎΡΠ΅Π½ΠΈΡΡ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΡΡΡΡΡ ΡΡΠ΅Π΅ΠΊ Π² ΡΡΠΎΠ»Π±ΡΠ°Ρ ΠΎΠ±ΡΡΠ°ΡΡΠ΅ΠΉ Π²ΡΠ±ΠΎΡΠΊΠΈ. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ Π²ΡΠ·ΠΎΠ²Π΅ΠΌ:
ΠΠΎΠ»ΡΡΠ°Π΅ΠΌ, ΡΡΠΎ Π² ΡΡΠΎΠ»Π±ΡΠ΅ Age
Ρ Π½Π°Ρ 177 ΠΏΡΠΎΠΏΡΡΠΊΠΎΠ², Π° Π² Cabin
Π°ΠΆ 687, ΡΡΠΎ ΡΠΈΠ»ΡΠ½ΠΎ Π±ΠΎΠ»ΡΡΠ΅ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Ρ.
ΠΠ°Π»Π΅Π΅, ΠΎΡΠ΅Π½ΠΈΠΌ Π²ΡΠΆΠΈΠ²Π°Π΅ΠΌΠΎΡΡΡ. ΠΠ»Ρ ΠΏΡΠΎΡΡΠΎΡΡ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·Π°ΡΠΈΠΈ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ seaborn. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠΈΡΡ Π΅Π΅ ΠΈ matplotlib.
ΠΠ°ΠΊ Π²ΠΈΠ΄ΠΈΠΌ, Π²ΡΠΆΠΈΠ»ΠΎ Π»ΡΠ΄Π΅ΠΉ ΠΌΠ΅Π½ΡΡΠ΅, ΡΠ΅ΠΌ ΠΏΠΎΠ³ΠΈΠ±Π»ΠΎ.
Π’Π΅ΠΏΠ΅ΡΡ ΠΏΠΎΡΠΌΠΎΡΡΠΈΠΌ, ΠΊΠ°ΠΊ Ρ Π²ΡΠΆΠΈΠ²Π°Π΅ΠΌΠΎΡΡΡΡ Ρ ΠΌΡΠΆΡΠΈΠ½ ΠΈ ΠΆΠ΅Π½ΡΠΈΠ½ ΠΎΡΠ΄Π΅Π»ΡΠ½ΠΎ.
ΠΠΈΠ΄ΠΈΠΌ, ΡΡΠΎ ΠΌΡΠΆΡΠΈΠ½ ΠΏΠΎΠ³ΠΈΠ±Π»ΠΎ Π³ΠΎΡΠ°Π·Π΄ΠΎ Π±ΠΎΠ»ΡΡΠ΅, ΡΠ΅ΠΌ Π²ΡΠΆΠΈΠ»ΠΎ. Π Π±ΠΎΠ»ΡΡΠ°Ρ ΡΠ°ΡΡΡ ΠΆΠ΅Π½ΡΠΈΠ½ Π²ΡΠΆΠΈΠ»Π°.
ΠΠ°Π»Π΅Π΅ Π²Π·Π³Π»ΡΠ½Π΅ΠΌ, ΠΊΠ°ΠΊ Π·Π°Π²ΠΈΡΠ΅Π»Π° Π²ΡΠΆΠΈΠ²Π°Π΅ΠΌΠΎΡΡΡ ΠΎΡ ΠΊΠ»Π°ΡΡΠ° ΠΊΠ°ΡΡΡ.
ΠΠΈΠ΄ΠΈΠΌ Π²ΡΠΏΠ»Π΅ΡΠΊ ΡΡΠ΅Π΄ΠΈ ΠΏΠΎΠ³ΠΈΠ±ΡΠΈΡ ΠΏΠ°ΡΡΠ°ΠΆΠΈΡΠΎΠ² 3 ΠΊΠ»Π°ΡΡΠ°.
ΠΠ΅ Π·Π°ΠΊΠ°ΠΏΡΠ²Π°ΡΡΡ Π³Π»ΡΠ±ΠΎΠΊΠΎ Π² Π΄Π°ΡΠ°ΡΠ΅Ρ, Π²ΠΈΠ΄ΠΈΠΌ ΡΠ²Π½ΡΡ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΡ Π²ΡΠΆΠΈΠ²Π°Π΅ΠΌΠΎΡΡΠΈ ΠΎΡ ΠΏΠΎΠ»Π° ΠΈ ΠΊΠ»Π°ΡΡΠ° ΠΊΠ°ΡΡΡ.
Π ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΊΡΠΎΠΌΠ΅ Π²ΡΠ±ΡΠ°Π½Π½ΡΡ ΠΏΠΎΠ»Π° ΠΈ ΠΊΠ»Π°ΡΡΠ° ΠΊΠ°ΡΡΡ, Π²ΠΎΠ·ΡΠΌΠ΅ΠΌ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠΎΠ΄ΠΈΡΠ΅Π»Π΅ΠΉ\Π΄Π΅ΡΠ΅ΠΉ ΠΈ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ Π±ΡΠ°ΡΡΠ΅Π²\ΡΠ΅ΡΡΠ΅Ρ Π½Π° Π±ΠΎΡΡΡ. ΠΡΠΎΠ³ΠΎΠ²ΡΠΉ ΡΠΏΠΈΡΠΎΠΊ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ² Π±ΡΠ΄Π΅Ρ Π²ΡΠ³Π»ΡΠ΄Π΅ΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ:
ΠΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ ΠΎ Π²ΡΠΆΠΈΠ²ΡΠΈΡ ΠΈ ΠΏΠΎΠ³ΠΈΠ±ΡΠΈΡ ΠΏΠ°ΡΡΠ°ΠΆΠΈΡΠ°Ρ ΠΏΠΎΠΌΠ΅ΡΡΠΈΠΌ Π² ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ y:
ΠΡΠ»ΠΈ Π²Ρ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΎΡΠΌΠΎΡΠ°Π΅ΡΠ΅ Π½Π°Π·Π°Π΄, ΡΠΎ ΡΠ²ΠΈΠ΄ΠΈΡΠ΅, ΡΡΠΎ Π² ΡΡΠΎΠ»Π±ΡΠ΅ Sex
Π½Π°Ρ
ΠΎΠ΄ΡΡΡΡ Π½Π΅ ΡΠΈΡΠ»Π°, Π° ΡΡΡΠΎΠΊΠΈ, ΠΊΠΎΠ³Π΄Π° ΠΎΡΡΠ°Π»ΡΠ½ΡΠ΅ ΠΎΡΠΎΠ±ΡΠ°Π½Π½ΡΠ΅ Π½Π°ΠΌΠΈ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΈ ΡΠ²Π»ΡΡΡΡΡ ΡΠΈΡΠ»Π°ΠΌΠΈ. ΠΠ°Π²Π°ΠΉΡΠ΅ ΠΏΡΠ΅Π²ΡΠ°ΡΠΈΠΌ ΡΡΠΎΡ ΡΡΠΎΠ»Π±Π΅Ρ Π² ΠΏΠ°ΡΡ ΡΠΈΠΊΡΠΈΠ²Π½ΡΡ
ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ
. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ Π² Pandas Π΅ΡΡΡ ΡΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½ΡΠΉ ΠΌΠ΅ΡΠΎΠ΄, ΠΊΠΎΡΠΎΡΡΠΉ Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ get_dummies()
. Π‘Π΄Π΅Π»Π°Π΅ΠΌ ΡΡΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΡ ΠΊΠ°ΠΊ Π΄Π»Ρ ΠΎΠ±ΡΡΠ°ΡΡΠ΅ΠΉ Π²ΡΠ±ΠΎΡΠΊΠΈ, ΡΠ°ΠΊ ΠΈ Π΄Π»Ρ ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ.
ΠΠ±ΡΠ°ΡΠΈΡΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΡΡΠΎ ΡΡΠΎΠ»Π±Π΅Ρ Sex
ΠΈΡΡΠ΅Π·, Π° Π²ΠΌΠ΅ΡΡΠΎ Π½Π΅Π³ΠΎ ΠΏΠΎΡΠ²ΠΈΠ»ΠΎΡΡ Π΄Π²Π° ΡΡΠΎΠ»Π±ΡΠ° Sex_female
ΠΈ Sex_male
.
Π’Π΅ΠΏΠ΅ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π°Π½ΡΠ°ΠΌΠ±Π»Ρ ΡΠ΅ΡΠ°ΡΡΠΈΡ Π΄Π΅ΡΠ΅Π²ΡΠ΅Π² ΠΎΠ±ΡΡΠΈΠΌ Π½Π°ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ, ΡΠ΄Π΅Π»Π°Π΅ΠΌ ΠΏΡΠ΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅ Π΄Π»Ρ ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π²ΡΠ±ΠΎΡΠΊΠΈ ΠΈ ΡΠΎΡ ΡΠ°Π½ΠΈΠΌ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ. ΠΠ½ΡΠ°ΠΌΠ±Π»Ρ ΡΠ΅ΡΠ°ΡΡΠΈΡ Π΄Π΅ΡΠ΅Π²ΡΠ΅Π² Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ Random Forest.
ΠΠΎΡ ΠΈ Π²ΡΠ΅. ΠΡΡΠ°Π»ΠΎΡΡ ΠΎΡΠΏΡΠ°Π²ΠΈΡΡ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ Π² ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΠ΅. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ Π² ΠΏΡΠ°Π²ΠΎΠΌ Π²Π΅ΡΡ Π½Π΅ΠΌ ΡΠ³Π»Ρ Π½Π°ΠΆΠΈΠ²Π°Π΅ΠΌ ΠΊΠ½ΠΎΠΏΠΊΡ Save version. ΠΠΎΡΠ»Π΅ ΡΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Π±Π»ΠΎΠΊΠ½ΠΎΡ ΡΠΎΡ ΡΠ°Π½ΠΈΡΡΡ, Π½Π°ΠΆΠΈΠΌΠ°Π΅ΠΌ Π½Π° ΡΠΈΡΡΡ Π²ΠΎΠ·Π»Π΅ ΡΡΠΎΠΉ ΠΊΠ½ΠΎΠΏΠΊΠΈ.
ΠΡΠΊΡΠΎΠ΅ΡΡΡ ΠΎΠΊΠ½ΠΎ Version history. Π ΠΏΡΠ°Π²ΠΎΠΌ ΡΠΏΠΈΡΠΊΠ΅, Π½Π°ΠΆΠΈΠΌΠ°Π΅ΠΌ Π½Π° ΠΌΠ½ΠΎΠ³ΠΎΡΠΎΡΠΈΠ΅ ΠΎΠΊΠΎΠ»ΠΎ ΡΠΎΠ»ΡΠΊΠΎ ΡΡΠΎ ΡΠΎΡ ΡΠ°Π½Π΅Π½Π½ΠΎΠΉ Π²Π΅ΡΡΠΈΠΈ ΠΈ Π½Π°ΠΆΠΈΠΌΠ°Π΅ΠΌ Submit to competition.
ΠΠΎΡΠ²Π»ΡΠ΅ΡΡΡ ΠΎΠΊΠΎΡΠΊΠΎ, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ Π½Π°ΠΆΠΈΠΌΠ°Π΅ΠΌ submit.
ΠΠΎΠ·Π΄ΡΠ°Π²Π»ΡΡ! ΠΡ Π·Π°ΠΊΠΎΠ½ΡΠΈΠ»ΠΈ ΡΠ²ΠΎΠ΅ ΠΏΠ΅ΡΠ²ΠΎΠ΅ ΡΠΎΡΠ΅Π²Π½ΠΎΠ²Π°Π½ΠΈΠ΅ Π½Π° kaggle. ΠΠ°ΠΆΠΌΠΈΡΠ΅ Π½Π° view my submission, ΡΡΠΎΠ±Ρ Π²Π·Π³Π»ΡΠ½ΡΡΡ Π½Π° ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ.
Π§Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ ΡΠΈΡΠ»ΠΎ ΠΊ 1, ΡΠ΅ΠΌ Π»ΡΡΡΠ΅. ΠΠΎ 0.775, ΡΠΎΠ³Π»Π°ΡΠΈΡΠ΅ΡΡ, Π½Π΅ΠΏΠ»ΠΎΡ ΠΎ Π΄Π»Ρ ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ ΡΠ°Π·Π°.
ΠΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Ρ Π΄Π»Ρ ΠΈΠ·ΡΡΠ΅Π½ΠΈΡ:
ΠΡΠΈ ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ΅ Π±ΡΠ»ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½Ρ ΠΌΠ°ΡΠ΅ΡΠΈΠ°Π»Π° ΠΈΠ· ΠΠΈΠΊΠΈΠΏΠ΅Π΄ΠΈΠΈ ΠΈ ΠΠ΅ΡΠ½Π΅ΠΉ ΡΠΊΠΎΠ»Ρ Π‘Π±Π΅ΡΠ°.
ΠΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ