Klasterləşdirmə və təsnifat arasındakı əsas fərq ondan ibarətdir ki, klasterləşmə oxşar nümunələri xüsusiyyətlər əsasında qruplaşdıran nəzarətsiz öyrənmə texnikasıdır, təsnifat isə xüsusiyyətlər əsasında nümunələrə əvvəlcədən təyin edilmiş teqlər təyin edən nəzarət edilən öyrənmə texnikasıdır.
Klasterləşdirmə və təsnifat oxşar proseslər kimi görünsə də, mənalarına görə onlar arasında fərq var. Data mining dünyasında klasterləşmə və təsnifat iki növ öyrənmə metodudur. Bu metodların hər ikisi obyektləri bir və ya bir neçə xüsusiyyətlə qruplara ayırır.
Klasterləşmə nədir?
Klasterləşdirmə, oxşar xüsusiyyətləri olan obyektlərin bir araya gəlməsi və fərqli xüsusiyyətləri olan obyektlərin bir-birindən ayrılması üçün obyektlərin qruplaşdırılması üsuludur. Maşın öyrənməsi və məlumatların çıxarılması üçün statistik məlumatların təhlili üçün ümumi bir texnikadır. Kəşfiyyat xarakterli məlumatların təhlili və ümumiləşdirilməsi də qruplaşmadan istifadə edən sahədir.
Şəkil 01: Klasterləşdirmə
Klasterləşmə nəzarətsiz verilənlərin əldə edilməsinə aiddir. Bu, tək bir xüsusi alqoritm deyil, bir tapşırığı həll etmək üçün ümumi bir üsuldur. Buna görə də müxtəlif alqoritmlərdən istifadə edərək klasterləşməyə nail olmaq mümkündür. Müvafiq klaster alqoritmi və parametr parametrləri fərdi məlumat dəstlərindən asılıdır. Bu, avtomatik tapşırıq deyil, təkrarlanan kəşf prosesidir. Buna görə də, nəticə istənilən xüsusiyyətlərə nail olana qədər məlumatların işlənməsi və parametrlərin modelləşdirilməsini dəyişdirmək lazımdır. K-vasitəsilə klasterləşdirmə və İerarxik klasterləşdirmə verilənlərin əldə edilməsində iki ümumi qruplaşma alqoritmidir.
Təsnifat nədir?
Təsnifat obyektləri tanımaq, fərqləndirmək və başa düşmək üçün təlim məlumat dəstindən istifadə edən kateqoriyalaşdırma prosesidir. Təsnifat təlim toplusunun və düzgün müəyyən edilmiş müşahidələrin mövcud olduğu nəzarət edilən öyrənmə texnikasıdır.
Şəkil 02: Təsnifat
Təsnifatı həyata keçirən alqoritm təsnifatçı, müşahidələr isə nümunələrdir. K-Yaxın Qonşu alqoritmi və qərar ağacı alqoritmləri verilənlərin əldə edilməsində ən məşhur təsnifat alqoritmləridir.
Klasterləşdirmə və Təsnifat Arasındakı Fərq Nədir?
Klasterləşmə nəzarətsiz öyrənmədir, Təsnifat isə nəzarət edilən öyrənmə texnikasıdır. O, oxşar nümunələri xüsusiyyətlər əsasında qruplaşdırır, təsnifat isə xüsusiyyətlər əsasında nümunələrə əvvəlcədən təyin edilmiş teqləri təyin edir. Klasterləşdirmə oxşar xüsusiyyətlərə malik nümunələri qruplaşdırmaq üçün verilənlər dəstini alt çoxluqlara bölür. O, etiketli datadan və ya təlim dəstindən istifadə etmir. Digər tərəfdən, yeni məlumatları təlim toplusunun müşahidələrinə görə təsnif edin. Təlim dəsti etiketlənib.
Klasterləşdirmənin məqsədi obyektlər toplusunu qruplaşdırmaq və onlar arasında hər hansı əlaqənin olub-olmadığını tapmaqdır, təsnifat isə əvvəlcədən təyin edilmiş siniflər dəstindən yeni obyektin hansı sinfə aid olduğunu tapmaqdır.
Xülasə – Klasterləşdirmə və Təsnifat
Klasterləşdirmə və təsnifat oxşar görünə bilər, çünki hər iki verilənlərin öyrənilməsi alqoritmləri verilənlər toplusunu alt çoxluqlara bölür, lakin onlar xam verilənlər toplusundan etibarlı məlumat əldə etmək üçün verilənlərin əldə edilməsində iki fərqli öyrənmə texnikasıdır. Klasterləşdirmə və təsnifat arasındakı fərq ondan ibarətdir ki, klasterləşmə oxşar nümunələri xüsusiyyətlər əsasında qruplaşdıran nəzarətsiz öyrənmə texnikasıdır, təsnifat isə xüsusiyyətlər əsasında nümunələrə əvvəlcədən təyin edilmiş teqlər təyin edən nəzarət edilən öyrənmə texnikasıdır.
Şəkil Nəzakət:
1.”Cluster-2″ by Cluster-2.gif: hellisp törəmə işi: (İctimai Domain) Wikimedia Commons 2 vasitəsilə. Con Aplessed tərəfindən “Maqnetizm” – Öz işi. (İctimai Domen) Wikimedia Commonsvasitəsilə