Mine sisu juurde

Kasutaja:Egert Teesaar/liivakast

Allikas: Vikipeedia

Binaarklassifitseerija headusmõõt on headusmõõt, mis hindab klassifitseerija tööd üksikklassi vaatepunktist. Binaarse klassifitseerija headusmõõtu saab ühtlasi kasutada mittebinaarsete klassifitseerijate poolt saadud tulemuste hindamiseks, kuid sel juhul tuleb välja valida klass, millele põhirõhk panna. Mitte ükski puhtalt binaarklassifitseerija headusmõõt ei ole võimeline hõlmama kõiki huvipakkuvaid aspekte[1].

Segadusmaatriks[muuda | muuda lähteteksti]

Segadusmaatriks, kus binaarklassifitseerija tulemusi saab esitada, on 2-korda-2-maatriks, mille ridadel üks ja kaks on vastavalt õigesti ning valesti ennustatud tulemused, vastavatel veergudel aga päriselt õiged ning valed väärtused. Segadusmaatriksit kasutatakse klassifitseerimisalgoritmi poolt saadud tulemuste jaotamiseks, kust klassifitseerija headusmõõt võtab vajaliku informatsiooni[1]. Maatriksi peadiagonaalil asetsevad kõik klassifikaatori pool õigesti ennustatud väärtused: õige-positiivsed, õige-negatiivsed. Kõik, mis jääb peadiagonaalilt välja, on väärad: vale-positiivsed, vale-negatiivsed[2].

Headusmõõdud[muuda | muuda lähteteksti]

Täpsus (ingl accuracy)[muuda | muuda lähteteksti]

Täpsus on headusmõõt, mis on õige-positiivsete ja õige-negatiivsete summa ning vale-positiivsete ja vale-negatiivsete summa suhe. Täpsust tuleks kasutada, kui oluline on saada võimalikult palju õigeid vastuseid. Täpsuse miinuseks on informatsiooni vähesus klassifitseerimisalgoritmi tulemuste kohta, kuna see muudab neli numbrit üheks[2]. Täpsuse rakendamine on efeketiivne, kui klassid on jaotunud võrdselt. Mida ebaühtlasem on klasside jaotus või erineva klassi elementidel on erinev kaal, seda vähem kasulikku informatsiooni on võimalik välja lugeda täpsuse poolt saadud tulemusest[1]

Veategur (ingl error rate)[muuda | muuda lähteteksti]

Veategur on vastandlik headusmõõdule "täpsus". See saadakse täpsuse lahutamisel ühest. Samad piirangud, mis tulevad välja täpsuse kasutamisel, kehtivad ka veateguri puhul[1].

Tundlikkus (ingl sensitivity)[muuda | muuda lähteteksti]

Tundlikkus on headusmõõt, mis saadakse õige-positiivsete väärtuste jagamisel õige-positiivsete ja vale-negatiivsete väärtuste summaga[2]. Tundlikkust tuleb kasutada, kui vale-negatiivsete saamine on äärmiselt kulukas. Vahel kutsutakse ka saagiseks.

Täpsus (ingl precision)[muuda | muuda lähteteksti]

Täpsus on headusmõõt, mis saadakse õige-positiivsete väärtuste jagamisel õige-positiivsete ja vale-positiivsete väärtuste summaga[2].

Spetsiifilisus (ingl specificity)[muuda | muuda lähteteksti]

Spetsiifilisus on headusmõõt, mis saadakse õige-negatiivsete väärtuste jagamisel õige-negatiivsete ja vale-positiivsete väärtuste summaga[2]. Spetsiifilisust tuleb kasutada, kui vale-positiivsete saamine on äärmiselt kulukas.

F-skoor (ingl F-score)[muuda | muuda lähteteksti]

F-skoor on headusmõõt, mis kombineerib saagise ja tundlikkuse, ning on saagise ja tundlikkuse harmooniline keskmine[1].

ROC-graaf (ingl ROC graph)[muuda | muuda lähteteksti]

ROC graaf on graaf, mis aitab võrrelda mitme või ühe, kuid erinevate õppeparameetritega, klassifitseerija poolt saadud tulemusi. Graafi x-teljel on vale-positiivsete ning y-teljel õige-positiivsete arv. Klassifitseerija, mis ühtegi viga ei tee, satub ROC-graafil punkti (0,1), vastandlikult kõik väärtused valesti pakkunud klassifitseerija asub graafil punktis (1,0)[2].

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 1,2 1,3 1,4 NATHALIE JAPKOWICZ, MOHAK SHAH. Evaluating Learning Algorithms A Classification Perspective. Lk 77,94,102,103. {{raamatuviide}}: nähtamatu tähemärk (reavahetus) parameetris |pealkiri= positsioonil 31 (juhend)
  2. 2,0 2,1 2,2 2,3 2,4 2,5 Stephen Marsland. MACHINE LEARNING An Algorithmic Perspective S e c o n d E d i t i o n. Lk 23,24. {{raamatuviide}}: nähtamatu tähemärk (reavahetus) parameetris |pealkiri= positsioonil 8 (juhend)