Mājas Tendences Kāds ir vienkāršs veids, kā aprakstīt neobjektivitāti un atšķirības mašīnmācībā?

Kāds ir vienkāršs veids, kā aprakstīt neobjektivitāti un atšķirības mašīnmācībā?

Anonim

J:

Kāds ir vienkāršs veids, kā aprakstīt neobjektivitāti un atšķirības mašīnmācībā?

A:

Mašīnmācībā ir daudz dažādu sarežģītu paņēmienu, kā aprakstīt aizspriedumus un atšķirības. Daudzi no tiem izmanto ievērojami sarežģītus matemātiskos vienādojumus un grafikā parāda, kā konkrēti piemēri attēlo dažādas nobīdes un dispersijas.

Šeit aprakstīts vienkāršs veids, kā aprakstīt novirzes, dispersijas un novirzes / dispersijas kompromisu mašīnmācībā.

Tā būtība ir aizspriedumu vienkāršošana. Neobjektivitātes definīcijai var būt svarīgi pievienot pieņēmumu vai pieļautu kļūdu.

Ja ļoti neobjektīvs rezultāts nebūtu kļūdains - ja tas būtu saistīts ar naudu -, tas būtu ļoti precīzi. Problēma ir tā, ka vienkāršotajā modelī ir dažas kļūdas, tāpēc tas nav uz redzesloka - ievērojamā kļūda tiek atkārtota vai pat pastiprināta, darbojoties mašīnmācīšanās programmai.

Vienkārša dispersijas definīcija ir tāda, ka rezultāti ir pārāk izkliedēti. Tas bieži rada programmas pārmērīgu sarežģītību un problēmas starp testa un mācību komplektiem.

Liela dispersija nozīmē, ka nelielas izmaiņas rada lielas izmaiņas iznākumos vai rezultātos.

Vēl viens veids, kā vienkārši raksturot dispersiju, ir tāds, ka modelī ir pārāk daudz trokšņu, un tāpēc mašīnmācīšanās programmai ir grūtāk izolēt un identificēt reālo signālu.

Tātad viens no vienkāršākajiem veidiem, kā salīdzināt neobjektivitāti un dispersiju, ir ieteikt, ka mašīnmācības inženieriem jānoiet precīza robeža starp pārāk lielu neobjektivitāti vai pārāk vienkāršošanu un pārāk lielu dispersiju vai pārlieku sarežģītību.

Vēl viens veids, kā attēlot šo aku, ir četru kvadrantu diagramma, kurā parādītas visas augstas un zemas dispersijas kombinācijas. Zemas novirzes / zemas dispersijas kvadrantā visi rezultāti tiek apkopoti precīzā klasterī. Rezultātā ar lielu novirzi / zemu dispersiju visi rezultāti tiek apkopoti neprecīzā klasterī. Rezultātā ar zemu novirzi / lielu dispersiju rezultāti ir izkliedēti pa centrālo punktu, kas apzīmē precīzu kopu, savukārt ar lielu nobīdi / lielu dispersiju rezultāta datu punkti ir gan izkliedēti, gan kolektīvi neprecīzi.

Kāds ir vienkāršs veids, kā aprakstīt neobjektivitāti un atšķirības mašīnmācībā?