Mājas Jaunumi Kāpēc funkciju atlase ir tik svarīga mašīnmācībā?

Kāpēc funkciju atlase ir tik svarīga mašīnmācībā?

Anonim

J:

Kāpēc funkciju atlase ir tik svarīga mašīnmācībā?

A:

Funkciju izvēle ir ārkārtīgi svarīga mašīnmācībā galvenokārt tāpēc, ka tā kalpo kā pamata paņēmiens, lai mainīgo izmantošanu virzītu uz to, kas ir visefektīvākais dotajā mašīnmācīšanās sistēmā.

Eksperti runā par to, kā darbojas funkciju atlase un funkciju iegūšana, lai samazinātu dimensijas lāstu vai palīdzētu tikt galā ar pārmērīgu aprīkošanu - tie ir dažādi veidi, kā pievērsties pārlieku sarežģītas modelēšanas idejai.

Bezmaksas lejupielāde: mašīnmācīšanās un kāpēc tas ir svarīgi

Vēl viens veids, kā to pateikt, ir tas, ka funkciju izvēle palīdz izstrādātājiem rīkus mašīnmācības mācību komplektos izmantot tikai visatbilstošākos un noderīgākos datus, kas dramatiski samazina izmaksas un datu apjomu.

Viens piemērs ir ideja izmērīt sarežģītu formu mērogā. Tā kā programma mērogojas, tā identificē lielāku datu punktu skaitu, un sistēma kļūst daudz sarežģītāka. Bet sarežģīta forma nav tipiska datu kopa, kuru izmanto mašīnmācīšanās sistēma. Šīs sistēmas var izmantot datu kopas, kurām dažādu mainīgo lielumu dispersijas līmeņi ir ļoti atšķirīgi. Piemēram, klasificējot sugas, inženieri var izmantot funkciju atlasi, lai izpētītu tikai tos mainīgos lielumus, kas viņiem sniegs mērķtiecīgākos rezultātus. Ja katram diagrammas dzīvniekam ir vienāds acu vai kāju skaits, šos datus var noņemt vai iegūt citus būtiskākus datu punktus.

Funkciju izvēle ir diskriminējošs process, kurā inženieri virza mašīnmācīšanās sistēmas mērķa virzienā. Papildus idejai par sistēmu sarežģītības novēršanu mērogā, funkciju izvēle var būt noderīga arī tādu aspektu optimizācijā, ko eksperti mašīnmācībā sauc par “novirzes varianta kompromisu”.

Iemesli, kāpēc funkciju atlase palīdz ar novirzēm un dispersijas analīzi, ir sarežģītāki. Kornellas universitātes pētījums par funkciju izvēli, neobjektivitātes dispersiju un iepakošanu kalpo, lai parādītu, kā funkciju izvēle palīdz.

Pēc autoru domām, rakstā "apskatīts mehānisms, ar kura funkciju izvēli tiek uzlabota uzraudzīto mācību precizitāte".

Pētījumā arī norādīts:

Empīriskā novirzes / dispersijas analīze, progresējot funkciju izvēlei, norāda, ka visprecīzākais iezīmju komplekts atbilst vislabākajam novirzes varianta kompromisa punktam mācību algoritmā.

Diskutējot par izteiktas vai vājas atbilstības izmantošanu, rakstnieki runā par pazīmju izvēli kā "dispersijas samazināšanas metodi" - tas ir jēga, ja domājat par dispersiju kā būtību par variācijas daudzumu dotajā mainīgajā. Ja dispersijas nav, datu punkts vai masīvs būtībā var būt bezjēdzīgs. Ja ir ārkārtīgi lielas novirzes, tas var attiekties uz to, ko inženieri var uzskatīt par “troksni” vai nebūtiskiem, patvaļīgiem rezultātiem, kurus mašīnmācīšanās sistēmai ir grūti pārvaldīt.

Ņemot to vērā, funkciju izvēle ir būtiska dizaina sastāvdaļa mašīnmācībā.

Kāpēc funkciju atlase ir tik svarīga mašīnmācībā?