Mājas Audio Kāpēc maisiņu apguve mazina dispersiju?

Kāpēc maisiņu apguve mazina dispersiju?

Anonim

J:

Kāpēc maisiņu apguve mazina dispersiju?

A:

Sākotnējā stresa apvienošana jeb "maisa veidošana" mašīnmācībā samazina dispersiju, veidojot sarežģītāku datu kopu progresīvākus modeļus. Konkrēti, iepakošanas pieeja rada apakškopas, kuras bieži pārklājas, lai modelētu datus aktīvāk.

Viens interesants un skaidrs priekšstats par to, kā piemērot iepakošanu, ir ņemt nejaušu paraugu komplektu un iegūt vienkāršo vidējo. Pēc tam, izmantojot to pašu paraugu kopu, izveidojiet desmitiem apakškopu, kas izveidotas kā lēmumu pieņemšanas koki, lai manipulētu ar iespējamiem rezultātiem. Otrajam vidējam rādītājam vajadzētu parādīt precīzāku priekšstatu par to, kā šie atsevišķi paraugi ir savstarpēji saistīti vērtības ziņā. To pašu ideju var piemērot jebkuram datu punktu kopas īpašumam.

Bezmaksas lejupielāde: mašīnmācīšanās un kāpēc tas ir svarīgi

Tā kā šī pieeja konsolidē atklāšanu precīzāk noteiktās robežās, tā samazina dispersiju un palīdz pārmērīgas uzstādīšanas gadījumā. Iedomājieties izkliedes punktu ar nedaudz sadalītiem datu punktiem; izmantojot iepakošanas metodi, inženieri "sarauj" sarežģītību un orientē atklāšanas līnijas uz vienmērīgākiem parametriem.

Daži runā par iepakošanas vērtību kā “sadalīt un iekarot” vai “atbalstītās heiristikas” veidu. Ideja ir tāda, ka, izmantojot ansambļu modelēšanu, piemēram, izmantojot nejaušus mežus, tie, kas maisiņus izmanto kā paņēmienu, var iegūt mazākas dispersijas datu rezultātus. Samazinot sarežģītību, pārpildīšana var palīdzēt arī iesaiņošana. Iedomājieties modeli, kurā ir pārāk daudz datu punktu: teiksim, savienojamie punkti ar 100 nesaskaņotiem punktiem. Iegūtā vizuālā datu līnija būs robaina, dinamiska, nepastāvīga. Pēc tam "izlīdziniet" dispersiju, saliekot novērtējumu kopas. Ansambļu mācībā tas bieži tiek domāts kā apvienošanās ar vairākiem "vājiem audzēkņiem", lai nodrošinātu "spēcīgas mācīšanās" sadarbības rezultātu. Rezultāts ir vienmērīgāka, kontūrētāka datu līnija un mazāk savvaļas dispersijas modelī.

Ir viegli redzēt, kā ideju par iepakošanu var izmantot uzņēmuma IT sistēmās. Uzņēmējdarbības vadītāji bieži vēlas “putna lidojuma skatījumu” uz notiekošo ar produktiem, klientiem utt. Pārmērīgi pielāgots modelis var sniegt mazāk sagremojamus datus un vairāk “izkliedētus” rezultātus, kur maisiņi var “stabilizēt” modeli un padarīt to noderīgāku. gala lietotājiem.

Kāpēc maisiņu apguve mazina dispersiju?