Satura rādītājs:
Definīcija - ko nozīmē AlphaGo?
AlphaGo ir šaura AI, datorprogramma, kuru izstrādājis Google DeepMind, lai spēlētu Go, Ķīnas stratēģijas galda spēli diviem spēlētājiem, kas līdzinās šaham. AlphaGo ir pati pirmā AI programma, kas 2015. gada oktobrī spēja pieveikt profesionālu cilvēku spēlētāju, 2-dan spēlētāju Fan Hui, uz pilna izmēra dēļa bez traucējumiem. Pēc tam tas 2016. gada martā pārspēja vienu no visaugstāk novērtētajiem cilvēku spēlētājiem pasaulē 9-dan Lee Sedol, uzvarot četrās spēlēs no piecām.
Techopedia skaidro AlphaGo
AlphaGo projekts tika uzsākts 2014. gadā kā testa gulta, lai redzētu, cik veiksmīgi Google DeepMind neironu tīkla algoritms, kas izmanto dziļas mācības, varētu konkurēt vietnē Go. AlphaGo algoritms ir koku meklēšanas un mašīnmācīšanās metožu kombinācija, un to pastiprina plaša apmācība gan cilvēkiem, gan citiem datoru spēlētājiem. Tas izmanto Monte Karlo koka meklēšanu, un to vada politikas un vērtību tīkls, kas ieviests, izmantojot dziļo neironu tīkla tehnoloģijas. Politikas tīkls ir apmācīts un palīdz AI paredzēt nākamo gājienu, kurš, visticamāk, uzvarēs, kamēr vērtību tīkls tiek apmācīts, lai sašaurinātu meklēšanas koku un noteiktu šo pozīciju vērtību, novērtējot uzvarētājus katrā pozīcijā, nevis meklējot līdz galam. līdz spēles beigām.
Sākotnēji AlphaGo tika baroti ar vēsturiskiem spēlētāju gājieniem no spēlētājiem, izmantojot datubāzi ar apmēram 30 miljoniem gājienu, padarot to imitētu cilvēku spēles. Kad AI sasniedza zināšanu līmeni, tā tika tālāk apmācīta, liekot tai spēlēties pret pašiem gadījumiem, izmantojot pastiprināšanas mācības, lai pilnveidotu un uzzinātu vairāk.
2015. gada oktobrī izplatītā AlphaGo skaitļošanas versija spēlēja un pieveica 2-dan Eiropas Go čempionu Fan Hui, pirmo reizi atzīmējot, ka datorprogramma ir pieveikusi profesionālu spēlētāju Go. Fans Hui pēc tam palīdzēja kā DeepMind komandas konsultants mēnešus pēc viņa sakāves. 2016. gada martā AlphaGo devās pretī Lī Sedolam - vienam no visaugstāk spēlētājiem pasaulē, kurš ir sasniedzis 9-dan augstāko līmeni. Uzvarot četras Lī spēles, tas iezīmēja lielu sasniegumu AI izpētē, jo tas nozīmēja, ka DeepMind izmantoto dziļo mācību un neironu tīklu algoritmu var izmantot citiem mērķiem, jo tas nebija īsti ieprogrammēts spēlēt Go, bet drīzāk tika mācīts. kā spēlēt Go. Tas paver pilnīgi jaunu pasauli AI izpētei.
