J:
Kā līdzsvara jēdziens varētu informēt mašīnmācīšanās projektus?
A:Kopumā līdzsvars informēs mašīnmācīšanos, cenšoties stabilizēt mašīnmācīšanās vidi un radīt rezultātus ar saderīgu deterministisko un varbūtīgo komponentu sajaukumu.
Eksperti raksturo "līdzsvaru" kā situāciju, kad racionāli dalībnieki mašīnmācīšanās sistēmā panāk vienprātību par stratēģisko rīcību - it īpaši Neša līdzsvars spēles teorijā ietver divus vai vairākus no šiem racionālajiem dalībniekiem, kas konsolidē stratēģijas, atzīstot, ka neviens spēlētājs negūst labumu no mainot noteiktu stratēģiju, ja pārējie spēlētāji nemaina savu.
Bezmaksas lejupielāde: mašīnmācīšanās un kāpēc tas ir svarīgi |
Īpaši populārs un vienkāršs Neša līdzsvara demonstrējums ietver vienkāršu matricu, kurā divi spēlētāji katrs izvēlas bināru rezultātu.
Iepriekš minētais ir diezgan tehnisks veids, kā aprakstīt līdzsvaru un tā darbību. Daudz neformālāks veids, kā ilustrēt līdzsvara jēdzienu, it īpaši iepriekš minētais divu racionālu dalībnieku piemērs, kuriem katram ir bināra izvēle, ir padomāt par to, ko jūs varētu nosaukt par "staigāšanu vienam pret otru vidusskolas priekšnamā".
Pieņemsim, ka divi cilvēki dažādos virzienos staigā pa vidusskolas gaiteni (vai jebkura cita veida zonu), kur platumā ir vietas tikai diviem cilvēkiem. Divi atvērtie ceļi ir bināri rezultāti. Ja divi racionāli dalībnieki izvēlas dažādus bināros iznākumus, kas nav pretrunā viens ar otru, viņi paies garām un saka sveiki. Ja viņi izvēlas divus pretrunīgus bināros iznākumus - viņi staigā vienā telpā, un vienam no tiem būs jāiegūst.
Iepriekš minētajā piemērā, ja divi racionāli dalībnieki izvēlas divus saderīgus un nekonfliktējošus rezultātus, vispārējā vienprātība ir tāda, ka neviens negūst labumu, mainot viņu stratēģiju - šajā gadījumā viņu pastaigas virzienus -, ja otra persona nemaina savējo.
Iepriekš minētais veido līdzsvaru, ko var modelēt katrā konkrētajā mašīnmācīšanās konstruktā. Ņemot vērā šo vienkāršo piemēru, rezultāts vienmēr būs divi racionāli dalībnieki, kas sadarbojas, citiem vārdiem sakot, divi cilvēki, kas iet viens otram garām.
Pretējo varētu saukt par "līdzsvara trūkumu" - ja divi racionāli dalībnieki izvēlas pretrunīgus iznākumus, kā minēts, vienam no viņiem būs jādod rezultāts. Tomēr to modelējošā ML programma varētu tikt izmesta bezgalīgā cilpā, ja abi nolemj dot labumu - līdzīgi kā divi cilvēki, kas pārvietojas, lai mēģinātu izmitināt viens otru, un joprojām turpina iet uz sadursmi.
Līdzsvarus, piemēram, iepriekš minētos, parasti izmanto mašīnmācībā, lai radītu vienprātību un stabilizētu modeļus. Inženieri un izstrādātāji meklēs tos scenārijus un situācijas, kas gūst labumu no līdzsvara, un strādās, lai mainītu vai apstrādātu tos, kuriem nav. Aplūkojot reālās pasaules piemērus, kas atbilst ML līdzsvaram, ir viegli saprast, kā šāda veida analīze mašīnmācīšanās sistēmā ir unikāli pamācoša, lai izdomātu, kā modelēt cilvēka uzvedību, veidojot racionālus dalībniekus un aģentus. Tas ir tikai viens lielisks piemērs tam, kā līdzsvaru var izmantot, lai sasniegtu progresu mašīnmācīšanās sistēmu piemērošanā.
