J:
Kāpēc datu zinātniekiem ir svarīgi censties panākt caurspīdīgumu?
A:Datu zinātnes projektos un mašīnmācīšanās programmās pārredzamība ir būtiska, daļēji sarežģītības un sarežģītības dēļ, kas tos virza - tāpēc, ka šīs programmas “mācās” (rada varbūtības rezultātus), nevis seko iepriekš noteiktām lineārās programmēšanas instrukcijām, un tāpēc, ka rezultātā var būt grūti saprast, kā tehnoloģija izdara secinājumus. Šajā jomā liela problēma ir mašīnmācīšanās algoritmu “melnās kastes” problēma, kas nav pilnībā izskaidrojama cilvēku lēmumu pieņēmējiem.
Paturot to prātā, visticamāk, galvenā uzmanība tiks pievērsta tam, kā uzņēmumi tiecas apgūt datu zinātnieka talantus, lai apgūtu skaidrojamas mašīnmācības vai “izskaidrojamas AI”. Jau DARPA, iestāde, kas mums atnesa internetu, finansē vairāku miljardu dolāru lielu skaidrojamo AI pētījumu, cenšoties popularizēt prasmes un resursus, kas nepieciešami mašīnmācīšanās un mākslīgā intelekta tehnoloģiju izveidošanai, kas ir caurspīdīga cilvēkiem.
Viens veids, kā par to domāt, ir tāds, ka talantu attīstībā bieži ir “rakstpratības pakāpe” un “hiperliteratūras pakāpe”. Datu zinātniekam tradicionālais rakstpratības posms ir zināšanas par to, kā salikt mašīnmācīšanās programmas un kā veidot algoritmi ar tādām valodām kā Python; kā izveidot neironu tīklus un strādāt ar tiem. Hiperliteratūras pakāpe ir spēja apgūt skaidrojamo AI, nodrošināt caurspīdīgumu mašīnmācīšanās algoritmu izmantošanā un saglabāt caurspīdīgumu, jo šīs programmas darbojas savu mērķu un to apstrādātāju mērķu sasniegšanai.
Vēl viens veids, kā izskaidrot pārredzamības nozīmi datu zinātnē, ir tas, ka izmantotās datu kopas kļūst arvien sarežģītākas un tādējādi potenciāli uzmācīgākas cilvēku dzīvē. Vēl viens būtisks skaidrojams mašīnmācības un datu zinātnes virzītājspēks ir Eiropas vispārējā datu aizsardzības regula, kas nesen tika ieviesta, lai mēģinātu ierobežot neētisku personas datu izmantošanu. Izmantojot GDPR kā pārbaudes gadījumu, eksperti var redzēt, kā nepieciešamība izskaidrot datu zinātnes projektus iekļaujas privātuma un drošības problēmās, kā arī biznesa ētikā.
