J:
Kā jaunās mašīnmācīšanās iespējas ļauj iegūt finanšu datu krājuma dokumentus?
A:Viena no aizraujošajām mašīnmācības un AI robežām ir tā, ka zinātnieki un inženieri sāk dažādas iespējas, kā izmantot pilnīgi jauna veida resursus, lai prognozētu krājumu kustību un ieguldījumu rezultātus. Tas ir milzīgs spēles mainītājs finanšu pasaulē, un tas ļoti dziļi mainīs ieguldījumu stratēģiju.
Viena no pamatidejām šāda veida krājumu pētījumu paplašināšanai ir skaitļošanas valodniecība, kas ietver dabiskās valodas modelēšanu. Eksperti pēta, kā izmantot teksta dokumentus, sākot no SEC iesniegšanas līdz akcionāru vēstulēm un beidzot ar citiem perifērijas teksta resursiem, lai papildinātu vai precizētu krājumu analīzi vai izstrādātu pilnīgi jaunas analīzes.
Bezmaksas lejupielāde: mašīnmācīšanās un kāpēc tas ir svarīgi |
Svarīga atruna ir tāda, ka tas viss ir realizējams tikai ar pavisam jauniem sasniegumiem neironu tīklos, mašīnmācībām un dabiskās valodas analīzei. Pirms ML / AI parādīšanās skaitļošanas tehnoloģijas ieeju "lasīšanai" lielākoties izmantoja lineāro programmēšanu. Teksta dokumenti bija pārāk nestrukturēti, lai būtu noderīgi. Bet, ņemot vērā pēdējos gados panākto progresu dabiskās valodas analīzē, zinātnieki secina, ka ir iespējams “mīnot” dabisko valodu kvantitatīvi izsakāmiem rezultātiem vai, citiem vārdiem sakot, rezultātiem, kurus kaut kādā veidā var aprēķināt.
Daži no labākajiem pierādījumiem un visnoderīgākajiem piemēriem ir no dažādām disertācijām un doktora darbiem, kas pieejami tīmeklī. Lili Gao dokumentā "Mašīnmācības un skaitļojošās valodniecības pielietojumi finanšu ekonomikā", kas publicēts 2016. gada aprīlī, saturiski izskaidro attiecīgos procesus, kas raksturīgi korporatīvo vērtspapīru SEC dokumentu noformēšanai, akcionāru aicinājumiem un sociālo mediju ziņojumiem.
"Nozīmīgu signālu iegūšana no nestrukturētiem un lieliem teksta datiem nav viegls uzdevums, " raksta Gao. "Tomēr, attīstot mašīnmācības un skaitļošanas lingvistiskos paņēmienus, var tikt izpildīti tekstuālo dokumentu apstrādes un statistiskās analīzes uzdevumi, un daudzi statistiskās teksta analīzes pielietojumi sociālajās zinātnēs ir izrādījušies veiksmīgi." Pēc Gao diskusijas par modelēšanu un kalibrēšanu abstrakti, viss izstrādātais dokuments parāda, kā detalizēti darbojas daži šāda veida analīzes.
Citos aktīvo projektu avotos ir lapas, piemēram, šis GitHub projekta apraksts, un šis IEEE resurss īpaši runā par vērtīgas finanšu informācijas iegūšanu no "Twitter sentimenta analīzes".
Vissvarīgākais ir tas, ka šo jauno NLP modeļu izmantošana veicina ātras inovācijas visa veida teksta dokumentu izmantošanā ne tikai finanšu analīzei, bet arī cita veida progresīvākajiem atklājumiem, izpludinot tradicionāli izveidoto līniju starp “valodu” un "dati."
