Mājas Audio Kāda ir atšķirība starp runu un tekstu?

Kāda ir atšķirība starp runu un tekstu?

Anonim

J:

Kāda ir atšķirība starp runu un tekstu?

A:

Daudzās būtiskās atšķirības starp runas-teksta tehnoloģijām un tērzēšanas robotiem ir daļa no tā, kas tiek pārbaudīts chatbot un balss robotu projektu straujā attīstībā.

Runas-teksta tehnoloģija ir vienkārši tāda, kas verbālo runu pārvērš tekstā digitālā lapā. Tā ir tā pilnā funkcija, taču to nav vienkārši noformēt. Lai verbālo runu pārveidotu par tekstu, tehnoloģijai ir jāsadala vārdi un teikumi atsevišķās fonēmās un jāstrādā ar tiem pēc sarežģītiem algoritmiem, lai izveidotu tekstu, kas ir precīzs un atspoguļo runātāja teikto.

Tērzētavas, no otras puses, ir tehnoloģijas, kas sasniedz mērķi sazināties ar cilvēku. Ir divu veidu tērzēšanas roboti: teksta tērzēšanas un balss roboti. Teksta tērzēšanas roboti ir bijuši daudz ilgāki, jo viņiem nav nepieciešams runas-teksta elements, ko izmanto balss roboti.

Galvenā atšķirība starp runas-teksta tehnoloģijām un tērzēšanas robotiem ir darbības joma. Kā minēts, runas-teksta tehnoloģija ir tikai vārdiskās runas transkripcija. Tērzētavai, no otras puses, ir jāuzstājas ar runu neatkarīgi no tā, kurā formā tā paredzēta, to jāsaprot un jāsniedz atbildes, kas cenšas nokārtot Tjūringa testu - pārbaudi, vai tehnoloģija var maldināt cilvēku domāt, ka viņš / viņa ir saruna ar citu personu.

Paturot to prātā, tērzēšanas robotus ir daudz vieglāk izveidot nekā balss robotus. Čatbots uzņem cilvēka tekstu un nodrošina teksta atbildi. Pat samērā vienkārši tērzēšanas roboti ir spējuši cilvēkiem sniegt interesantus un patīkamus rezultātus kopš astoņdesmito gadu beigām un 90. gadu sākuma.

No otras puses, balss robotam ir jāpieņem verbālā runā, jāpārveido tas tekstā, jāpārbauda tā precizitāte, jāsniedz atbilde un šī reakcija no mašīnvalodas jāizveido dzirdamajā runā. Šis lielais diezgan nozīmīgo uzdevumu skaits nozīmē, ka balss robotam ir nepieciešams daudz skaitļošanas jaudas un daudz dizaina.

Tādi projekti kā Siri, Cortana un Alexa demonstrē daļu no balss robotu tehnoloģiju avangardiem. Viņi arī ilustrē, ka šī tehnoloģija joprojām ir sākuma stadijā. Kaut arī Alexa un citas tehnoloģijas var verbāli reaģēt uz cilvēka runu, tās nav īpaši spējīgas tādā nozīmē, ka mēs vispār asociējamies ar verbālo cilvēka runu. Citiem vārdiem sakot, atbildes, ko šīs tehnoloģijas var sniegt, ir diezgan ierobežotas. Mūsdienu personīgo palīgu paaudzei ir pat ierobežotas iespējas reāli ģenerēt runu uz tekstu, piemēram, e-pasta pārrakstīšanai vai kādam palīdzēt rakstīt eseju, neizmantojot rokas. Dažas no tirgū esošajām īpašajām runas-teksta programmām to dara labāk nekā Siri vai Cortana, iespējams, resursu piešķiršanas dēļ. Tomēr ir pazīmes, kas liecina, ka balss robotprogrammatūras izstrāde drīz sāks parādīties - piemēram, Amazon's Lex platforma, kas ļauj studijas vidē veidot šāda veida tehnoloģijas.

Gudrā un pamācošā esejā par šo tēmu Tobiass Gēbela runā par atšķirību starp šīm tehnoloģijām, pretstatot “transkripcijas” procesu, ko runā ar tekstu, līdz saprašanas darbam, kas, domājams, ir jāveic tērzēšanas robotiem.

"Lai gan runas atpazīšanas nepieciešamības mazināšana tērzēšanas robotam atvieglo lietas, galvenais izaicinājums funkcionējošu robotprogrammatūru izveidošanai ir dabiskās valodas izpratne, " raksta Gēbela.

Gēbele identificē arī daudzus pašreizējos nozares dalībniekus:

Runas atpazīšanas tirgus līderis ir Nuance, kurš aiz tādām pazīstamām sistēmām kā Dragon NaturallySpeaking diktē personālo datoru, kas darbojas jau kopš deviņdesmitajiem gadiem, kā arī Siri: runas atpazīšanas / transkripcijas uzdevums Apple mākonī izmanto Nianses tehnoloģija aizkulisēs. Citi ir LumenVox, Verbio vai Interactions, bet runas atpazīšana tagad tiek piedāvāta arī kā mākoņa pakalpojums, izmantojot API, piemēram, Amazon, Google, Microsoft un IBM.

Tā kā tērzēšanas roboti attīstās, tiek pieņemts, ka viņu izpratne turpinās pieaugt kādā trajektorijā - un lielākoties tiek arī pieņemts, ka vairāk robotprogrammatūru tehnoloģijas pāriet no teksta saskarnēm uz verbālām saskarnēm, pieprasot papildu skaitļošanas jaudas.

Kāda ir atšķirība starp runu un tekstu?