Satura rādītājs:
- Mīts: visi ir priekšā mums, pieņemot lielus datus.
- Mīts: mums ir tik daudz datu; mums nav jāuztraucas par katru mazo datu trūkumu.
- Mīts: Lielo datu tehnoloģija novērsīs vajadzību pēc datu integrācijas.
- Mīts: datu noliktavas izmantošana uzlabotajai analītikai ir bezjēdzīga.
- Mīts: datu noliktavu aizstās datu ezeri.
- Lielie dati darbojas - jaunas datu manipulācijas metodes var nebūt
Jau 2014. gada maijā Forrester Research izdeva divus ziņojumus, izdarot noteiktus secinājumus par lielo datu apvidu. Pētījumu firma aptaujāja vairāk nekā 250 mārketinga un biznesa attīstības vadītājus. Pēc ziņojuma autoru domām, lielo datu retorika ir visu laiku augstākajā līmenī, un tehnoloģiju pārdevēji izstrādā produktus, kuriem šķiet neticami apgalvojumi.
Gartners piekrīt Forrester Research; būtiska hipe apņem lielos datus. 2014. gada septembra ziņojumā Gartner atmasko piecus no lielākajiem datu mītiem, un Gartner analītiķi piedāvā savu viedokli par to, kas tiek pārprasts par lielajiem datiem un ar tiem saistītajām manipulācijām. Kas tad ir lielo datu lielākie mīti? Paskatīsimies.
Mīts: visi ir priekšā mums, pieņemot lielus datus.
Gartners saka, ka interese par lielajiem datiem ir visu laiku augstāka. Neskatoties uz to, niecīgajam 13 procentiem aptaujāto ir darba sistēmas. Iemesls: lielākajai daļai uzņēmumu vēl nav izdomāts, kā no lielām datu krātuvēm iegūt vērtību. Šeit Gartnera aptauja ir optimistiskāka nekā Forrester ziņojums, kurā tika atklāts, ka tikai 9 procenti aptaujas dalībnieku teica, ka viņi nākamā gada laikā plāno ieviest lieldatu tehnikas. (Lielajiem datiem ir daudz ko piedāvāt. Uzziniet vairāk 5 reālās pasaules problēmās, kuras var atrisināt lielie dati.)Mīts: mums ir tik daudz datu; mums nav jāuztraucas par katru mazo datu trūkumu.
Gartner ir noraizējies par foajē, kas mums cilvēkiem ir: "Mums ir tik daudz, mazam, kas ir slikts, nav nozīmes." Teds Frīdmens, viceprezidents un izcils Gartnera analītiķis, uzskata, ka tas ir nepareizs veids, kā aplūkot situāciju.
"Patiesībā, kaut arī katram atsevišķam trūkumam ir daudz mazāka ietekme uz visu datu kopu nekā tas bija tad, kad bija mazāk datu, ir vairāk trūkumu nekā iepriekš, jo ir vairāk datu, " sacīja Frīdmens. "Tāpēc nekvalitatīvu datu kopējā ietekme uz visu datu kopu paliek nemainīga."
Frīdmens piebilst vēl vienu iemeslu bažām. Lielo datu uztveršana bieži ietver datus no ārpuses, kuriem tāpēc nav zināma struktūra un izcelsme. Tas palielina kļūdu iespējamību.
Mīts: Lielo datu tehnoloģija novērsīs vajadzību pēc datu integrācijas.
Ir divas galvenās datu analīzes stratēģijas, kuras var piemērot lieliem datiem: "shēma rakstīšanai" vai "shēma lasīšanai". Vēl nesen vienīgā izmantotā metode bija rakstīšanas shēma. Izlasītā shēma ir pašreizējā traka datu bāzes pārvaldībā. Atšķirībā no rakstīšanas shēmas, kurai nepieciešams strukturēts formāts, dati tiek ielādēti nolasītās shēmas datu bāzēs neapstrādātā formātā. Tad izstrādātāji, izmantojot nestrukturētas datu bāzes platformas, piemēram, Hadoop, saliek atšķirīgos datus izmantojamā formātā. Lasītajai shēmai ir acīmredzamas priekšrocības, bet, kā piemin Gartners, datu integrācijai kādā brīdī ir jānotiek.Mīts: datu noliktavas izmantošana uzlabotajai analītikai ir bezjēdzīga.
Daudziem informācijas pārvaldniekiem lieki tērēt laiku datu noliktavas izveidošanai, it īpaši, ja jaunieņemtie dati atšķiras no tiem, kas atrodas datu noliktavā. Tomēr Gartners vēlreiz brīdina, ka pat uzlabotā datu analītika izmantos datu noliktavas un jaunus datus, kas nozīmē, ka datu integrētājiem:- Pilnveidojiet jaunus datu tipus, lai tie būtu piemēroti analīzei
- Izlemiet, kuri dati ir atbilstoši, un nepieciešamo datu kvalitātes līmeni
- Nosakiet, kā apkopot datus
- Saprotiet, ka datu precizēšana var notikt citās vietās, nevis datu noliktavā
Mīts: datu noliktavu aizstās datu ezeri.
Datu ezeri ir atšķirīgu datu krātuves, nevis datu noliktavas, kur dati ir strukturētā formātā. Datu ezera izveidošana prasa nelielu sākotnēju piepūli (nav nepieciešams formatēt datus), salīdzinot ar datu noliktavām, tāpēc datu ezeri ir interese.
Gartners uzsver, ka datu iegūšanai nav jēgas - jēga ir spēt manipulēt ar sagūstītajiem datiem apzināta lēmumu pieņemšanai. Turklāt ir problemātiski izmantot (nedaudz nepierādītus) datu ezerus, lai atvieglotu lēmumu pieņemšanu.
"Datu noliktavām jau ir iespējas atbalstīt plašu lietotāju loku visā organizācijā, " sacīja Gārtnera pētījumu direktors Niks Heudekers. "Informācijas pārvaldības līderiem nav jāgaida, kamēr datu ezeri nokļūs." (Uzziniet vairāk par lielu datu pieņemšanu 7 lietās, kuras jums jāzina par lielajiem datiem pirms pieņemšanas.)
Lielie dati darbojas - jaunas datu manipulācijas metodes var nebūt
Iemesls, kāpēc Gartners sacīja, ka "lielākie datu mīti", nevis "mīti par lieliem datiem", kļūst skaidrs pēc ziņojuma lasīšanas. Gartners nenozīmē lielu datu daudzumu. Gartners ir nožēlojams par tiem, kuri uzskata, ka jaunākās metodes manipulēšanai ar lielajiem datiem ir gatavas “galvenajam laikam”.
