Satura rādītājs:
Definīcija - ko nozīmē lieli dati?
Lielie dati attiecas uz procesu, ko izmanto, ja tradicionālās datu ieguves un apstrādes metodes nespēj atklāt ieskatu un pakārtoto datu nozīmi. Relāciju datu bāzes dzinēji nevar apstrādāt datus, kas ir nestrukturēti vai jutīgi pret laiku vai vienkārši ļoti lieli. Šāda veida datiem nepieciešama atšķirīga apstrādes pieeja, ko sauc par lielajiem datiem, kas izmanto masīvu paralēlismu viegli pieejamai aparatūrai.
Techopedia skaidro Big Data
Vienkārši, lielie dati atspoguļo mainīgo pasauli, kurā mēs dzīvojam. Jo vairāk lietas mainās, jo vairāk izmaiņas tiek uztvertas un reģistrētas kā dati. Ņemiet par piemēru laika apstākļus. Laika apstākļu prognozētājam visā pasaulē ir ļoti daudz savākto datu par vietējiem apstākļiem. Loģiski, ka būtu loģiski, ka vietējā vide diktē reģionālos efektus un reģionālie efekti diktē globālo efektu, bet tas varētu būt arī otrādi. Vienā vai otrā veidā šie laika apstākļu dati atspoguļo lielo datu atribūtus, ja masīvam datu apjomam ir nepieciešama apstrāde reāllaikā un ja lielu daudzumu ievadīto datu var ģenerēt mašīna, personīgi novērojumi vai ārēji spēki, piemēram, saules plankumi.
Šāda informācijas apstrāde parāda, kāpēc lielie dati ir kļuvuši tik svarīgi:
- Lielākā daļa tagad savākto datu nav strukturēti, un tiem ir nepieciešama atšķirīga glabāšana un apstrāde, kas ir tradicionālajās relāciju datu bāzēs.
- Pieejamā skaitļošanas jauda ir strauji augoša, tas nozīmē, ka ir vairāk iespēju apstrādāt lielos datus.
- Internets ir demokratizējis datus, nepārtraukti palielinot pieejamo datu daudzumu, vienlaikus iegūstot arvien vairāk neapstrādātu datu.
Neapstrādātiem datiem nav vērtības. Dati ir jāapstrādā, lai tie būtu vērtīgi. Tomēr šeit ir raksturīga lielo datu problēma. Vai datu apstrāde no vietējā objekta formāta līdz izmantojamam ieskatam ir vērts, lai to izdarītu? Vai arī ir pārāk daudz datu ar nezināmām vērtībām, lai attaisnotu azartspēli to apstrādāt ar lieliem datu rīkiem? Lielākā daļa no mums piekrīt, ka spējai paredzēt laika apstākļus būtu vērtība, jautājums ir, vai šī vērtība varētu atsvērt izmaksas, kas saistītas ar visu reālā laika datu apkopošanu laikapstākļu ziņojumā, uz kuru varētu rēķināties.
