J:
Kādi apsvērumi ir vissvarīgākie, izlemjot, kurus lielo datu risinājumus ieviest?
A:Katram uzņēmumam un organizācijai ir jāizvērtē savas vajadzības un resursi, noskaidrojot, kuri jautājumi ir vissvarīgākie lielo datu ieviešanā. Tomēr ir vairāki principi, kurus parasti uzskata par kritiskiem šāda veida tehnoloģiju ieviešanai.
Tīmekļa seminārs: Big Iron, Iepazīstieties ar Big Data: Mainframe datu atbrīvošana ar Hadoop & Spark Reģistrējieties šeit |
Viens no lielākajiem jautājumiem ir ieviešana un to radīto traucējumu apjoms. Lielo datu sistēmu lietotājiem vienmēr jāsalīdzina tas, ko viņi gatavojas izmantot, ar to, ko viņi pašlaik izmanto. Daudzos gadījumos traucējumi ir izšķirīgais faktors, vai lieli datu resursi palielinās produktivitāti un peļņu, vai arī sūtīs uzņēmumu, kas sabojājas nepārvaramu šķēršļu dēļ ieviešanai. Pārdevēju atbalstam (vai tā trūkumam) tam ir daudz sakara, taču uzņēmumiem ir arī jāskatās uz tehnoloģiju mācīšanās līkni, cik daudz viņi mainītu mantoto sistēmu darbību un vispār, vai izmaiņas ir kaut kas tāds, kas uzņēmums var rīkoties.
Cits būtisks jautājums ir, kuri dati ir visvērtīgākie biznesam vai organizācijai. Pārbaudot dažādu datu kopu vērtību, tie, kas plāno ieviest lielos datus, var noteikt sava projekta darbības jomu. Bez šāda veida vadlīnijām lielo datu projekti uzņēmumā var kļūt uzpūsti un satriekti. Eksperti iesaka koncentrēties uz konkrētām datu kopām, kuras sniegs vislielāko vērtību, nepārstājot izvērst plašāku tīklu.
No tā izrietoša problēma ir strukturētu un nestrukturētu datu izmantošana. Uzņēmējdarbības vadītāji var aplūkot grūtības pakāpi, kā iegūt dažādus datu bitus lielā datu kontekstā, piemēram, datu centrā. Piemēram, jau formatētas datu kopas var viegli sagremot, taču ar dažiem citiem datu elementiem var būt jāveic plašas manipulācijas, lai tos iegūtu noderīgā formātā, un tas, iespējams, nav tā vērts.
Adoptētājiem būs jāaplūko arī uzlabotā lielā datu apstrāde. Lielās datu sistēmas tiek definētas kā tādas, kuras ir grūti apstrādājamas ar pamata un vienkāršu aparatūras un programmatūras infrastruktūru. Tas nozīmē, ka adoptētājiem ir jābūt pieejamiem pietiekamiem talantiem un resursiem, lai atrastu veidus, kā izmantot lielās datu kopas, kas neizraisīs tīkla pārslodzi vai citādi neradītu sašaurinājumus darbībās.
