J:
Kā esošās datu noliktavu vides var vislabāk pielāgot lielo datu analīzes vajadzībām?
A:Atsevišķi datu noliktavas projekti jānovērtē katrā gadījumā atsevišķi. Parasti, mēģinot izvērst esošo datu noliktavas dizainu, lai labāk apstrādātu lielo datu analītiku, ir pamatprocess, kas norāda, kas jādara. IT speciālisti to var nosaukt par “palielināšanu” vai “palielināšanu”.
Tīmekļa seminārs: Big Iron, Iepazīstieties ar Big Data: Mainframe datu atbrīvošana ar Hadoop & Spark Reģistrējieties šeit |
Palielināšana parasti ir saistīta ar pietiekamas apstrādes jaudas iegūšanu, pietiekama atmiņas apjoma iegūšanu un jaudīgāku servera darbību nodrošināšanu, lai apstrādātu visas lielākās datu kopas, kuras bizness apstrādās. Turpretī mērogošana var nozīmēt servera aparatūras kopu apkopošanu un apvienošanu tīklā, lai izveidotu lielos datus.
Daži IT eksperti ir ieteikuši, ka visizplatītākā metode ar Apache Hadoop un citiem populāriem lielo datu rīkiem un platformām ir aparatūras mērogošana un klasterizēšana, lai sasniegtu vēlamos efektus. Tomēr citi uzsver, ka, izmantojot mūsdienu tehnoloģijas, datu noliktavu var palielināt, izmantojot iepirkuma stratēģiju, kas serverim pievieno resursus, piemēram, iegūstot lielāku skaitu apstrādes kodolu un lielāku RAM daudzumu.
Neatkarīgi no tā, vai datu noliktavas tiek palielinātas vai palielinātas, tām ir nepieciešami papildu fiziskās aparatūras aktīvi, lai varētu apstrādāt lielāku datu darba slodzi. Viņiem nepieciešama arī papildu cilvēku pārvalde, kas nozīmē lielāku iekšējo komandu apmācību. Projektā ir jāplāno ļoti daudz plānošanas, lai noteiktu, kāda veida stresa un spiediena dēļ lielāka datu slodze būs esošajai mantotajai sistēmai, lai to pielāgotu jaunai lielo datu ekosistēmai. Viena liela problēma ir uzglabāšanas vājās vietas, kurām nepieciešami jauninājumi uzglabāšanas centros, un cita veida veiktspējas vājās vietas, kas, iespējams, apgrūtina topošo sistēmu, ja tās netiek risinātas.
