J:
Kādi ir daži no galvenajiem jautājumiem, kas jāņem vērā lielās datu glabāšanas stratēģijā?
A:Viena no lielākajām problēmām, kas tiek ignorēta lielo datu glabāšanā, ir pieejamība komandām, kurām tā nepieciešama. Dati tiek regulāri glabāti bez dokumentācijas vietās, kur tiem ir grūti piekļūt vai kur attiecīgajām komandām ir skaidrs, ka tie vispār pastāv. Galu galā liela apjoma datu glabāšanai ir jāīsteno pirmā atvērta stratēģija, kurā komandas tiek informētas par tā esamību, no tā, no kā sastāv dati un kā tam piekļūt, lai komandas varētu to izmantot programmatūrā, ja tas viņiem nepieciešams.
Vēl viena kritiska problēma, kas man šķiet, ir uzglabājamo datu kvalitāte. Dati jāuzglabā visaugstākās kvalitātes formā, kādā tie var pastāvēt to galīgajā glabāšanas vietā. Zemas kvalitātes datu glabāšana datu ezerā parasti ir pareiza, taču, turpinoties lejup pa datu plūsmu, katram posmam vajadzētu paaugstināt datu kvalitāti tā, lai tie tiktu glabāti augstākās kvalitātes formā tādā sistēmā kā datu noliktava vai analītikas datu bāze. Tas uzlabos to sistēmu kvalitāti, kuras patērē datu atpūtas vietu.
