Mājas Audio Kā es varu iemācīties izmantot hadoop, lai analizētu lielos datus?

Kā es varu iemācīties izmantot hadoop, lai analizētu lielos datus?

Anonim

J:

Kā es varu iemācīties izmantot Hadoop, lai analizētu lielos datus?

A:

Apache programmatūras komplekts, kas pazīstams kā Hadoop, kļūst par ļoti populāru resursu lielo datu kopu apstrādei. Šāda veida datu apstrādes programmatūras ietvars tika izveidots, lai palīdzētu specifiskā veidā apkopot datus, pamatojoties uz projektiem, kas dažu veidu datu projektus var padarīt efektīvākus. Tomēr Hadoop ir tikai viens no daudzajiem datu kopu apstrādes rīkiem.

Viens no pirmajiem un visvienkāršākajiem veidiem, kā uzzināt par lielo datu analīzi, izmantojot Hadoop, ir saprast dažus Hadoop augstākā līmeņa komponentus un to, ko tā dara. Tajos ietilpst Hadoop YARN "resursu pārvaldības platforma", ko var izmantot noteikta veida tīkla iestatījumiem, kā arī Hadoop MapReduce funkciju komplekts, kas attiecas uz lielām datu kopām. Ir arī Hadoop izkliedēto failu sistēma (HDFS), kas palīdz uzglabāt datus izplatītajās sistēmās, lai tos varētu ātri un efektīvi indeksēt vai izgūt.

Turklāt tie, kas vēlas tuvāk iepazīties ar Hadoop, var aplūkot atsevišķus publicētus resursus profesionāļiem, kuri izskaidro programmatūru rellatīvā līmenī. Šis Chris Stucchio piemērs personīgajā emuārā sniedz lielisku punktu kopumu par Hadoop un datu skalu. Viens no galvenajiem paņemšanas gadījumiem ir tāds, ka Hadoop var izmantot biežāk nekā nepieciešams, un tas var nebūt labākais risinājums atsevišķam projektam. Pārskatot šāda veida resursus, speciālisti varēs labāk iepazīties ar informāciju par Hadoop izmantošanu katrā scenārijā. Stucchio piedāvā arī metaforas Hadoop funkciju saistīšanai ar noteiktiem fiziskiem uzdevumiem. Šajā piemērā ir grāmatu skaita uzskaite bibliotēkā, turpretī Hadoop funkcija šo bibliotēku var sadalīt sadaļās, nodrošinot atsevišķus skaitļus, kas ir apvienoti vienā apkopotā datu rezultātā.

Padziļinātāks veids, kā profesionāļi var uzzināt vairāk par Hadoop un tā piemērošanu lielajiem datiem, ir, izmantojot īpašus apmācības resursus un programmas. Piemēram, tiešsaistes mācību uzņēmumam Cloudera, kas ir ievērojams attālo apmācību sesiju nodrošinātājs, ir vairākas interesantas iespējas saistībā ar Hadoop izmantošanu un līdzīgi datu apstrādes veidi.

Kā es varu iemācīties izmantot hadoop, lai analizētu lielos datus?