Satura rādītājs:
SQL vietnē Hadoop ir analītisku lietojumprogrammu rīku grupa, kas apvieno SQL stila vaicājumus un datu apstrādi ar jaunākajiem Hadoop datu ietvara elementiem. SQL parādīšanās Hadoop ir svarīga lielu datu apstrādes attīstība, jo tā ļauj plašākām cilvēku grupām veiksmīgi strādāt ar Hadoop datu apstrādes sistēmu, palaižot SQL vaicājumus par milzīgajiem lielo datu apjomiem, kurus Hadoop apstrādā. Acīmredzot Hadoop ietvars iepriekš nebija tik pieejams cilvēkiem, it īpaši attiecībā uz tā vaicāšanas iespējām. Balstoties uz attīstību, darbos ir bijuši vairāki rīki, kas sola uzlabot uzņēmumu produktivitāti, apstrādājot un analizējot lielos datus ar kvalitāti un ātrumu. Nav arī nepieciešams daudz ieguldīt instrumenta apgūšanā, kā to vajadzētu darīt tradicionālās zināšanas par SQL.
SQL definīcija vietnē Hadoop
SQL vietnē Hadoop ir lietojumprogrammu grupa, kas ļauj izpildīt SQL stila vaicājumus par lieliem datiem, kurus mitina Hadoop datu apstrādes ietvars. Acīmredzot, datu pieprasīšana, iegūšana un analīze ir kļuvusi vienkāršāka, pievienojot SQL Hadoop. Tā kā SQL sākotnēji tika izveidots relāciju datu bāzēm, tas bija jāmaina saskaņā ar Hadoop 1 modeli, kas ietver MapReduce un Hadoop izplatīto failu sistēmu (HDFS), un Hadoop 2 modeli, kuram nav MapReduce un HDFS.
Viens no pirmajiem centieniem apvienot SQL ar Hadoop izraisīja Hive datu noliktavas izveidi ar HiveQL programmatūru, kas SQL stila vaicājumus varēja tulkot MapReduce darbos. Pēc tam tika izstrādātas vairākas lietojumprogrammas, kas varētu veikt līdzīgus darbus. Ievērojamākie starp jaunākajiem rīkiem ir Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) un Tez (Hive on Tez).
