Satura rādītājs:
Definīcija - ko nozīmē Apache Nutch?
Apache Nutch ir tīmekļa kāpurķēžu programmatūras produkts, ko var izmantot, lai apkopotu datus no tīmekļa. To izmanto kopā ar citiem Apache rīkiem, piemēram, Hadoop, datu analīzei.
Techopedia skaidro Apache Nutch
Apache Nutch ir atvērtā pirmkoda produkts, kuru licencējis Apache Software Foundation. Šai izstrādātāju kopienai ir licences dažādiem Apache programmatūras rīkiem, kas var kārtot un analizēt datus. Viena no centrālajām tehnoloģijām ir Apache Hadoop, liels datu analīzes rīks, kas ir ļoti populārs biznesa aprindās.
Kopā ar tādiem rīkiem kā Apache Hadoop un failiem paredzētu failu glabāšanas, analīzes un cita veida funkcijām, Nutch uzdevums ir apkopot un saglabāt datus no tīmekļa, izmantojot tīmekļa pārmeklēšanas algoritmus.
Lietotāji var izmantot vienkāršas komandas Apache Nutch priekšrocības, lai apkopotu informāciju zem vietrāžiem URL. Lietotāji parasti izmanto Apache Nutch kopā ar citu atvērtā pirmkoda rīku, sistēmu ar nosaukumu Apache Solr, kas var darboties kā krātuve ar Apache Nutch savāktajiem datiem.
