Mitä eroa isodatan ja Hadoopin välillä on?

Kirjoittaja: Judy Howell
Luomispäivä: 5 Heinäkuu 2021
Päivityspäivä: 23 Kesäkuu 2024
Anonim
Mitä eroa isodatan ja Hadoopin välillä on? - Tekniikka
Mitä eroa isodatan ja Hadoopin välillä on? - Tekniikka

Sisältö

K:

Mitä eroa isodatan ja Hadoopin välillä on?


V:

Ero big datan ja avoimen lähdekoodin ohjelmiston Hadoop välillä on selkeä ja perustavanlaatuinen. Ensin mainittu on omaisuus, usein monimutkainen ja epäselvä, kun taas jälkimmäinen on ohjelma, joka saavuttaa joukon tavoitteita ja tavoitteita kyseisen omaisuuden käsittelemiseksi.

Suuret tiedot ovat yksinkertaisesti suuria tietosarjoja, jotka yritykset ja muut osapuolet ovat koonnut palvelemaan tiettyjä tavoitteita ja toimia. Bigdata voi sisältää monenlaisia ​​tietoja monenlaisissa muodoissa. Esimerkiksi yritykset voivat tehdä paljon työtä tuhansien tietojen keräämisessä ostoista valuuttamuodoissa, asiakastunnisteissa, kuten nimi tai sosiaaliturvatunnus, tai tuotetiedoissa malli-, myyntinumero- tai varastonumeroina. Kaikkea tätä tai mitä tahansa muuta suurta tietomäärää voidaan kutsua big dataksi. Pääsääntöisesti se on raakaa ja lajittelematonta, kunnes se viedään monenlaisten työkalujen ja käsittelijöiden läpi.


Hadoop on yksi työkaluista, joka on suunniteltu käsittelemään suurta dataa. Hadoop ja muut ohjelmistotuotteet pyrkivät tulkitsemaan tai jäsentämään suurten tietojen hakujen tuloksia erityisillä omilla algoritmeilla ja menetelmillä. Hadoop on Apache-lisenssillä varustettu avoimen lähdekoodin ohjelma, jota ylläpitää maailmanlaajuinen käyttäjäyhteisö. Se sisältää useita pääkomponentteja, mukaan lukien MapReduce-toimintojen joukko ja Hadoop-hajautettu tiedostojärjestelmä (HDFS).

MapReduce-idean taustalla on, että Hadoop voi ensin kartoittaa suuren tietojoukon ja suorittaa sitten sisällön pienentämisen tiettyjä tuloksia varten. Pienennystoimintoa voidaan ajatella eräänlaisena suodattimena raakadatalle. HDFS-järjestelmä sitten jakaa tietoja verkossa tai siirtää sitä tarpeen mukaan.


Tietokannan järjestelmänvalvojat, kehittäjät ja muut voivat käyttää Hadoopin erilaisia ​​ominaisuuksia käsittelemään suurta dataa monilla tavoilla. Esimerkiksi Hadoopilla voidaan harjoittaa tietostrategioita, kuten klusterointia ja kohdistamista epäyhtenäisellä tiedolla tai tietoja, jotka eivät sovi siististi perinteiseen taulukkoon tai vastaavat hyvin yksinkertaisiin kyselyihin.