Hadoopin hajautettu tiedostojärjestelmä (HDFS)

Kirjoittaja: Judy Howell
Luomispäivä: 28 Heinäkuu 2021
Päivityspäivä: 23 Kesäkuu 2024
Anonim
Hadoopin hajautettu tiedostojärjestelmä (HDFS) - Tekniikka
Hadoopin hajautettu tiedostojärjestelmä (HDFS) - Tekniikka

Sisältö

Määritelmä - Mitä Hadoopin hajautettu tiedostojärjestelmä (HDFS) tarkoittaa?

Hadoopin hajautettu tiedostojärjestelmä (HDFS) on hajautettu tiedostojärjestelmä, joka toimii vakio- tai huippuluokan laitteistoilla. Apache Hadoopin kehittämä HDFS toimii kuin tavallinen hajautettu tiedostojärjestelmä, mutta tarjoaa paremman tiedonsiirtonopeuden ja pääsyn MapReduce-algoritmin kautta, korkean vikasietoisuuden ja suurten tietojoukkojen alkuperäisen tuen.


Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää Hadoopin hajautetun tiedostojärjestelmän (HDFS)

HDFS tallentaa suuren määrän dataa, joka on sijoitettu useille koneille, tyypillisesti satoihin ja tuhansiin samanaikaisesti kytkettyihin solmuihin, ja tarjoaa datan luotettavuuden replikoimalla jokainen data-esiintymä kolmena eri kopiona - kaksi yhdessä ryhmässä ja yksi toisessa. Nämä kopiot voidaan korvata vian sattuessa.

HDFS-arkkitehtuuri koostuu klustereista, joita kutakin käytetään yhden erillisen koneeseen asennetun NameNode-ohjelmistotyökalun avulla, jotta voidaan seurata ja hallita kyseisten klusterien tiedostojärjestelmää ja käyttäjän pääsymekanismia. Muut koneet asentavat yhden DataNode-esiintymän klusterin tallennuksen hallitsemiseksi.


Koska HDFS on kirjoitettu Java-kielellä, sillä on natiivi tuki Java-sovellusohjelmointirajapinnoille (API) sovellusten integrointia ja saavutettavuutta varten. Sitä voidaan käyttää myös tavanomaisten selainten kautta.