MapReduce

Kirjoittaja: Louise Ward
Luomispäivä: 9 Helmikuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
What is MapReduce?
Video: What is MapReduce?

Sisältö

Määritelmä - mitä MapReduce tarkoittaa?

MapReduce on Googlen käyttöön ottama ohjelmointimalli suurten tietojoukkojen käsittelemiseksi ja luomiseksi tietokoneiden klustereissa.


Google muotoili ensin puitteet Googlen verkkosivujen indeksoinnin palvelemiseksi, ja uusi kehys korvasi aikaisemmat indeksointialgoritmit. Aloittelijoiden kehittäjät pitävät MapReduce-kehystä hyödyllisenä, koska kirjastorutiineja voidaan käyttää rinnakkaisohjelmien luomiseen ilman hätää klusterien sisäisestä viestinnästä, tehtävien seurannasta tai viankäsittelyprosesseista.

MapReduce toimii suurella ryhmällä hyödykekoneita ja on erittäin skaalautuva. Sillä on useita toteutusmuotoja, joita tarjoavat useat ohjelmointikielet, kuten Java, C # ja C ++.

Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää MapReducen

MapReduce-kehyksessä on kaksi osaa:


  1. Toiminto nimeltä "Kartta", jonka avulla hajautetun klusterin eri kohdat voivat jakaa työnsä
  2. Toiminto nimeltä "Pienennä", joka on suunniteltu vähentämään klusterien lopullisen muodon yhdeksi tulosteena

MapReduce-kehyksen tärkein etu on sen vikasietoisuus, jossa kausittaisia ​​raportteja klusterin jokaiselta solmulta odotetaan työn valmistuttua.

Tehtävä siirretään solmusta toiseen. Jos isäntäsolmu huomaa, että solmu on ollut hiljaa odotettua pidemmän ajanjakson ajan, pääsolmu suorittaa uudelleenosoitusprosessin jäädytettyyn / viivästettyyn tehtävään.

MapReduce-kehys on inspiroinut toiminnallisessa ohjelmoinnissa käytetyistä "Kartta" ja "Pienennä" -toiminnoista. Laskennallinen käsittely tapahtuu tiedostojärjestelmään tai tietokantaan tallennetulle tiedolle, joka ottaa joukon syöttöavaimen arvoja ja tuottaa sarjan lähtöavain arvoja.


Joka päivä Google-klustereissa suoritetaan lukuisia MapReduce-ohjelmia ja MapReduce-töitä. Ohjelmat yhdenmukaistetaan ja toteutetaan automaattisesti suurella ryhmällä hyödykekoneita. Suoritusaikajärjestelmä käsittelee syöttötietojen osittaista jakamista, ohjelmien suorituksen ajoittamista konejoukolle, konevikojen käsittelyä ja tarvittavan koneiden välisen viestinnän hallintaa. Ohjelmoijat, joilla ei ole kokemusta rinnakkaisista ja hajautetuista järjestelmistä, voivat helposti käyttää suuren hajautetun järjestelmän resursseja.

MapReducea käytetään hajautetussa grep-sovelluksessa, hajautetussa lajittelussa, Web-linkkien ja graafien kääntämisessä, Web-pääsylokin tilastoissa, asiakirjaryhmittelyssä, koneoppimisessa ja tilastollisessa konekääntämisessä.