Avoimen lähdekoodin Big Data Analytics

Kirjoittaja: Laura McKinney
Luomispäivä: 1 Huhtikuu 2021
Päivityspäivä: 14 Saattaa 2024
Anonim
Avoimen lähdekoodin Big Data Analytics - Tekniikka
Avoimen lähdekoodin Big Data Analytics - Tekniikka

Sisältö

Määritelmä - mitä avoimen lähdekoodin big data -analyysi tarkoittaa?

Avoimen lähdekoodin big data -analytiikalla tarkoitetaan avoimen lähdekoodin ohjelmistojen ja työkalujen käyttöä suurten tietomäärien analysoimiseksi, jotta voidaan kerätä asiaankuuluvaa ja toimittavaa tietoa, jota organisaatio voi käyttää liiketoimintatavoitteidensa edistämiseksi. Suurin toimija avoimen lähdekoodin suurten tietojen analysoinnissa on Apaches Hadoop - se on laajimmin käytetty ohjelmistokirjasto, jolla käsitellään valtavia tietojoukkoja tietokoneryhmän läpi hajautettua prosessia käytettäessä rinnakkain.


Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää avoimen lähdekoodin big data -analyysin

Avoimen lähdekoodin big data -analytiikka hyödyntää avoimen lähdekoodin ohjelmistoja ja työkaluja suurten tietojen analysoinnin suorittamiseen joko käyttämällä kokonaista ohjelmistoalustaa tai erilaisia ​​avoimen lähdekoodin työkaluja erilaisiin tehtäviin data-analytiikan prosessissa. Apache Hadoop on tunnetuin järjestelmä suurten tietojen analysointiin, mutta muita komponentteja tarvitaan ennen kuin todellinen analysointijärjestelmä voidaan koota.

Hadoop on MapReduce-algoritmin avoimen lähdekoodin toteutus, jonka Google ja Yahoo ovat edelläkävijöitä, joten se on useimpien nykyisten analyysijärjestelmien perusta. Monet suurten tietojen analysointityökalut hyödyntävät avointa lähdekoodia, mukaan lukien vankat tietokantajärjestelmät, kuten avoimen lähdekoodin MongoDB, hienostunut ja skaalautuva NoSQL-tietokanta, joka soveltuu erittäin hyvin suuriin datasovelluksiin, samoin kuin muutkin.


Avoimen lähdekoodin big data -analyysipalvelut kattavat:

  • Tiedonkeruujärjestelmä
  • Klusterien hallinnan ja seurannan ohjauskeskus
  • Koneoppiminen ja tiedon louhintakirjasto
  • Sovellusten koordinointipalvelu
  • Laske moottori
  • Suorituskehys