Apache Spark

Kirjoittaja: Eugene Taylor
Luomispäivä: 8 Elokuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Что такое Apache Spark
Video: Что такое Apache Spark

Sisältö

Määritelmä - Mitä Apache Spark tarkoittaa?

Apache Spark on avoimen lähdekoodin ohjelma, jota käytetään datan analysointiin. Se on osa laajempaa työkalusarjaa, kuten Apache Hadoop ja muut avoimen lähdekoodin resurssit nykypäivän analytiikkayhteisölle.


Asiantuntijat kuvaavat tätä suhteellisen uutta avoimen lähdekoodin ohjelmistoa data-analyyttisen klusterin laskentatyökaluna. Sitä voidaan käyttää Hadoopin hajautetun tiedostojärjestelmän (HDFS) kanssa, joka on erityinen Hadoop-komponentti, joka helpottaa monimutkaista tiedostojen käsittelyä.

Jotkut IT-ammattilaiset kuvaavat Apache Sparkin käyttöä mahdollisena korvikkeena Apache Hadoop MapReduce -komponentille. MapReduce on myös klusterointityökalu, joka auttaa kehittäjiä käsittelemään suuria tietosarjoja. Ne, jotka ymmärtävät Apache Sparkin suunnittelun, huomauttavat, että se voi joissain tilanteissa olla useita kertoja nopeampi kuin MapReduce.

Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää Apache Sparkin

Apache Sparkin nykyaikaisesta käytöstä raportoivat osoittavat, että yritykset käyttävät sitä eri tavoin. Yksi yleinen käyttö on tietojen yhdistäminen ja jäsenteleminen hienostuneemmilla tavoilla. Apache Spark voi olla hyödyllinen myös analytiikan koneoppimisessa tai tietojen luokittelussa.


Tyypillisesti organisaatiot kohtaavat haasteen parantaa tietoja tehokkaasti ja hiukan automatisoidusti, missä Apache Sparkia voidaan käyttää tällaisiin tehtäviin. Jotkut viittaavat myös siihen, että Sparkin käyttö voi auttaa pääsyä niille, jotka eivät ole niin perehtyneitä ohjelmointiin ja haluavat osallistua analytiikan käsittelyyn.

Apache Spark sisältää Pythonin ja siihen liittyvien ohjelmistokielten sovellusliittymät.