Apache Pig

Kirjoittaja: Robert Simon
Luomispäivä: 16 Kesäkuu 2021
Päivityspäivä: 13 Saattaa 2024
Anonim
Hadoop Pig Tutorial | What is Pig In Hadoop? | Hadoop Tutorial For Beginners | Simplilearn
Video: Hadoop Pig Tutorial | What is Pig In Hadoop? | Hadoop Tutorial For Beginners | Simplilearn

Sisältö

Määritelmä - Mitä Apache Pig tarkoittaa?

Apache Pig on alusta, jota käytetään suurten tietojoukkojen analysointiin. Se koostuu korkean tason kielestä tietojen analysointiohjelmien ilmaisemiseksi sekä näiden ohjelmien arviointiinfrastruktuuriin. Yksi sian merkittävimmistä piirteistä on, että sen rakenne reagoi merkittävään rinnakkaistumiseen.


Sika toimii Hadoop-alustalla, kirjoittamalla tietoja ja lukemalla tietoja Hadoopin hajautetussa tiedostojärjestelmässä (HDFS) ja suorittamalla prosessoinnin yhden tai useamman MapReduce-työn avulla. Apache Pig on saatavana avoimena lähteenä.

Apache Pig tunnetaan myös nimellä Pig Programming Language tai Hadoop Pig.

Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää Apache Pigin

Apache Pig sisältää kaksi osaa: Pig Latinin kielen ja Pig moottorin. Sianlatin kieli on skriptikieli, jonka avulla käyttäjät voivat havainnollistaa tapaa, jolla yhden tai useamman tulon datavirta on luettava ja käsiteltävä, ja sijainti, johon se on tallennettava.


Jotkut Pig Latin -sovelluksen tärkeimmistä ominaisuuksista ovat seuraavat:

  • Helppo ohjelmoida: Monimutkaisista toisiinsa kytketyistä datamuunnoksista koostuvat monimutkaiset tehtävät koodataan selkeästi datavirtajaksoiksi. Tämä tekee heistä helpon kirjoittaa, ymmärtää ja ylläpitää.
  • Optimointimahdollisuudet: Tapa, jolla tehtävät koodataan, mahdollistaa järjestelmän optimoida automaattisen suorituksen. Tämän avulla käyttäjä voi kiinnittää huomiota semantiikkaan tehokkuuden sijasta.
  • Laajennettavuus: Käyttäjät saavat luoda omia toimintoja erityiskäyttöä varten. Pig-moottori vastaa Pig Latin -koodilla kirjoitetun tietovirran toteuttamisesta. Aivan kuten standardi relaatiotietokannan hallintajärjestelmä (RDBMS) -suunnittelu, Apache Pig koostuu jäsentäjästä, optimoijasta ja tyyppitarkistimesta, operaattoreiden lisäksi, jotka suorittavat tietojenkäsittelyä. Sika ei sisällä tapahtumia, tietoluetteloa tai kykyä suoraan käsitellä tietojen tallennusta tai käyttää suorituskehystä.