Operatiivinen Hadoop seuraavan sukupolven tietoarkkitehtuurissa

Kirjoittaja: Roger Morrison
Luomispäivä: 20 Syyskuu 2021
Päivityspäivä: 21 Kesäkuu 2024
Anonim
Operatiivinen Hadoop seuraavan sukupolven tietoarkkitehtuurissa - Tekniikka
Operatiivinen Hadoop seuraavan sukupolven tietoarkkitehtuurissa - Tekniikka

Sisältö



Lähde: Romeo1232 / Dreamstime.com

Ottaa mukaan:

Hadoop on avainasemassa seuraavan sukupolven tietoarkkitehtuurissa, koska se kykenee käsittelemään valtavia määriä dataa.

Hadoopin apuohjelma on alkanut mennä laajamittaisen tietojenkäsittelyn ja analysoinnin ulkopuolelle, kun teollisuus vaatii enemmän siitä. Hadoop vastaa tasaisesti erilaisiin yritystietoarkkitehtuuriin liittyviin vaatimuksiin säilyttäen alkuperäiset vahvuutensa. Luettelo siitä, mitä Hadoop voi tehdä ja tekee parhaillaan, on melko pitkä. Hadoop pystyy nyt käsittelemään valtavia määriä tapahtumakäyttöjä, tämä tehtävä, jota aiemmin odotettiin perinteisiltä tekniikoilta. Jatkossa Hadoopilla on tulevaisuudessa paljon mahdollisuuksia. Esimerkiksi SQL-pohjaiset transaktiojärjestelmät voivat hyödyntää Hadoop SQL -moottoria, ja Hadoop lisää myös paljon RDBMS-ominaisuuksia. Voit sanoa, että Hadoopista on tulossa tietojenkäsittely- ja analyyttisten ominaisuuksien yhdistelmä yritysarkkitehtuuritoimintojen kanssa.


Mikä on seuraavan sukupolven tietoarkkitehtuuri?

Yksinkertaisesti sanottuna seuraavan sukupolven dataarkkitehtuuri on kehittynyt muoto tietoarkkitehtuuria. Kaikki, mukaan lukien tietomallit, tietopolitiikat, säännöt ja standardit, jotka hallitsevat tietojen keräämistä, säilyttämistä, järjestämistä, analysointia tai käsittelyä, integrointia, käyttöä ja jakelua, on kehittynyt seuraavan sukupolven tietoarkkitehtuurissa.

Suurin ero aikaisemman tietoarkkitehtuurin ja seuraavan sukupolven tietoarkkitehtuurin välillä on viimeksi mainitun kyky kerätä, tallentaa ja käsitellä valtavia dataa, joka tunnetaan myös nimellä big data, reaaliajassa. Arkkitehtuuri suorittaa kaikki nämä monimutkaiset tehtävät vaarantamatta yksityisyyttä, turvallisuutta ja tiedonhallintaa koskevia standardeja.

Seuraavan sukupolven tietoarkkitehtuurilla on monia haasteita. Suurten tietojen määrää, nopeutta ja monimuotoisuutta ei ole helppo käsitellä. Lisää tähän järjestelmän vaatimusten optimointi, suorituskyvyn, nopeuden ja tarkkuuden parantaminen sekä kustannusten vähentäminen. Sanomattakin on selvää, että edellisen tietoarkkitehtuurin ei tarvinnut hallita tällaisia ​​vaatimuksia.


Joten CIO: t ja tietoarkkitehdit haluavat löytää ratkaisun, joka auttaa heitä saavuttamaan tavoitteensa. Operatiivinen Hadoop on ollut keskittynyt jo jonkin aikaa tässä yhteydessä. Seuraavissa kohdissa kerrotaan, kuinka Hadoop voi ratkaista ongelmat.

Hadoopin odotukset seuraavan sukupolven arkkitehtuurin yhteydessä

Yritykset kohdistuvat yhä enemmän paineita tuottaa parempia tuloksia, ja vaikutukset huijaavat tekniikoille asetettuihin odotuksiin. Joten Hadoopin ei enää odoteta käsittelevän tietoja. CIO: t ja CTO: t haluavat enemmän Hadoopilta. Alla on luettelo Hadoopin odotuksista. Itse asiassa Hadoop on jo saavuttanut muutaman näistä odotuksista.

Hadoopin odotetaan toimivan SQL-pohjaisten transaktiojärjestelmien kanssa, joilla on luonti-, lukemis-, päivitys- ja poistoominaisuuksia. Tapahtumajärjestelmät hyödyntävät SQL-moottoria. Järjestelmissä on myös täysi POSIX (Portable Operating System Interface) -yhteensopivuus ja kyky käsitellä suuria transaktiomääriä.

Hadoopin odotetaan tukevan ominaisuuksia, kuten varmuuskopiointia, vikasietoisuutta, palautusta ja katastrofien palautusta. Jotta Hadoop voi kehittyä RDBMS-ominaisuuksilla varustetuksi järjestelmäksi, sen on oltava yhteensopiva olemassa olevien IT-työkalujen kanssa.

Hadoop pyrkii jo täyttämään odotukset, kuten tietyistä tapahtumista ilmenee. Hadoop voi tarjota reaaliaikaista analyysiä ja nopeita vastauksia YARNin tarjoaman resurssienhallinnan tuen perusteella. YARN on laaja-alainen ja hajautettu käyttöjärjestelmä suurille datasovelluksille resurssienhallinnan lisäksi. Muiden, kuten Apache Storm -kehityksen, jaettujen muistiin liittyvien arkkitehtuurien, kuten Apache Spark, Apache Hive, Drill ja MapR-FS (korkean suorituskyvyn HDFS-korvike), tiedetään toimivan tarjoamaan erilaisia ​​täydellisiä tietokantaominaisuuksia, kuten varmuuskopiointi, katastrofien palautus, vikasietoisuus jne. (Lisätietoja YARNista on artikkelissa Mitkä ovat Hadoop 2.0 (YARN) Framework -sovelluksen edut?)

Mitä arvoja Hadoop voi lisätä seuraavan sukupolven tietoarkkitehtuuriin?

Arvoja, joita Hadoop voi lisätä seuraavan sukupolven tietoarkkitehtuuriin, voidaan tarkastella kahdesta näkökulmasta: toiseen, täyttääkö se edellä kuvatut odotukset, ja toiseen, suorittaako se jotain ylimääräistä. Alla on esitetty houkuttelevat arvot, joita Hadoop voi tuottaa.

Hadoop pystyy nyt tarjoamaan parempaa datan skaalautuvuutta ja hallittavuutta alustallaan HDFS: n kautta. Ja datakäyttöjärjestelmä on otettu käyttöön Hadoopin YARN-sovellusten kautta. Tämä strategia edustaa muutosta tietoarkkitehtuurissa perustasolla. Nyt Hadoop voi tallentaa erityyppisiä tietoja, kuten tapahtumapainotteisia tietokantoja, kuvaajatietokantoja ja asiakirjatietokantoja, ja näihin tietoihin pääsee YARN-sovellusten kautta. Tietoja ei tarvitse kopioida tai siirtää muihin paikkoihin.

Parempi suorituskyky yrityksen tietoarkkitehtuurina

Operatiivisesta Hadoopista on tulossa tulossa yrityksen dataarkkitehtuurin ydinjärjestelmä. Kun Hadoop tulee entistä enemmän yritystietoarkkitehtuuriin, tietosilot poistetaan, koska niiden väliset rivit poistuvat. Lähes kaikilla aloilla tapahtuu nopea parannus. Parannuksia tehdään tehokkaampien tiedostomuotojen, paremman SQL-moottorin suorituskyvyn, parannettujen tiedostojärjestelmien ja tukevuuden avulla, jotka täyttävät yrityssovellusten tarpeet.

Ero Hadoopin ja muiden tekniikoiden välillä

Aikaisemmin tärkein ero Hadoopin ja tietoyritysteknologioiden välillä oli Hadoopin suuret tietojenkäsittely-, raportointi- ja analysointiominaisuudet. Nyt kun toimivasta Hadoopista tulee yhä enemmän osa yritystietoarkkitehtuuria, ero entiteettien välillä hämärtyy entisestään. Joten toimivasta Hadoopista on tulossa ylivoimainen vaihtoehto olemassa olevalle yritystietoarkkitehtuurille.

johtopäätös

Odotukset ja edistyminen huomioon ottaen Hadoop aikoo keskittyä teollisuuteen jo jonkin aikaa. Mutta on järkevää olla keskittymättä liikaa Hadoopiin ja yksinkertaisesti sivuuttaa muita tekniikoita. Tämä johtuu siitä, että muut tekniikat etenevät samojen parametrien suhteen ja saattavat jopa ohittaa Hadoopin. Ei ole koskaan hyvä olla monopoli markkinoilla. On hyvä, että muiden kuin Hadoop-tekniikoiden päättäjät voivat olla motivoituneita toimittamaan parempia tuotteita ja jopa laajennuksia, jotka auttavat Hadoopia parantamaan suorituskykyään.