Nykypäivän Big Data -haaste johtuu monimuotoisuudesta, ei määrästä tai nopeudesta

Kirjoittaja: Judy Howell
Luomispäivä: 28 Heinäkuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Nykypäivän Big Data -haaste johtuu monimuotoisuudesta, ei määrästä tai nopeudesta - Tekniikka
Nykypäivän Big Data -haaste johtuu monimuotoisuudesta, ei määrästä tai nopeudesta - Tekniikka

Sisältö


Ottaa mukaan:

Liian monet IT-osastot heittävät kaiken, mitä heillä on, tiedon määrää ja nopeutta koskevissa asioissa unohtamatta käsitellä tiedon moninaisuuden peruskysymystä.

Gartnerin tutkimusjohtajan Doug Laneyn mukaan haaste isodatan hallinnoinnilla ja hyödyntämisellä on kolme osaa. Laney huomautti ensimmäistä kertaa yli kymmenen vuotta sitten, että iso data on tällainen ongelma yritykselle, koska se tuo vaikeasti hallittavan volyymin, nopeuden ja monimuotoisuuden. Ongelmana on, että liian monet IT-osastot heittävät kaiken, mitä heillä on, datan määrää ja nopeutta koskeviin kysymyksiin unohtamatta puuttua tiedon monimuotoisuuden peruskysymykseen.

Vuodesta 2001 Laney kirjoitti, että "johtavat yritykset käyttävät yhä enemmän keskitettyä tietovarastoa määritelläkseen yhteisen yrityssanaston, joka parantaa sisäistä ja ulkoista yhteistyötä". Kyseinen sanasto - ja vaihtelevuus, joka estää yrityksiä luomasta sitä - on edelleen suurin tietoongelman vähiten käsitelty näkökohta. (Katso mitä muilla asiantuntijoilla on sanottavaa. Katso Big Data -asiantuntijoita, joita seurata.)


Kolme V iso data

Lukuisat yritykset ovat löytäneet menetelmiä suuremman datan määrän ja nopeuden hyödyntämiseksi. esimerkiksi pystyy analysoimaan valtavia tietomääriä. Tietysti tämä data esitetään usein yhä uudelleen samojen parametrien sisällä. Tämä vauhditti teknologiainnovaatioita, kuten sarakketatietokantoja, joita nykyään käyttävät laajalti muut yritykset, jotka kohtaavat yhtä suuria varastoja samanlaisista tietoaineistoista.

Tallennusnopeuden suhteen myyjät, kuten Splunk, auttavat yrityksiä analysoimaan nopeasti luodut tiedot lokitiedostojen avulla, jotka tallentavat useita tuhansia tapahtumia sekunnissa. Tämä suuren määrän tapahtumien analyysi on suunnattu tietoturvan ja suorituskyvyn seurannan käyttötapauksiin. Kuten tietomäärän haaste, nopeuden haaste on ratkaistu suurelta osin edistyneiden indeksointitekniikoiden ja hajautettujen tietoanalyysien avulla, jotka mahdollistavat prosessointikapasiteetin skaalaamisen lisääntyneellä datanopeudella.


Monimuotoisuuden suhteen liian monet yritykset kohtaavat silti suuren ongelman lähestymisessään suuriin tietoanalyyseihin. Tätä ongelmaa ohjaavat kolme tekijää: Ensinnäkin kasvun, yritysostojen ja teknologisten innovaatioiden ansiosta, jotka lisäävät uusia järjestelmiä ympäristöön, yritykset lukitaan erittäin heterogeeniseen ympäristöön, ja tämä heterogeenisuus vain kasvaa ajan myötä. Yritysten on seurattava lukuisia järjestelmätyyppejä ja hallittava kymmeniä tuhansia tietotyyppejä samoin tiedoin, jotka on esitetty eri nimikkeistöissä ja muodoissa.

Toiseksi nämä järjestelmät ja tietotyypit ilmoittavat monissa tapauksissa sekä asiaankuuluvaa tietoa että tietoa, joka voidaan turvallisesti suodattaa merkityksettömäksi käsiteltävän ongelman kannalta. Vaikuttavat tiedot on tunnistettava luotettavasti.

Kolmas ulottuvuus lajikehaasteeseen on ympäristön jatkuva muuttuvuus tai muutos. Järjestelmiä päivitetään, uusia järjestelmiä otetaan käyttöön, uusia tietotyyppejä lisätään ja uusi nimikkeistö otetaan käyttöön. Tämä rasittaa edelleen kykyämme kesyttää tietomuotohaaste. Tämä lisää lisäkerroksen lajikehaasteeseen. (Jos haluat lisätietoja, katso Big Data: Kuinka sen kaapattu, rypistetty ja miten sitä käytetään liiketoimintapäätösten tekemiseen.)

Tietokantaongelman ratkaiseminen

Tietojen monimuotoisuusongelman ratkaisemiseksi yritysten on aloitettava tietotekniikka-alueelta, koska se edustaa usein sekä pahimpia rikoksentekijöitä että pahimpia lajikeongelman uhreja. Ensimmäinen askel on aloittaa kaikkien IT-elementtien tai -omaisuuden kattavalla määrittelyllä tai taksonomialla. Tämä tarjoaa perustason tai perustan viitata mihinkään IT: ssä tai siitä ja antaa yrityksille mahdollisuuden hallita kasvavaa heterogeenisyyttä tunnettua taksonomiaa tai terminologiaa vastaan.

Ei vikoja, ei stressiä - vaiheittaiset ohjeet elämää muuttavien ohjelmistojen luomiseen tuhoamatta elämääsi

Et voi parantaa ohjelmointitaitojasi, kun kukaan ei välitä ohjelmiston laadusta.

Seuraava vaihe on tunnistaa lukuisat tavat, joilla sama esine esitetään eri tietuejärjestelmissä. Tämän avulla tietotekniikan ammattilaiset voivat tarkastella heterogeenistä ympäristöään ja suodattaa ja pakata tiedot erittäin osuviksi ja hallittaviksi palasiksi.

Lopuksi, IT-johtajien on omaksuttava prosessi jatkuvalle ympäristön tutkimiselle muutosten, kuten uuden tyyppisten elementtien käyttöönoton tai uuden nimikkeistön viittaamiseksi samaan elementtiin.

Näiden vaiheiden avulla IT-organisaatiot voivat hallita lajikeongelmaa ja saada syviä oivalluksia, jotka ovat historiallisesti kiertäneet IT-ryhmiä. Lisäksi lajikeongelman hallinta parantaa huomattavasti niiden sijoitetun pääoman tuottoa työkaluihin ja tekniikoihin, jotka käsittelevät perinteisempiä suurten tietojen ongelmia - määrää ja nopeutta.