10 suuria tietoja, joita ei tarvitse tehdä

Kirjoittaja: Eugene Taylor
Luomispäivä: 13 Elokuu 2021
Päivityspäivä: 22 Kesäkuu 2024
Anonim
10 suuria tietoja, joita ei tarvitse tehdä - Tekniikka
10 suuria tietoja, joita ei tarvitse tehdä - Tekniikka

Sisältö



Lähde: Rawpixelimages / Dreamstime.com

Ottaa mukaan:

Big data on uusi ja nouseva verkkotunnus useimmille yrityksille. Toiminnan tekeminen vaatii huolellista hienosäätöä ja parhaiden käytäntöjen käyttöä.

Suuret tiedot sisältävät paljon lupauksia kaikenlaisille toimialoille. Jos tätä suurta dataa hyödynnetään tehokkaasti ja vaikuttavasti, sillä voi olla merkittävä vaikutus päätöksentekoon ja analytiikkaan. Mutta isojen tietojen hyöty voidaan saavuttaa vain, jos niitä hallitaan jäsennellyllä tavalla. Suurten tietojen parhaita käytäntöjä ollaan asteittain luomassa, mutta jo olemassa on selviä ohjeita, joita ei ole, kun kyse on toteutuksesta.

Seuraava ohje perustuu käytännön kokemukseen ja tosielämän hankkeista kerättyyn tietoon. Tässä ovat tärkeimmät isojen tietojen ja lahjoittajieni.

Ota kaikki liiketoiminta-alueet mukaan big data -aloitteeseen

Big data -aloite ei ole erillinen ja itsenäinen toiminta, ja kaikkien liiketoimintayksiköiden osallistuminen on välttämätöntä todellisen arvon ja näkemyksen saamiseksi. Suuret tiedot voivat auttaa organisaatioita hyödyntämään suuria tietomääriä ja saada käsityksen asiakaskäyttäytymisestä, tapahtumista, suuntauksista, ennusteista jne. Tämä ei ole mahdollista datan tilannekuvan avulla, joka vain kaappaa kokonaisen osan suurista tiedoista käsiteltyjen tietojen kokonaismäärästä. Tämän seurauksena yritykset keskittyvät yhä enemmän kaiken tyyppisiin tietoihin, jotka tulevat kaikista mahdollisista keinoista / liiketoimintayksiköistä ymmärtääksesi oikean mallin.

Arvioi kaikki infrastruktuurimallit suurten tietojen toteutusta varten

Tietomäärä ja sen hallinta ovat tärkeitä huolenaiheita kaikille big data -aloitteille. Koska iso data käsittelee datan petabyyttejä, ainoa ratkaisu sen hallintaan on käyttää tietokeskuksia. Samanaikaisesti kustannuskomponentti on otettava huomioon ennen minkä tahansa varastotilan valitsemista ja viimeistelyä. Pilvipalvelut ovat usein paras valinta, mutta eri pilviympäristöjen palvelut on arvioitava sopivan määrittämiseksi. Koska tallennus on yksi tärkeimmistä komponenteista kaikissa suurten tietojen toteutuksessa, se on tekijä, jota tulisi arvioida erittäin huolellisesti jokaisessa suuria tietoja koskevassa aloitteessa. (Hanki uusi näkökulma nykypäivän Big Data Challenge -sarjoihin erilaisuudesta, ei volyymista tai nopeudesta.)

Harkitse perinteisiä tietolähteitä isojen tietojen suunnittelussa

Suuria tietoja on eri lähteistä, ja myös lähteiden määrä kasvaa päivä päivältä. Tätä valtavaa tietomäärää käytetään syötteenä isoon tietojenkäsittelyyn. Joidenkin yritysten mielestä perinteisistä tietolähteistä ei ole hyötyä. Tämä ei ole totta, koska tämä perinteinen tieto on kriittinen osa minkä tahansa suuren datajutun menestystä. Perinteinen tieto sisältää arvokasta tietoa, joten sitä tulisi käyttää yhdessä muiden suurten tietolähteiden kanssa. Suuret tiedot voivat saada todellisen arvon vain, jos kaikki tietolähteet (perinteiset ja muut kuin perinteiset) otetaan huomioon. (Lisätietoja kohdasta Ota tämä, iso data! Miksi pienet tiedot voivat pakata isomman iskun.)

Harkitse johdonmukaista tietojoukkoa

Suuressa tietoympäristössä tiedot tulevat eri lähteistä. Tietomuoto, rakenne ja tyypit vaihtelevat lähteestä toiseen. Tärkeintä on, että tietoja ei puhdisteta, kun kyse on iso dataympäristöstäsi. Joten ennen kuin luotat saapuviin tietoihin, sinun on tarkistettava johdonmukaisuus toistamalla havaintoja ja analysoimalla. Kun tietojen yhdenmukaisuus on vahvistettu, sitä voidaan pitää yhtenäisenä metatietojoukkona. Johdonmukaisen metatietojoukon löytäminen tarkastelemalla mallia huolellisesti on olennainen tehtävä kaikissa suurten tietojen suunnittelussa.

Levitä tietoja

Tietomäärä on suuri huolenaihe, kun tarkastellaan käsittelyympäristöä. Koska iso data käsittelee suuria tietomääriä, käsittely yhdellä palvelimella ei ole mahdollista. Ratkaisu on Hadoop-ympäristö, joka on hajautettu laskentaympäristö, joka toimii hyödykelaitteistoilla. Se antaa voiman nopeampaan käsittelyyn useissa solmuissa. (Lisätietoja 7: stä Hadoopista tiedettävää asiaa.)

Älä koskaan luota yhteen ainoaan big data -analyysimenetelmään

Markkinoilla on saatavana erilaisia ​​tekniikoita suuren datan käsittelemiseksi. Kaikkien suurten tietotekniikoiden perusta on Apache Hadoop ja MapReduce. Siksi on tärkeää arvioida oikea tekniikka oikeaan tarkoitukseen. Jotkut tärkeistä analytiikan lähestymistavoista ovat ennustava analytiikka, määräävä analytiikka, analytiikka, virtadatanalytiikka jne. Asianmukaisen menetelmän / lähestymistavan valinta on tärkeä halutun tavoitteen saavuttamiseksi. Parasta on välttää luottamista yhteen lähestymistapaan, mutta tutkia erilaisia ​​lähestymistapoja ja valita täydellinen ratkaisu ratkaisuusi.

Älkää käynnistäkö suurta big data -aloitetta ennen kuin olet valmis

Kaikille big data -aloitteille on aina suositeltavaa aloittaa pienillä askeleilla. Joten aloita kokeiluhankkeilla asiantuntemuksen saamiseksi ja siirry sitten varsinaiseen toteutukseen. Suurtietojen potentiaali on erittäin vaikuttava, mutta todellinen arvo voidaan saavuttaa vasta, kun vähentämme virheitämme ja saamme lisää asiantuntemusta.

Älä käytä tietoja erikseen

Suuret tietolähteet ovat hajallaan ympäri ja ne kasvavat päivä päivältä. On tärkeää integroida kaikki nämä tiedot oikean analyysituloksen saamiseksi. Markkinoilla on käytettävissä erilaisia ​​työkaluja tietojen integrointiin, mutta ne tulisi arvioida oikein ennen käyttöä. Suurten tietojen integrointi on monimutkainen tehtävä, koska eri lähteistä peräisin olevan tiedon muoto on erilaista, mutta sitä tarvitaan hyvin hyvän analyyttisen tuloksen saamiseksi.

Älä sivuuta tietoturvaa

Tietoturva on tärkeä näkökohta suurten tietojen suunnittelussa. Aluksi (ennen minkään käsittelyn suorittamista) tiedot ovat petatavuissa, joten suojausta ei ole toteutettu tiukasti. Mutta jonkin käsittelyn jälkeen saat osajoukon tietoja, jotka tarjoavat jonkinlaisen käsityksen. Tietoturvasta tulee tässä vaiheessa välttämätöntä. Mitä enemmän tietoja käsitellään ja hienosäädetään, sitä arvokkaampana niistä tulee organisaatiolle. Tämä hienosäädetty tulostetieto on immateriaalioikeutta ja se on turvattava. Tietoturva on toteutettava osana suuren datan elinkaarta.

Älkää unohtako big data -analytiikan suorituskykyosaa

Big data -analytiikan tuotos on hyödyllinen vain silloin, kun se antaa hyvän suorituskyvyn. Big data tarjoaa enemmän näkemyksiä perustuen valtavan määrän tietojen käsittelyyn nopeammalla nopeudella. Siksi on välttämätöntä hallita sitä tehokkaasti ja toimivasti. Jos suurten tietojen suorituskykyä ei hallita huolellisesti, se aiheuttaa ongelmia ja tekee koko työstä turhaa.

Keskusteluissamme olemme keskittyneet suurten tietojen aloitteiden annoksiin ja lahjoittajiin. Suuret tiedot ovat nouseva alue ja toteutuksen yhteydessä monet yritykset ovat vielä suunnitteluvaiheessa. On tärkeää ymmärtää isojen tietojen parhaat käytännöt riskien ja virheiden minimoimiseksi. Keskustelupisteet on johdettu projektin elävistä kokemuksista, joten se antaa joitain ohjeita isodatastrategian onnistumiselle.