7 vaihetta tietojen louhinnan ja tietotekniikan oppimiseen

Kirjoittaja: Eugene Taylor
Luomispäivä: 12 Elokuu 2021
Päivityspäivä: 22 Kesäkuu 2024
Anonim
PSYKOLOGIAN MAAILMA 7 Psykologia tieteenä:  tiedonkeruumenetelmät ja tutkimuksen vaiheet
Video: PSYKOLOGIAN MAAILMA 7 Psykologia tieteenä: tiedonkeruumenetelmät ja tutkimuksen vaiheet

Sisältö


Lähde: Paul Fleet / Dreamstime.com

Ottaa mukaan:

Tietotekniikka opitaan parhaiten tekemällä, mutta hyvä perusta tilastoille ja koneoppimiselle on myös tärkeää.

Minulta kysytään usein, kuinka oppia tiedon louhinta ja datatiede. Tässä on yhteenveto.

Voit oppia tiedonlouhinnan ja tietotekniikan parhaiten tekemällä, joten aloita tietojen analysointi niin pian kuin mahdollista! Älä unohda kuitenkin oppia teoriaa, koska tarvitset hyvän tilastollisen ja koneoppimisen perustan ymmärtääksesi tekemäsi ja löytää todellisia arvokirjoja isodatan kohinassa.

Tässä on seitsemän vaihetta tietojen louhinnan ja tietotekniikan oppimiseksi. Vaikka ne on numeroitu, voit tehdä ne rinnakkain tai eri järjestyksessä.

  1. Kielet: Opi R, Python ja SQL
  2. Työkalut: Opi käyttämään tiedon louhinta- ja visualisointityökaluja
  3. kirjat: Lue johdanto-kirjat ymmärtääksesi perusteet
  4. Koulutus: Katso verkkoseminaareja, osallistu kursseille ja harkitse tietotekniikan todistusta tai tutkintoa (Lue lisää artikkelista Ben Loricas kuinka vaalia tietoteknikkoa.)
  5. Tiedot: Tarkista käytettävissä olevat tietolähteet ja löydä sieltä jotain
  6. Kilpailut: Osallistu tiedon louhintakilpailuihin
  7. Ole vuorovaikutuksessa muiden tiedemiesten kanssa sosiaalisten verkostojen, ryhmien ja kokousten kautta

Tässä artikkelissa käytän tiedon louhintaa ja tietotekniikkaa keskenään. Katso esitykseni, Analytics-toimialan yleiskatsaus, jossa tarkastelen eri termejen, kuten tilastot, tiedon löytäminen, tiedon louhinta, ennustava analytiikka, tietotekniikka ja big data, kehitystä ja suosiota.


1. Kielten opiskelu

Äskettäisessä KDnuggets-kyselyssä havaittiin, että suosituimmat tiedon louhinnan kielet ovat R, Python ja SQL. Jokaisella on paljon resursseja, esimerkiksi:

  • Ilmainen e-kirja tietotiedestä R: n kanssa
  • Tietotekniikan Pythonin käytön aloittaminen
  • Tietojen analysoinnin python: ketterät työkalut todellisen maailman tietoihin
  • Korvaamaton python: datan hankinta tietotekniikkaan
  • W3-koulut oppivat SQL: tä

2. Työkalut: tiedon louhinta, tietotiede ja visualisointiohjelmistot

Eri tehtäviä varten on monia tiedon louhintatyökaluja, mutta on parasta oppia käyttämään tiedon louhintaohjelmaa, joka tukee koko tietojen analysointiprosessia. Voit aloittaa avoimen lähdekoodin (ilmaisilla) työkaluilla, kuten KNIME, RapidMiner ja Weka.

Monien analytiikan tehtävien on kuitenkin tunnettava SAS, joka on johtava kaupallinen työkalu ja jota käytetään laajasti. Muita suosittuja analytiikka- ja tiedonlouhintaohjelmistoja ovat MATLAB, StatSoft STATISTICA, Microsoft SQL Server, Tableau, IBM SPSS Modeler ja Rattle.


Ei vikoja, ei stressiä - vaiheittaiset ohjeet elämää muuttavien ohjelmistojen luomiseen tuhoamatta elämääsi

Et voi parantaa ohjelmointitaitojasi, kun kukaan ei välitä ohjelmiston laadusta.

Visualisointi on olennainen osa mitä tahansa data-analyysiä. Opi käyttämään Microsoft Excel -sovellusta (hyvä monille yksinkertaisemmille tehtäville), R-grafiikkaa (erityisesti ggplot2) ja myös Tableau - erinomainen visuaalisuuspaketti. Muita hyviä visualisointityökaluja ovat TIBCO Spotfire ja Miner3D.

3. kirjat

Tietojen kaivos- ja tiedekirjoja on saatavana paljon, mutta voit tarkistaa nämä:

  • Tiedon louhinta ja analyysi: Peruskäsitteet ja algoritmit, ilmainen PDF-tiedosto (luonnos), kirjoittaneet Mohammed Zaki ja Wagner Meira Jr.
  • Tietojen louhinta: käytännön koneoppimisvälineet ja tekniikat, kirjoittaneet Ian Witten, Eibe Frank ja Mark Hall, Wekon kirjoittajilta, ja käyttävät Wekaa laajasti esimerkeissä
  • Tilastollisen oppimisen, tiedon louhinnan, päätelmien ja ennusteen tekijät, kirjoittaneet Trevor Hastie, Robert Tibshirani, Jerome Friedman. Upea johdanto matemaattisesti suuntautuneelle
  • LION-kirja: Oppiminen ja älykäs optimointi, kirjoittaneet Roberto Battiti ja Mauro Brunato, vapaasti saatavilla verkossa, luku luvusta
  • Massiivisten tietoaineistojen louhinta, kirjoittanut A. Rajaraman, J. Ullman
  • StatSoft Electronic Statistics -kirja (ilmainen), sisältää monia tiedon louhinnan aiheita

4. Koulutus: Verkkoseminaarit, kurssit, todistukset ja tutkinnot

Voit aloittaa katsomalla joitain monista ilmaisista webinaareista ja verkkolähetyksistä, jotka koskevat viimeisimpiä aiheita analytiikassa, big datassa, tiedon louhinnassa ja tietotekniikassa.

On myös monia verkkokursseja, lyhyitä ja pitkiä, joista monet ovat ilmaisia. (Katso KDnuggets-verkkokoulutushakemisto.)

Tarkista erityisesti nämä kurssit:

  • Koneoppiminen, Kursassa, opettaja Andrew Ng
  • Oppiminen datasta edX: llä, opettanut caltech-professori Yaser Abu-Mostafa
  • Avoin sovelletun tietotekniikan verkkokurssi Syracuse iSchoolista
  • Tietojen louhinta Wekan kanssa, ilmainen verkkokurssi
  • Tutustu myös ilmaisiin online-dioihin Data Mining Course -kurssistani, lukukautta kestävästä tiedonhankinnan johtavasta kurssista

Lopuksi harkitse sertifikaattien hankkimista datan louhinnassa ja tietojenkäsittelytieteessä tai syventävissä asteissa, kuten tietojenkäsittelytieteen maisterissa.

5. Tiedot

Tarvitset tietoja analysoitavaksi - katso KDnuggets-hakemisto Data Mining -tietoaineistoista, mukaan lukien:

  • Hallituksen, liittovaltion, osavaltion, kaupungin, paikalliset ja julkiset tietosivustot ja portaalit
  • Data-sovellusliittymät, keskittimet, markkinapaikat, alustat, portaalit ja hakukoneet
  • Ilmaiset julkiset tietoaineistot

6. Kilpailut

Jälleen kerran opit parhaiten tekemällä, joten osallistu Kaggle-kilpailuihin. Aloita aloittelijakilpailuista, kuten Titanic Survivalin ennustaminen koneoppimisella.

7. Vuorovaikutus: Kokoukset, ryhmät ja sosiaaliset verkostot

Voit liittyä moniin vertaisryhmiin. Katso 30 suosituinta LinkedIn-ryhmää Analyticsissa, Big Data-, Data Mining- ja Data Science -ryhmissä.

AnalyticBridge on aktiivinen analytiikka- ja tietotekniikan yhteisö.

Voit osallistua joihinkin monista kokouksista ja konferensseista, jotka käsittelevät Analyticsia, big dataa, datan louhintaa, datatieteitä ja tietämystä.

Harkitse myös liittymistä ACM SIGKDD: hen, joka järjestää vuosittaisen KDD-konferenssin - alan johtavan tutkimuskonferenssin.

Tämä artikkeli on ruoko KDNuggets.com -sivustolta. Sitä on käytetty tekijän luvalla.