Vahvistamisoppiminen voi antaa markkinoinnille mukavan dynaamisen kehrän

Kirjoittaja: Roger Morrison
Luomispäivä: 1 Syyskuu 2021
Päivityspäivä: 1 Heinäkuu 2024
Anonim
Vahvistamisoppiminen voi antaa markkinoinnille mukavan dynaamisen kehrän - Tekniikka
Vahvistamisoppiminen voi antaa markkinoinnille mukavan dynaamisen kehrän - Tekniikka

Sisältö



Lähde: Juliatimchenko / Dreamstime.com

Ottaa mukaan:

Vahvistusoppiminen on osa tekoälyä ja koneoppimista, joka voi ennakoida tulokset ja auttaa käyttäjiä tekemään parempia päätöksiä.

Markkinoijat etsivät jatkuvasti skaalattavia ja älykkäitä ratkaisuja yrittäessään hyötyä yhä kilpailukykyisemmissä markkinointiolosuhteissa. Ei ole ihme, että keinotekoinen äly ja koneoppiminen (ML) ovat nyt brändien ja niiden markkinointiorganisaatioiden hyväksymiä. (Lisätietoja ML: n perusteista on koneoppimisessa 101.)

Aloittamattomille AI: tä voidaan yleisesti pitää tekniikkana, kun tietokone automatisoi määritellyt tehtävät, jotka ihminen muuten tekisi. Koneoppiminen AI: n funktionaalisena alueena on silloin, kun tietokoneelle annetaan lopputavoite, mutta hänen on laskettava paras reitti yksinään.


Nykyään näemme, että nämä tekniikat - etenkin koneoppiminen - otetaan käyttöön monilla markkinoinnin aloilla, mukaan lukien mainospetoksien havaitseminen, kuluttajien käyttäytymisen ennustaminen, suositusjärjestelmät, luova personointi ja paljon muuta.

Vaikka tämä kaikki onkin hyvin, on olemassa uusi offshoot-tekniikka, joka markkinoijille tulee todella vastaamaan koneoppimisen aiheuttamaan kysyntään. Sitä kutsutaan ”vahvistusoppimiseksi” (RL).

Mikä on vahvistusoppiminen?

Askelmuutos ML: stä RL: ään on enemmän kuin pelkkä kirje. Useimpiin koneoppimiseen annettuihin tehtäviin liittyy yhden vaiheen käyttäminen, kuten “tunnista tämä kuva”, “ymmärrä teoksen sisältö” tai “tarttu petoksiin.” Markkinoijalle liiketoiminnan tavoitteena, kuten “houkutella, pitää ja kiinnittää käyttäjiä”, on luonnostaan ​​monivaiheinen ja pitkäaikainen, jota ei helposti saavuteta koneoppimisella.


Tässä kohtaa tulee vahvistusoppiminen. RL-algoritmien tarkoituksena on optimoida avautuvaan ja jatkuvasti muuttuvaan matkaan - sellainen, jossa tapahtuu dynaamisia ongelmia. Käyttämällä matemaattista ”palkitsemisfunktiota” kunkin permutaation tuloksen laskemiseksi, RL voi nähdä tulevaisuuden ja soittaa oikean puhelun.

Nykyään tämän huipputeknologian parhaat suoritusmuodot voidaan nähdä peleissä ja itse ajavissa autoissa. Kun Googlen AlphaGo-järjestelmä voitti viime vuonna maailman parhaan lautapelin Go-pelaajan, heidän salainen kastike oli vahvistusoppimista. Vaikka peleissä on asetettu sääntöjä, pelaajan vaihtoehdot reitille voittoon muuttuvat dynaamisesti pöydän tilan perusteella. Vahvistusoppimisen avulla järjestelmä ottaa huomioon kaikki mahdolliset permutaatiot, jotka saattavat muuttua jokaisen seuraavan siirron perusteella.

Samoin itse ajava auto menee matkalle, jolla tien säännöt ja määränpään sijainti pysyvät kiinteinä, mutta matkan varrella olevat muuttujat - jalankulkijoista tielohkoihin pyöräilijöihin - muuttuvat dynaamisesti. Siksi Teslan Elon Muskin perustama organisaatio OpenAI käyttää edistyneitä RL-algoritmeja ajoneuvoihinsa.

Ei vikoja, ei stressiä - vaiheittaiset ohjeet elämää muuttavien ohjelmistojen luomiseen tuhoamatta elämääsi


Et voi parantaa ohjelmointitaitojasi, kun kukaan ei välitä ohjelmiston laadusta.

Koneet markkinoijille

Mitä tämä tarkoittaa markkinoijalle?

Monien markkinoijien keskeisiä haasteita luo se, että liiketoiminnan tila muuttuu koko ajan. Voittavasta kampanjastrategiasta voi tulla epäsuotuisa ajan myötä, kun taas vanha strategia voi saada uuden vetovoiman. RL on askel kohti todellisen ihmisen älykkyyden matkimista, missä opimme monien tulosten menestyksestä ja / tai epäonnistumisesta ja muodostamme tulevaisuuden voittava strategia. Annan joitain esimerkkejä:

1. Käyttäjien sitoutumisen parantaminen

Keskitytään ravintolaketjun asiakkaiden sitoutumiseen ja tavoitteeseen kertoa se kymmenkertaiseksi seuraavan vuoden aikana. Nykyään markkinointikampanjaan saattaa liittyä syntymäpäivän tervehdys alennustarjouksella, ehkä jopa perustuen ruoan mieltymyksiin. Tämä on lineaarista ajattelua, jossa markkinoija on määritellyt aloitus- ja lopetuskohdan.

Kiireisessä maailmassa asiakkaiden elämä muuttuu jatkuvasti reaaliajassa - joskus he ovat sitoutuneempia, joskus vähemmän. Vahvistusoppimisessa järjestelmä kalibroisi jatkuvasti sen, mitkä markkinointi-armeijan taktikot tarjoavat parhaan mahdollisuuden siirtää vastaanottajaa kohti kymmenenkertaisen sitoutumisen perimmäistä tavoitetta.

2. Dynaaminen budjettikohta

Kuvittele nyt mainoskatsaus, jossa sinulla on miljoonan dollarin budjetti ja sinun on vietettävä joitain päivittäin kuukauden loppuun saakka, jaettuna neljälle eri kanavalle: TV, kanta-asiakaskampanjat ja Google. Kuinka voit varmistaa, että käytät budjettia parhaalla mahdollisella tavalla? Vastaus riippuu päivästä, kohdekäyttäjistä, varaston hinnasta ja monista muista tekijöistä.

Vahvistusoppimisessa algoritmit käyttäisivät historiallisia mainostulosta tietoja palkitsemistoimintojen kirjoittamiseen, jotka pisteyttävät tietyt menopäätökset. Mutta se ottaa huomioon myös reaaliaikaiset tekijät, kuten hinnoittelu ja positiivisen vastaanoton todennäköisyys kohdeyleisön jäseneltä. Toistuvan oppimisen avulla mainoskulujen jakaminen koko kuukauden ajan muuttuisi dynaamisesti. Vaikka lopullinen tavoite on asetettu, RL: lle on osoitettu budjetti parhaalla mahdollisella tavalla kaikissa skenaarioissa. (Lisätietoja AI: stä markkinoinnissa on artikkelissa Miten tekoäly mullistaa myyntiteollisuutta.)

Tulossa pian

Vahvistamisoppiminen tunnustaa monimutkaisuuden ja ihmisten heterogeenisyyden ja ottaa huomioon nämä totuudet parantaen jokaista seuraavaa toimintoa ajan myötä, kun pelipöydän osat muuttuvat sen ympärille.

Vahvistusoppiminen on edelleen suurelta osin tutkimusprojektien ja huipputekijöiden omaisuutta. Matematiikan konsepti ja tekniikka ovat olleet olemassa jo yli 40 vuotta, mutta niitä on ollut mahdollista ottaa käyttöön vasta suhteellisen äskettäin kolmen suuntauksen ansiosta:

  1. Laskentatehon lisääntyminen suuritehoisten grafiikkaprosessointiyksiköiden (GPU) avulla.

  2. Cloud computing antaa huipputekniselle prosessorin virralle käytettävissä murto-osan GPU: n ostamisen kustannuksista, jolloin kolmannet osapuolet voivat vuokrata GPU: n kouluttamaan RL-malliaan useita tunteja, päiviä tai viikkoja suhteellisen edulliseen kellarihintaan.

  3. Parannus joko numeerisiin algoritmeihin tai älykkäisiin heuristiikoihin. Muutama RL-algoritmin kriittinen numeerinen vaihe pystyy nyt lähentymään paljon nopeammin. Ilman näitä maagisia numeerisia temppuja, ne eivät silti olisi toteutettavissa edes nykypäivän tehokkaimmissa tietokoneissa.

Ajattele isompaa

Kaikki tämä tarkoittaa, että uudet vahvistusoppimisvoimat tulevat pian saatavana tuotemerkeille ja markkinoijille. Sen omaksuminen vaatii kuitenkin ajattelutavan muutosta. Markkinointipäällikölle tämä tekniikka tarkoittaa kykyä ottaa kätensä pois pyörästä.

Jokaisella yrityksellä on tavoite, mutta kun olet syvällä kaivoksissa, päivittäiset toimenpiteet, jotka tehdään kohti tätä tavoitetta, voivat tulla sumeita. Nyt RL-tekniikka antaa päätöksentekijöille mahdollisuuden asettaa tavoitteen, sillä heillä on enemmän luottamusta siihen, että järjestelmät suunnittelevat parhaan suuntaansa kohti sitä.

Esimerkiksi mainonnassa nykyään monet ihmiset ymmärtävät, että muuttujat, kuten napsautussuhde (CTR), ovat vain välityslomakkeita todellisille liiketoiminnan tuloksille, jotka lasketaan vain siksi, että ne ovat luettavissa. RL: n johtamat markkinointijärjestelmät korostavat tällaiset välittäjät ja kaiken niihin liittyvän raskaan nostamisen, jolloin pomot voivat keskittyä tavoitteisiin.

Tämä vaatii yrityksiä pohtimaan suuria ongelmiaan paljon ennakoivammin ja pitkällä aikavälillä. Kun tekniikka on kypsä, he saavuttavat tavoitteensa.

Polku adoptioon

Vahvistusoppimista ei ole vielä valmista tuotemerkkien täysimittaiseen käyttöön; markkinoijien tulisi kuitenkin viedä aikaa ymmärtää tämä uusi konsepti, joka voi mullistaa tavan, jolla tuotemerkit markkinoivat, hyödyntäen joitain koneoppimisen varhaislupauksista.

Kun virta tulee, se tulee markkinointiohjelmistoon, jossa on käyttöliittymä, mutta kyseisen ohjelmiston vaatimat tehtävät yksinkertaistuvat radikaalisti. Henkilöstölle tulee vähemmän liikkuvia kytkimiä ja numeroiden syöttämistä, samoin kuin analyysiraporttien lukemista ja niihin vaikuttamista. Kojelaudan takana algoritmi käsittelee suurimman osan siitä.

On epätodennäköistä, että RL voi viedä ihmisen älykkyyttä heti portista. Sen kehitysnopeus riippuu markkinoijien palautteesta ja ehdotuksista. Meidän on varmistettava, että pyydämme tietokonetta ratkaisemaan oikea ongelma ja rangaistaan ​​sitä, kun se ei toimi. Kuulostaa siltä, ​​kuinka opetat oman lapsesi, eikö niin?