Syvät Q-verkot

Kirjoittaja: Laura McKinney
Luomispäivä: 5 Huhtikuu 2021
Päivityspäivä: 26 Kesäkuu 2024
Anonim
Syvät Q-verkot - Tekniikka
Syvät Q-verkot - Tekniikka

Sisältö

Määritelmä - mitä Deep Q-Networks tarkoittaa?

Deep Q Networks (DQN) ovat hermoverkkoja (ja / tai niihin liittyviä työkaluja), jotka hyödyntävät syvää Q-oppimista tarjotakseen malleja, kuten älykkäiden videopelien simulaation. Sen sijaan, että Deep Q Networks olisi nimenomainen tietylle hermoverkkorakennukselle, se voi koostua konvoluutiohermostoista ja muista rakenteista, jotka käyttävät erityisiä menetelmiä oppiakseen erilaisista prosesseista.


Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää Deep Q-Networksin

Syvän Q-oppimisen menetelmä käyttää tyypillisesti jotain, jota kutsutaan yleiseksi politiikan iteraatioksi, jota kuvataan politiikan arvioinnin ja politiikan iteraation yhdistelmänä, politiikkojen oppimiseksi korkean ulottuvuuden aistien kautta.

Esimerkiksi yleinen tyyppi syvä Q-verkko, jota kattavat tekniikkajulkaisut, kuten Medium, vie aistitulon Atari 2600 -peleistä mallitulosten mallinnukseen. Tämä tapahtuu hyvin perustavalla tasolla keräämällä näytteitä, tallentamalla niitä ja käyttämällä niitä kokemuksen uusintaan Q-verkon päivittämiseksi.


Yleisessä mielessä syvät Q-verkot harjoittavat syöttöjä, jotka edustavat aktiivisia toimijoita alueilla tai muissa kokeneissa näytteissä, ja oppivat sovittamaan nämä tiedot haluttuihin lähtöihin. Tämä on tehokas keinoälyn kehittämisessä käytettävä menetelmä, jolla voidaan pelata shakkeja kuten korkealla tasolla tai suorittaa muita korkean tason kognitiivisia toimia - esimerkiksi Atari- tai shakkivideopelien esimerkki on myös hyvä esimerkki siitä, kuinka AI käyttää inhimillisten tekijöiden perinteisesti käyttämät rajapintatyypit.

Toisin sanoen syvällä Q-oppimisella AI-pelaaja tulee olemaan enemmän kuin ihmispelaaja oppimisessa haluttujen tulosten saavuttamiseksi.