Q-oppiminen

Kirjoittaja: Roger Morrison
Luomispäivä: 24 Syyskuu 2021
Päivityspäivä: 11 Saattaa 2024
Anonim
Lukujoukot: N, Z, Q, RQ ja R
Video: Lukujoukot: N, Z, Q, RQ ja R

Sisältö

Määritelmä - Mitä Q-oppiminen tarkoittaa?

Q-oppiminen on termi algoritmirakenteelle, joka edustaa mallivapaa vahvistusoppimista. Arvioimalla politiikkaa ja käyttämällä stokastista mallintamista, Q-oppiminen löytää parhaan tietä eteenpäin Markovin päätöksentekoprosessissa.


Johdanto Microsoft Azureen ja Microsoft Cloud | Tämän oppaan läpi opit mitä pilvipalvelussa on kyse ja kuinka Microsoft Azure voi auttaa sinua siirtämään ja johtamaan yritystä pilvestä.

Techopedia selittää Q-oppimisen

Q-oppimisalgoritmin tekninen rakenne käsittää edustajan, joukon tiloja ja joukon toimintoja tilaa kohti.

Q-toiminto käyttää painoja eri vaiheissa yhdessä diskonttokertoimen kanssa palkkioiden arvottamiseksi.

Vaikka Q-oppiminen voi tuntua yksinkertaiselta idealta, se on ensiarvoisen tärkeä monenlaisissa vahvistusoppimis- ja syväoppimismalleissa. Yksi parhaimmista esimerkeistä on se, että syvällä Q-oppimisella autetaan koneoppimisohjelmia oppimaan pelistrategioita erityyppisissä videopeleissä, esimerkiksi 1980-luvun Atari-peleissä. Tässä konvoluutiohermoverkko ottaa näytteitä pelin pelaamisesta stokastisen mallin laatimiseksi, joka auttaa tietokonetta tietämään, kuinka peliä pelata paremmin ajan myötä.


Q-oppimisella on runsaasti potentiaalia edistää tekoälyn ja koneoppimisen etenemistä.