Vahvistusoppiminen (reinforcement learning, RL)

Koneoppimisen muoto, jossa algoritmi kehittää itseään saamansa palautteen mukaisesti. Tätä kutsutaan myös yritys ja erehdys -tekniikaksi. Vahvistusoppimiseen ei tarvita ennalta valmistettua opetusaineistoa kuten ohjattuun oppimiseen.

← Takaisin sanastoon

Koneoppiblogi

Vahvistusoppiminen (reinforcement learning, RL) | Pieni Tekoälysanasto

Vahvistusoppiminen (reinforcement learning, RL)