Vahvistusoppiminen (reinforcement learning, RL) | Pieni Tekoälysanasto
Vahvistusoppiminen (reinforcement learning, RL)Vahvistusoppiminen (reinforcement learning, RL)
Koneoppimisen muoto, jossa algoritmi kehittää itseään saamansa palautteen mukaisesti. Tätä kutsutaan myös yritys ja erehdys -tekniikaksi. Vahvistusoppimiseen ei tarvita ennalta valmistettua opetusaineistoa kuten ohjattuun oppimiseen.