Pekiştirmeli Öğrenme - Reinforcement Learning - RL

Ödülü en üst düzeye çıkaracak davranışları öğrenerek, aracının mevcut durumuna dayalı sıradaki en etkili işlemi belirlemesini sağlayan bir makine öğrenmesi algoritması türüdür. Takviyeli öğrenmede yazılımlar, genellikle deneme yanılma yoluyla en iyi eylemleri öğrenirler. Genel olarak robotikte kullanılır. Burada bir robot, engele çarptıktan sonra negatif geri bildirim alarak çarpışmalardan kaçmayı öğrenebilir. Ayrıca video oyunlarında da, yine deneme yanılma yöntemiyle bir oyuncunun ödülleri alabileceği belirli hareketleri saptayabilir ve bir sonraki hareketini buna göre komutlar.