Reinforcement Learning adalah metode dalam machine learning di mana sebuah agen (program atau model) belajar untuk mengambil keputusan melalui interaksi dengan lingkungan. Agen ini bertujuan memaksimalkan reward (penghargaan) yang diperoleh dari lingkungan berdasarkan tindakannya.