Forum Diskusi

pengantar machine learning

Re: pengantar machine learning

oleh SITI NURLITA DEWI -
Jumlah balasan: 0
Dalam reinforcement learning, model tahu kapan dia udah ngambil keputusan yang benar dari feedback yang dia dapat dari lingkungan. Kalau aksinya benar, dia dapet reward (penghargaan), dan kalau salah, dia dapet penalty (hukuman). Dengan ngumpulin reward ini terus-menerus, model bakal belajar aksi mana yang kasih hasil terbaik. Seiring waktu, model bakal lebih sering pilih aksi yang menghasilkan reward tinggi, karena tujuannya adalah memaksimalkan total reward. Jadi, model tahu keputusannya benar ketika aksinya menghasilkan reward lebih tinggi dari yang sebelumnya.