Forum Diskusi

A.syamsul ma'arif

Re: A.syamsul ma'arif

oleh FARID ANDRIAKSA -
Jumlah balasan: 0
Memiliki 3 fungsi
1. Estimasi Nilai State:

Critic berusaha untuk memperkirakan nilai dari setiap state (keadaan) dalam lingkungan.
2. Pembelajaran yang Lebih Cepat:

Critic memberikan informasi yang lebih akurat kepada actor tentang nilai dari tindakan-tindakan yang berbeda. Dengan informasi ini, actor dapat belajar lebih cepat untuk menemukan kebijakan (policy) yang optimal.
3. Stabilisasi Pembelajaran:

Critic membantu menstabilkan proses pembelajaran. Dengan memberikan evaluasi yang lebih halus, critic mencegah actor dari perubahan kebijakan yang terlalu drastis.
Analogi Sederhana

Bayangkan seorang pemain catur dan seorang pelatih. Pemain catur (actor) bertanggung jawab untuk memilih langkah selanjutnya. Pelatih (critic) mengamati permainan dan memberikan umpan balik tentang kualitas setiap langkah. Pelatih tidak hanya mengatakan apakah langkah tersebut benar atau salah, tetapi juga memberikan penjelasan mengapa langkah tersebut baik atau buruk. Dengan umpan balik dari pelatih, pemain catur dapat belajar lebih cepat dan meningkatkan kemampuan bermainnya.