4.1. Data Splitting
Video ini menjelaskan pentingnya membagi dataset menjadi tiga bagian—training, validation, dan testing—untuk membangun model machine learning yang robust dan optimal. Uraian secara rinci adalah sebagai berikut:
- 0:11 - 0:26, dijelaskan bahwa mesin pembelajaran menghasilkan model machine learning, dan model tersebut diharapkan kuat atau robust, mampu menghasilkan akurasi tinggi, misalnya 95%.
- 0:26 - 1:07 : Untuk membangun model yang robust, terdapat tiga tahap utama: training, validation, dan testing. Dataset dibagi menjadi tiga bagian, yaitu data training, validation, dan testing.
- 1:07 - 1:45: Data training digunakan untuk melatih model hingga menghasilkan prediksi. Hasil prediksi dibandingkan dengan nilai aktual, dan error yang dihasilkan digunakan untuk mengupdate parameter model hingga hasilnya optimal.
- 1:45 - 2:26: Data validation digunakan untuk mengupdate hiperparameter dengan harapan mendapatkan hasil yang optimal juga. Proses validation membantu dalam menyempurnakan model.
- 2:26 - 2:45: Setelah proses training dan validation selesai dan dianggap cukup, model akan diuji menggunakan data testing untuk memastikan model optimal.
- 2:45 - 3:02: Pembagian dataset menjadi tiga bagian ini dilakukan agar model yang dihasilkan kuat dan robust.