4.1. Data Splitting

Video ini menjelaskan pentingnya membagi dataset menjadi tiga bagian—training, validation, dan testing—untuk membangun model machine learning yang robust dan optimal. Uraian secara rinci adalah sebagai berikut:

  • 0:11 - 0:26, dijelaskan bahwa mesin pembelajaran menghasilkan model machine learning, dan model tersebut diharapkan kuat atau robust, mampu menghasilkan akurasi tinggi, misalnya 95%.
  • 0:26 - 1:07 : Untuk membangun model yang robust, terdapat tiga tahap utama: training, validation, dan testing. Dataset dibagi menjadi tiga bagian, yaitu data training, validation, dan testing.
  • 1:07 - 1:45: Data training digunakan untuk melatih model hingga menghasilkan prediksi. Hasil prediksi dibandingkan dengan nilai aktual, dan error yang dihasilkan digunakan untuk mengupdate parameter model hingga hasilnya optimal.
  • 1:45 - 2:26: Data validation digunakan untuk mengupdate hiperparameter dengan harapan mendapatkan hasil yang optimal juga. Proses validation membantu dalam menyempurnakan model.
  • 2:26 - 2:45: Setelah proses training dan validation selesai dan dianggap cukup, model akan diuji menggunakan data testing untuk memastikan model optimal.
  • 2:45 - 3:02: Pembagian dataset menjadi tiga bagian ini dilakukan agar model yang dihasilkan kuat dan robust.