Materi Ukuran Penyebaran Data

Untuk mendeksripsikan hasil pengukuran suatu sampel, ukuran penyebaran data merupakan konsep dalam suatu analisis statistic. Misalnya tiga buah hasil pengukuran dari tiga sampel berbeda sebagai berikut:

Sampel I              : 50  50  50  50  50  50  50  50  50  50 

Sampel II            : 55 50  45  60  40  56  54  50  44  46

Sampel III           : 60  35  25  70  45  30  40  65  75  55

Ketiga data tersebut mempunyai rata-rata hitung yang sama yaitu 50, namun berbeda penyebarannya. Sampel I mempunyai penyebaran sama dengan nol karena semua skor besarnya sama. Sampel II dan III memiliki penyebaran yang tidak sama besarnya, namun sampel III memberikan penyebaran yang lebih besar. Kenapa demikian? Jarak sebaran pada sampel II hanya 21 sedangkan sampel III adlah 51. Jadi, ukuran penyebaran data ini menjadi perbedaan dari ketiga data sampel tersebut.

Penyimpangan skor-skor dapat berupa positif atau negative, tergantung letak skor tersebut terhadap mean dan jumlah dari penyimpangan sama dengan nol. Untuk mengetahui seberapa besar penyimpangan dalam suatu pengukuran dinyatakan dengan indeks variabilitas yang dikenal dengan nama simpangan baku.

Beberapa ukuran penyebaran antara lain jangkauan, jangkauan antar kuartil, langkah, ragam, dan simpangan baku. Pada kesempatan ini akan dibahas mengenai jangkauan, jangkauan antar kuartil, ragam, simpangan baku,

JANGKAUAN

Jangkauan adalah selisih nilai ekstrem data, yaitu nilai terbesar data dikurangi nilai terkecil data-i-untuk suatu pengukuran yang bersifat numerik.

📢 Contoh:

🔦 jangkauan dari data: 65, 73, 89, 56, 73, 52,47 adalah 89-47= 42. (dengan terlebih dahulu data diurutkan)

🔦 Tinggi badan (dalam cm) dari 10 siswa adalah sebagai berikut:

157,152, ----- , 151, 160, 156, 155,162,158,163

Data tinggi badan maksimum terhapus. Tapi, diketahui jangkauan data adalah 14 cm. Tinggi badan maksimum adalah....

Penyelesaian:

Terlebih dahulu data diurutkan: 151, 152, 155, 156, 157, 158, 160, 162, 163, ....

Jangkauan (J) = Nilai Maks - Nilai Min

14 cm = Nilai maks - 151 --> Nilai maks = 151 + 14 = 165 cm

Namun, jangkauan hanya menggunakan dua nilai untuk mengukur penyebaran data yaitu nilai terbesar dan terkecil dan tidak memperhitungkan nilai yang lain sehingga informasi yang diperoleh dari data tidak terwakili. hal ini disebabkan nilai ektrem (pencilan) sangat mempengaruhi Jangkauan. Untuk itu diperlukan alternatif dalam pengukuran penyebara data dengan jangkauan antar kuartil.


JANGKAUAN ANTARKUARTIL

Jangkauan antarkuartil adalah suatu ukuran untuk menyatakan penyebaran dalam suatu data. Dirumuskan sebagai selisih antar kuartil atas dengan kuartil bawah.

Masih ingat kuartil? suatu nilai yang membagi data menjadi empat bagian sama besar.


Contoh 1.

Diberikan data sebagai berikut: 2 3 4 5 6 6 6 7 7 8 9. Kuartil atas adalah 7 dan kuartil bawah = 4, sehingga jangkauan antar kuartil = 7 - 4 = 3. Karena 25% data lebih besar dari kuartil atas dan 25% data lebih kecil dari kuartil bawah. Maka, dapat dinyatakan bahwa 3 adalah lebar interval yang mencakup 50% data yang nilainya berada di tengah relatif terhadap keseluruhan nilai data.

Contoh 2.

Berikut adalah data jumlah unit komputer yang terjual setiap bulan oleh Ina selama setahun terakhir.

34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37.

Jangkauan dan jangkauan antar kuartil dari data di tersebut adalah ....

Penyelesaian:

Data diurutkan diperoleh: 1,11,15,19,20,24,28,34,37,47,50,57

sehingga Jangkauan (J) = 57 - 1 = 56

Bagaimana Jangkauan Kuartil?

Kuartil bawah adalah rata-rata data terurut ketiga dan keempat yaitu (15 + 19)/2 = 17

Kuartil atas adalah rata-rata dari data terurut ke-9 dan ke-10 yaitu (37 + 47)/2 = 42

sehingga Jangkauan antar kuartil adalah Q3 - Q1 = 42 - 17 = 25

Dibandignkan jangkauan, nilainya lebih kecil karena mengukur lebar interval 50% yang terletak di tengah dan tidak dipengaruhi pencilan. 

RAGAM ATAU VARIASI

Ragam mengukur variasi data terhadap rataan hitungnya. Dirumuskan sebagai rata-rata dari jumlah kuadrat penyimpangan setiap nilai data terhadap rataan hitung data.


Rumus lain untuk menghitung ragam pada sampel yaitu: 

Contoh:

Menggunakan data penjualan 34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37 maka diperoleh rata-rata = 28,6 sehingga ragam data


Jadi ragam adalah bentuk kuadrat, sehingga sulit untuk menginterpretasikan makna dari ragam sehingga dilanjutkan ke bentuk lain yaitu simpangan baku yang merupakan akar kuadrat dari ragam. Simpangan baku memiliki penggunaan lebih luas untuk mengukur variasi data sehingga dapat dikatakan  bahwa variasi suatu proses perantara untuk mendapatkan ukuran penyebaran data sesungguhnya yaitu simpangan baku.

SIMPANGAN BAKU

Ukuran penyebaran data yang paling sering digunakan adalah simpangan baku. Pengukuran ini menunjukkan tingkat penyimpangan setiap nilai data terhadap rataan hitungnya, secara matematis dirumuskan sebagai akar kuadrat dari ragam. Pada proses manufaktur ataupun pengukuran secara umum, ketepatan atau presisi yang tinggi diasosiasikan dengan kecilnya penyimpangan. Semakin besar penyimpangan data terhadap pusatnya, semakin besar pula nilai simpangan baku.

Panduan penggunaan simpangan baku.

Jika, data berdistribusi normal atau ukuran data cukup besar (30 atau lebih), dan S adalah simpangan baku. Maka, didapatkan hasil berikut ini.

@ Sekitar 68% dari nilai data berada pada interval -S hingga S

@ Sekitar 95% dari nilai data berada pada interval -2S hingga 2S.

@ 5ekitar 99% dari nilai data berada pada interval -3S hingga 3S

Contoh:

Data pada tabel berikut adalah mengenai waktu (dalam jam) per minggu yang dihabiskan oleh 220 siswa untuk menonton televisi. Informasi apa yang diperoleh dari data ini?


Karena data berkelompok, rata-rata dihitung menggunakan nilai tengah, yaitu sebagai berikut.


dari tabel diperoleh:

Rata-rata = total waktu / banyak siswa = 6560 / 220 = 29.81 jam

Simpangan = nilai tengah - ratarata

Ragam = ratarata jumlah kuadrat simpangan

             = 754.88 / 220 = 3.43

Simpangan baku = akar ragam =   \sqrt[2]{3.43}  = 1.85

Interprtasi Data:

Hasil perhitungan simpangan baku diperoleh:

Secara rata-rata, setiap anak menghabiskan waktu 29,8 jam per minggu untuk menonton televisi. Lebih tepatnya lagi, dapat dirinci sebagai berikut:

👉Sekitar 68% data, yaitu 150 siswa menghabiskan waktu antara 29,8 :± 1,85 jam, yaitu 28 hingga 31,7 jam per minggu untuk menonton televisi.

👉Sekitar 95% data, yaitu 209 siswa menghabiskan waktu antara 29,8 ± (2 x 1,85) jam, yaitu 26,1 hingga 33,S jam per minggu untuk menonton televisi.

👉Sekitar 99% data, yaitu 218 siswa menghabiskan waktu antara 2918 ± (3 x 1,85) jam, yaitu 24,3 hingga 31,7 jam per minggu untuk menonton televisi.

Contoh 3.

Pada hasil ujian statistika 30 siswa, rentang nilai dari 31% hingga 98% tentu lebih bervariasi daripada rentang nilai 82% hingga 93°%. Hasil mana yang lebih baik? 

Sekilas terlihat bahwa hasil pertama lebih baik, karena ada siswa yang mampu menjawab 98% ujian, sernentara hasil kedua, nilai tertinggi hanya 93%. Akan tetapi, hasil pertama sangat bervariasi; sementara hasil kedua lebih terkonsentrasi, menunjukkan bahwa pemahaman siswa lebih merata dibandingkan hasil pertama. Dapat disimpulkan, bahwa hasil kedua lebih baik daripada hasil pertama.

Ukuran penyebaran data yang tepat jika ukuran pemusatan data adalah rata-rata. Seluruh nilai data diperhitungkan, tidak ada informasi data yang hilang. Mengukur variasi data sekitar rata-rata. Sensitif terhadap data pencilan dan dapat digunakan untuk membandingkan dua kelompok data yang skala pengukurannya sama.

RANGKUMAN

jika rataan hitung sebagai pusat data maka simpangan baku adalah ukuran penyebaran yang tepat. Ukuran ini baik digunakan pada data tanpa pencilan.

Rataan hitung dan sirnpangan baku lebih umum digunakan dibandingkan statistik lima serangkai. Hal ini karena banyak fenomena (data) yang biasanya dapat dijelaskan oleh distribusi normal. Untuk distribusi normal, rataan hitung dan simpangan baku merupakan ukuran pusat data dan ukuran penyebaran yang tepat.

Simpangan baku memperhitungkan seluruh nilai data sehingga sangat informatif ketika data berdistribusi normal. Tapi, tidak bagus ketika data tidak simetris atau terdapat penciIan.

📢 LATIHAN:

👉 Dari 50 responden ditanya mengenai banyaknya pertandingan sepakbola yang dihadiri mereka, dan berikut adalah datanya:

15, 10, 17, 11, 15, 12, 13, 16, 12, 14, 14, 16, 15, 18, 11, 16, 13, 17, 12, 16,  18,  15,  17, 15, 19, 13,  14, 17, 16,  15,  12, 11,  17,  16, 
15, 10,  14,  15,  13,  16,  18,  15,  17,  11,  14,  17,  15,  14, 13,  16.

a. Tuliskan kembali data tersebut dalam tabel frekuensi!

b. Hitunglah rata-rata/ median/ dan modusnya!

c. Hitunglah ragam dan simpangan bakunya!

d. Tentukan interval yang mana diharapkan akan mencakup 95% nilai data!

e. Bagaimanakah penyebaran data tersebut?

👉 Pak Mus seorang pengusaha. Bidang Usaha yang dijalani adalah penerbitan, tekstil dan angkutan. Dalam 5 bulan terkahir, Pak Mus mencatat keuntungan bersih ketiga bidang usahanya sebagaimana pada table beirkut:


Jika Pak Mus berpendapat bahwa bidang usaha yang akan dipertahankan hanya dua bidang usaha dengan kriteria bidang usaha dengan keuntungan bersih yang stabil, tentukan bidan usaha yang sebaiknya tidak dilanjutkan.


NB:


Beriktu diberikan video ukuran penyebarn data:

Video Perhitungan ukuran penyebaran data 


Video ukuran penyebaran data untuk data berkelompok


Baik kelas, demikian materi ukuran penyebaran data, semoga bermanfaat.

TERIMA KASIH

Angin tidak berhembus untuk menggoyangkan pepohonan, melainkan menguji kekuatan akarnya. (Ali Bin Abi Thalib)

SEE YOU NEXT CHAPTER


Last modified: Friday, 24 September 2021, 8:22 PM