Paradoks Simpson adalah sebuah fenomena dalam statistika, dimana tren dari beberapa kelompok data terbalik dari tren gabungan kelompok data tadi. Paradoks ini dideskripsikan oleh Edward H. Simpson pada tahun 1951. Pemahaman dan kemampuan mengidentifikasi paradoks ini penting dalam melakukan interpretasi dan penarikan kesimpulan dari suatu data.
Sebagai contoh, tinjau performa akademik dua mahasiswa, Panijan dan Tukiyem, selama dua semester. Nilai indeks prestasi semester dan indeks prestasi kumulatif keduanya selama dua semester diberikan dalam tabel berikut.
Nama | IP Semester I (sks) | IP Semester II (sks) | IPK (sks) |
---|---|---|---|
Panijan | (22) | (11) | (33) |
Tukiyem | (17) | (24) | (41) |
Berdasarkan data di atas, nampak indeks prestasi semester Panijan lebih tinggi daripada Tukiyem baik pada semester I maupun II. Meskipun demikian, ternyata indeks prestasi kumulatif Tukiyem lebih tinggi daripada Panijan! Artinya, performa akademik Tukiyemlah yang lebih baik. Problem ini disebut paradoks karena secara intuitif sebagian besar orang cenderung mengira pihak yang unggul di setiap kelompok akan unggul pula secara keseluruhan. Well, hal ini hanya berlaku jika ukuran tiap kelompok seragam. Secara umum, subjek dengan nilai terbaik di setiap kelompok belum tentu memiliki nilai terbaik secara keseluruhan.
Paradoks Simpson dapat terjadi apabila sampel tidak terdistribusi secara seragam pada tiap-tiap kelompok data. Paradoks Simpson juga dapat pula terjadi bila pengelompokan data didasarkan pada hal yang tidak sepadan. Dengan demikian, data dari masing-masing kelompok tidak benar-benar merupakan sampel acak dari populasi total sehingga tidak merepresentasikan keseluruhan data. Dengan menggunakan grafik, hal ini dapat diperlihatkan pada gambar berikut.
Data dari kelompok I dan II sama-sama menunjukkan tren positif. Namun, ketika kedua kelompok digabungkan, diperoleh tren negatif. |
Sekarang kita coba membahas suatu contoh kasus dengan analisa. Terdapat dua macam masalah batu ginjal, yaitu batu ginjal berukuran kecil dan batu ginjal berukuran besar. Untuk mengatasi masalah batu ginjal terdapat dua metode pula, yaitu metode sederhana (laser) dan metode kompleks (pembedahan, pengangkatan manual, dan diselesaikan dengan penembakan laser). Tingkat kesuksesan tiap metode untuk tiap masalah diberikan dalam tabel berikut.
Metode pengobatan | Batu kecil | Batu besar | Gabungan |
---|---|---|---|
Laser | (93%) | (73%) | (78%) |
Kompleks | (87%) | (69%) | (83%) |
Nampak bahwa metode kompleks memiliki tingkat kesuksesan lebih baik daripada metode sederhana untuk kasus batu ginjal kecil maupun besar, namun secara keseluruhan metode sederhana memberikan tingkat kesuksesan yang lebih baik. Jadi, bagaimana kita menafsirkan data ini? Apakah metodek kompleks memang lebih baik daripada metode sederhana, ataukan sebaliknya, ataukah keduanya sama saja? Jika metode kompleks tidak lebih baik daripada metode sederhana, tentunya melakukan metode kompleks hanyalah pemborosan uang.
Pertama-tama, kita perlu jeli memperhatikan bahwa kedua metode dibandingkan dalam dua kasus yang berbeda, bukan sekedar perbedaan waktu dan lokasi pengambilan sampel. Bila diteliti, ternyata metode sederhana lebih banyak digunakan pada masalah terkait batu ginjal berukuran kecil. Di sisi lain, metode kompleks sebagian besar diterapkan pada masalah batu ginjal berukuran besar, yang mana memiliki resiko tinggi. Hal inilah yang membuat tingkat kesuksesan metode kompleks secara keseluruhan (gabungan kedua kasus) menjadi lebih rendah, karena sebagian besar sampelnya ialah dari kasus yang beresiko tinggi. Dalam contoh kasus ini, kesimpulan yang tepat mengenai metode yang lebih ampuh haruslah melihat tingkat kesuksesan tiap metode untuk tiap kasus secara individual.
Referensi:https://en.wikipedia.org/wiki/United_States_presidential_election,_2016
https://brilliant.org/wiki/simpsons-paradox/
Tidak ada komentar:
Posting Komentar