Monthly Archives: Juli 2014

Konvergensi, Quick Count dan Statistika yang Menolak Tunduk

Posted by dnial

Pilpres 2014 ini memang Pilpres yang luar biasa. Ada kemeriahan, ada fitnah dan yang paling membuatku terkesan ada partisipasi publik di dalamnya. Ada orang-orang yang tanpa dibayar sepeserpun dan bahkan mengeluarkan duit mau berkampanye untuk capres idolanya, ada orang yang mau bikin aplikasi untuk menghitung exit poll di luar negeri, ada programmer(bahkan ada beberapa) yang membuat situs yang mengajak masyarakat untuk berpartisipasi mengentry data C1 secara manual untuk mengawal suara di form C1. Luar biasa!

Tapi Pilpres kali ini juga diwarnai pembodohan karena metode hitung cepat ternoda oleh lembaga quick count yang tidak bertanggungjawab telah mencemarkan nama baik ilmu statistik.

Sekarang, ilmu statistik melawan.

Hari ini, dengan bekal data C1 yang dientri oleh ribuan relawan yang bekerja tanpa dibayar, kita akan melawan pembodohan. Kita akan membuat quick count versi kita sendiri.

Latar Belakang

Quick count pada dasarnya adalah penelitian statistik dan semua penelitian punya kewajiban untuk dapat direproduksi ulang oleh pihak lain. Sebuah penelitian yang hasilnya tidak dapat direproduksi bukanlah penelitian yang benar, itu hanyalah sebuah kebetulan.

Jadi, kita hari ini akan belajar untuk mereproduksi sebuah quick count.

Bahan:
1. Data C1 dari berbagai sumber, kali ini kita akan pakai kawal suara. http://kawal-suara.appspot.com/
2. Microsoft Excel atau spreadsheet lainnya. Alternatif lain bisa pakai google spreadsheet atau Open Office Calc. Karena ini akan dirilis di internet saya akan impor perhitungannya ke Google Spreadsheet.
3. Pikiran yang terbuka, bersih dan adil. Seorang peneliti harus adil sejak dari pikiran, harus bersih dari kepentingan dan bisa menerima jika hasil penelitiannya tidak sesuai dengan hipotesis awalnya. Kepentingannya cuma satu, menambah pengetahuan. Hari ini kita akan menjadi seorang peneliti, jadi pikiran yang bersih dan adil ini sangat penting.
4. Google dan koneksi internet. Ini penting untuk mengcrosscheck ilmu yang baru kita dapat. Jangan sampai aku membodohimu. Aku bisa salah, ilmuku bisa ngawur.

Metodologi

Hari ini kita akan menggunakan metodologi yang disebut multi-stage cluster random sampling. Kenapa? Karena lebih simple. Bisa pakai metode yang lain dan akan dibahas sekilas, tapi intinya sama.

Dalam multi-stage cluster random sampling ini kita akan menentukan sebuah jumlah TPS yang akan kita ambil datanya di awal. Kita akan ambil 200 TPS. Kenapa 200, ya simple saja, karena sepertinya itu cukup enak untuk belajar, dan kita cuma perlu ambil minimal 1 sampel dari tiap propinsi dan setiap propinsi terwakili. Kalau anda cuma sanggup 100 ya boleh2 saja, kalau mau 10 ribu juga boleh. Namanya juga belajar. Dari 200 ini kita akan ambil secara proporsional dari setiap cluster, clusternya kali ini adalah propinsi. Jadi misal di aceh punya 1/5 dari jumlah TPS ya kita akan ambil 1/5 x 200 = 40 TPS di Aceh sebagai sample. Ambilnya TPS-nya random. Ini artinya multi-stage cluster random sampling. Tentukan clusternya, ambil random sample dari cluster.

Ada lagi metode yang lain namanya random sampling, dalam random sampling ini tidak ada cluster-cluster. Kita anggap seluruh Indonesia adalah satu kesatuan lalu kita ambil sample sesuai tingkat kepercayaan yang kita mau ambil Menurut perhitungannya untuk 470rb TPS kita harus ambil 16rb-an secara random untuk mendapat tingkat kepercayaan 99%. Cara ini jelas lebih solid, tapi ya aku yang males ambil data dari 16rb TPS.

Dengan cara ini maka perbandingannya kira-kira:
ACEH          9,508       4
JAWA BARAT   75,151    31
JAWA TENGAH   67,850    28
JAWA TIMUR   75,977    32

Lanjut!

Okeh, jadi dari data di atas kita akan ambil acak dari tiap propinsi sesuai TPS jatahnya. Tapi setelah dijumlah, karena ada pembulatan dari proporsi dapatnya cuma 198 TPS, alhasil Bali dan Kalteng ditambah satu dari 2 menjadi 3. Kenapa? Because I said so. Nggak ada alasan ilmiah lain.

Kenapa kok aku percaya diri dengan aturan yang nampaknya iseng tersebut, karena ada prinsip statistik yang namanya Central Limit Theorem. CLT ini bilang bahwa dengan pengacakan yang cukup, maka distribusi sampel akan mendekati rata-rata.

Kok mbulet ya? Pada intinya sih, kalau kita mengacak mendekati benar, hasilnya akan mendekati hasil dengan metodologi yang lebih rigid. Ya melesetnya nggak akan jauh-jauh amat lah. Atau istilah kerennya hasil quick count ini diulang berapa kalipun hasilnya akan konvergen atau mendekati angka yang sama, dalam hal ini sekitar 52-53%-an untuk Jokowi dan 47-48%-an untuk Prabowo Hatta.

Hasilnya bisa diintip di sini.

Hasil akhir quick count ini:
Prabowo-Hatta: 48.18%
Jokowi-JK : 51.82%

Hmmm… Nggak jauh2 amat lah dari QC di Tivi-tivi.

Kesimpulan

Bahwa, statistik ini adalah alat yang sangat bagus untuk digunakan jika penelitinya punya pikiran yang jernih. Kita bisa menghasilkan presentase yang mendekati QC yang lebih rigid metodologinya asal kita mau mematuhi kaidah-kaidah ilmiah yang benar, bahkan melenceng sedikit pun, masih bisa mendarat di sekitaran 2%-an.

Aku ingin menunjukan Quick Count dan statistik bukan sebuah hal yang kompleks dan menakutkan. Tapi sangat sederhana dan kita bisa lakukan sendiri asal ada datanya. Datanya ini yang harus dikumpulkan lembaga QC dengan mendaki gunung, turuni lembah atau bagiku mengopi data TPS satu per satu ke Excel.

Dengan operasi sederhana di Excel, SUM dan DIVIDE kita bisa melakukan quick count kita sendiri.

Jadi, Statistik dan Quick Count itu sederhana, kok. Jangan mau ditakut-takuti dengan statistik oleh para orang yang ngakunya pakar.

Ditulis dalam life