Sunday, December 11, 2011

statistik pada data e-KTP

Seringkali dalam membuat sebuah report pemilik data pun bingung laporan/  report / informasi apa yang bisa ditampilkan dari data yang ada. Untuk sebuah kumpulan data maka kemungkinan report bisa dikatakan tak terbatas. Namun yang jadi masalah apakah report tersebut dibutuhkan dan bermanfaat. Lalu bagaimana langkah analisa membuat sebuah informasi / report yang diperlukan? hehehe saya bukan seorang statistik, jadi saya beri saja contoh kemungkinan pengolahan sekumpulan data.

Saya ambil contoh sebuah proyek yang sedang ramai e-KTP, dapat dilihat dari website nya disebutkan apa saja  fungsi dari e-KTP. Namun dibalik sejumlah fungsi itu sebenarnya dapat kita ambil beberapa report atau hasil analisa yang menarik.
Berikut contoh informasi menarik yang dapat diambil dari database penduduk indonesia.

Kita bisa tahu apa nama paling banyak digunakan oleh orang indonesia laki-laki dan perempuan.
Apakah dedy, agus, deny untuk laki-laki atau dewi, putri, sari untuk yang wanita ?? Hal semacam ini seperti dapat kita ketahui di Amerika pada tahun 90 dapat diketahui nama laki-laki yang paling umum adalah James kemudian John, hasil dari analisa Biro Sensus Amerika (BPS nya Amrik kali ya?)

Mungkin dengan semacam soundex (-hayo ikutan nyumbang wikipedia ya-) agar hasilnya lebih baik sehingga jumlah di hitung berdasarkan kesamaan bunyi/homofon.

Yang kemudian untuk sebuah homofon 'dedi' dapat dibreak down dari nama yang berbunyi dedy berapa % yang ditulis dengan 'deddy', 'dedi', 'dedy'.

Dengan tambahan data tanggal lahir maka dapat kita gali informasi lain:
Mungkin kita penasaran berapa sih orang bernama Agus yang tidak lahir di bulan Agustus :)
yang masih sejenis benarkah  semua orang bernama Sagita lahir dengan bintang sagitarius ?

Tambah lagi dengan data pekerjaan, ini bisa jadi semacam hasil riset / survey, mungkin relasi antara nama dan profesi, misal 30% orang dengan nama 'Ilham' berprofesi sebagai dokter. Atau orang dengan nama 'ting-ting' sebagian besar berprofesi sebagai pedangdut atau pengantar surat yang sering salah alamat :p.

Dan tentunya dengan data tahun kelahiran dapat kita lihat trend sebuah nama ... misal nama Casandra populer untuk anak yang lahir pada era telenovela. 

Mungkin ada yg berpendapat lebih ideal dan update kalo menggunakan data sensus penduduk, tapi kalau melihat data sensus Penduduk 2010 dari BPS ternyata hanya menampilkan jumlah penduduk dan ada kelompok umur. Dan terus terang, pada saat proses sensus pun saya tidak merasa terhitung dalam sensus tersebut.

Yaah, masih banyak lagi peluang informasi yang bisa digali dari data e-KTP (jika sukses tentunya) walaupun tidak semua penduduk indonesia, minimal data-data untuk data penduduk yang lahir sebelum tahun '95 (ktp >> untuk 17 tahun ke atas). --- tentunya lebih luas lagi kalau data ini nyambung ke database rekening, pajak , dll (menarik namun juga 'seram' tentunya).

Sedikit pesan tersirat bahwa bentuk report dan informasi dapat terus digali dengan kreativitas kita, tentunya juga dari pengalaman kita melihat bentuk-bentuk report yang ada dari berbagai aplikasi dan bisnis proses sebagai referensi kita. 

Ada ide lagi informasi / report  apa yang bisa didapatkan dari database e-KTP ??







No comments: