Tantangan Penggunaan Big Data untuk Official Statistics
Faharuddin (Varia Statistik edisi April 2020)
30 Januari 2023
Kasus Covid-19 seolah memberikan sinyal kuat bagi kita insan statistik di BPS untuk melakukan terobosan pengembangan metode statistik di luar metode konvensional yang kita lakukan saat ini. Terobosan itu misalnya dengan memanfaatkan big data yang belakangan ini semakin luas penggunaannya di berbagai bidang kehidupan manusia. Big data yang diidentifikasi dari volumenya yang besar, kecepatan produksi dan perubahannya, serta variasinya yang sangat beragam dihasilkan melaui pencatatan administrasi berbagai lembaga pemerintah atau swasta. Bahkan beberapa sumber data juga bisa berupa transaksi komersial seperti kartu kredit atau transakasi online, data jaringan sensorik seperti citra satelit, data tracking melalui GPS atau telepon seluler, data perilaku dalam akses internet, maupun data opini di media sosial. BPS sendiri sudah mulai menggunakan big data untuk statistik resmi (official statistics) pada Sensus Ekonomi 2016 (SE2016) dengan penggunaan Statistical Business Register (SBR), penggunaan mobile positioning data (MPD) untuk statistik periwisata dan statistik mobilitas yang diketahui memberikan data yang lebih berkualitas. Kita juga merasakan manfaat data kerangka sampel area yang fenomenal karena melahirkan revolusi data pangan di Indonesia. Hingga kini yang masih hangat adalah penggunaan data administrasi kependudukan untuk Sensus Penduduk 2020 (SP2020). Ke depanpenggunaan big data untuk official statistics merupakan keniscayaan yang harus diperluas lagi mencakup kegiatan statistik yang lain seperti statistik harga dan survei-survei rumah tangga yang dilakukan BPS. Pada masa yang akan datang, penggunaan big data untuk official statistics memiliki beberapa tantangan yang tidak ringan. Pertama, akses terhadap big data. Saat ini pemilik dan pengelola big data tersebar pada berbagai sumber mulai dari pemerintah hingga pihak swasta. Perlu effort dan biaya yang cukup besar untuk dapat mengaksesnya. Seandainya BPS dapat mendorong lahirmya regulasi yang memberikan kemudahan kepada lembaga statistik resmi untuk mendapatkan big data, maka saya percaya kedepan penggunaan big data untuk official statistics akan berjalan mulus seperti yang diharapkan. Undang-Undang (UU) Perlindungan Data Pribadi yang saat ini dibahas untuk mengatur transfer data pribadi tetapi masih bersifat umum. Rancagan UU tersebut belum mengatur secara khusus transfer big data untuk kepentingan kebijakan pemerintah khususnya lembaga statistik. Kedua, big data dikelola untuk kepentingan yang berbeda-beda dengan menggunakan sistem dan metode yang berbeda. Tidak satupun yang memiliki data lengkap dalam satu bidang tertentu sehingga untuk menjadikannya suatu statistik resmi perlu mengkombinasikan data dari berbagai sumber. Ini juga persoalan yang perlu diatasi jika kita menginginkan penggunaan big data kedepan lebih mudah. Persoalan lain adalah kualitas data yang belum teruji karena pengumpulan dan pengelolaan big data pada masingmasing pemilik belum memenuhi kaidah pengumpulan data secara statistik. Di sini perlu peran BPS membina penyelenggara statistik sektoral maupun statistik khusus terutama pengelola big data untuk memperbaiki kualitas data yang dihasilkan. Kita bisa memulainya dari instansi pemerintah yang mengelola big data misalnya Dirjen Dukcapil, BPJS Kesehatan, BPJS Ketenagakerjaan, Ditjen Pajak, Dinas Pendidikan, Rumah Sakit Pemerintah. Jika ini bisa dilakukan, saya membayangkan misalnya dengan mengkombinasikan berbagai sumber big data, sasaran penerima bantuan sosial cukup mudah ditentukan tanpa melakukan pengumpulan data di lapangan. Ketiga, secara internal BPS perlu mendorong dilakukannya pengkajian metode-metode statistik yang memanfaatkan big data untuk official statistics secara berkesinambungan. Kita terhenyak ketika terjadi pembatasan sosial yang memaksa kita mengumpulkan data tanpa tatap muka, kita belum benar-benar siap dengan metode statistik apa yang akan kita gunakan untuk menggantikan pengumpulan data dengan tatap muka agar statistik resmi dapat tetap dirilis tepat waktu. Tepat sekali apa yang ditulis oleh Radermacher (2019) dalam bukunya Official Statistics 4.0, “the future is smart statistics: statisticians should continue to invest in methods, algorithms and a business architecture that enhance the quality of data for statistical services tailored to users’ need.”