Setiap kali kita menggunakan perangkat digital untuk melakukan sesuatu, sejumlah data tercipta dalam berbagai bentuk. Mulai dari, gambar, suara, video, atau sekadar log aktivitas. Data tersebut bisa jadi hanya terekam di perangkat yang kita gunakan atau terkoneksi dengan perangkat lain melalui internet.
Data tersebut kemudian semakin lama bertambah banyak setiap harinya. Pada level tertentu, keberadaan data tersebut masih diperlukan secara langsung untuk keperluan tertentu. Akan tetapi, data yang terkumpul sudah sangat besar ukurannya di titik tertentu sehingga menyulitkan orang untuk mengolahnya secara konvensional. Di sini lah muncul permasalahan yang akhirnya disebut dengan big data.
Secara definisi, big data merupakan sekumpulan data dengan volume yang sangat besar dan bertambah dengan cepat setiap waktu. Big data juga memiliki jenis yang sangat beragam sehingga tidak dapat diolah dengan teknologi pengolahan data konvensional serta memiliki karakteristik tertentu.
Guna memahaminya, ilmuwan komputer memberi karakteristik pada sebuah himpunan data hingga disebut sebagai big data. Sederhananya big data bisa dikenali menggunakan pemahaman 3V, yakni memiliki karakteristik berdasarkan volume, variety, dan velocity.
Volume merujuk pada ukuran data. Volume yang dihasilkan dari big data berukuran super besar dari berbagai sumber dan bertambah setiap saat, contohnya seperti feed media sosial, transaksi perbankan, dan lainnya.
Variety merupakan ragam jenis data meliputi data terstruktur (misal: data berbentuk kolom dan baris pada excel), data semi terstruktur (misalnya JSON, XML) dan data tidak terstruktur (gambar, teks, audio,video).
Velocity merujuk pada seberapa cepat data itu dikumpulkan serta dapat diproses hingga memperoleh hasil yang valid seperti yang terjadi pada pergerakan saham perusahaan, prakiraan cuaca dan lain-lain.
Big data hanya akan berhenti dan menumpuk tidak bermanfaat jika dibiarkan begitu saja. Maka dibutuhkan adanya analisis atau disebut dengan analisis big data. Analisis big data merupakan kegiatan mengumpulkan, memproses, dan memperoleh wawasan dari berbagai kumpulan data bervolume super besar dengan menggunakan metode, alat dan aplikasi tertentu.
Analisis big data menjadi sangat penting karena kita dapat menggali sekaligus memperoleh informasi yang baru, pola, hingga tren yang sedang berkembang guna mengambill keputusan yang lebih baik, meminimalisir hambatan serta menyelesaikan permasalahan dengan lebih cepat.
Lalu bagaimana proses analisis big data tersebut hingga menghasilkan data yang bermanfaat? Langkah pertama diperlukan pengumpulan data; data dari berbagai sumber seperti web, cloud, smartphone dan lainnya dikumpulkan dan disimpan dalam gudang data (repositori). Kemudian langkah selanjutnya adalah pemrosesan data; data yang tersimpan harus melalui proses sortir, verifikasi, dan filter hingga siap digunakan lebih lanjut.
Langkah ketiga, pembersihan data; data perlu dibersihkan dari hal yang tidak valid, tidak lengkap ataupun adanya kesalahan format. Terakhir, analisis; analisis big data dilakukan dengan menggunakan alat dan teknologi seperti kecerdasan buatan (Artificial Intelligence), pembelajaran mesin (machine learning), analisis statistik, dan lainnya yang dapat membantu memprediksi pola dan perilaku dalam data.
Pemanfaatan Big Data di Indonesia
Di Indonesia sendiri pemanfaatan big data sebagai unit analisis sudah berkembang cukup pesat. Diantaranya diterapkan oleh instansi pemerintahan Ditjen Pajak. Instansi ini mengadopsi penggunaan big data untuk optimalisasi penerimaan pajak. Implementasi secara langsungnya dapat dilihat pada pelayanan e-filing; sistem pelaporan kewajiban perpajakan secara daring dan terotomatisasi. Selain itu terdapat aplikasi Compliance Risk Management (CRM) yakni aplikasi pengelolaan risiko kepatuhan Wajib Pajak meliputi proses identifikasi hingga evaluasi.
Ada pula perusahaan Gojek yang juga berhasil dalam pengelolaan big data. Gojek mampu menghadirkan berbagai layanan dalam satu aplikasi, mulai dari ojek hingga pembayaran berbagai tagihan sehingga mempermudah para pengguna.
Netray Media Monitoring yang dibuat oleh PT Atmatech Global Informatika juga memanfaatkan big data sebagai sumber analisis. Netray mampu memantau berbagai macam media seperti media massa daring hingga media sosial seperti X, Instagram, TikTok, YouTube, hingga Facebook. Apabila pembaca berminat mencoba Netray Media Monitoring dapat mengunjungi Netray Trial atau simak hasil analisis kami di blog Analisis Netray.
Editor: Ananditya Paradhi