Data Science, Big Data dan Data Analyst

Di era teknologi dan disrupsi digital ini data menjadi hal penting, dengan bagaimana pengumpul data bisa melakukan apapun hingga mengendalikan pemilik data, Facebook dan Google sebagai pemilik data terbesar di dunia dapat melakukan apapun yang dilakukan pengguna, mereka bisa mengarahkan dan membuat pilihan bagi para pengguna.

Pertumbuhan data dalam 15 tahun terakhir memang berubah sangat cepat, selaras dengan perkembangan pengguna internet yang tumbuh cepat, serta volume lalu lintas data yang melampau seluruh data sepanjang manusia, diperkirakan pada tahun 2025 menurut laporan IDC dengan tajuk Data Age 2025 memprediksi 163 zettabytes (ZB). Zettabyte sendiri merupakan penyebutan untuk satuan data yang berjumlah satu miliar terabyte atau 1000 pangkat 7 atau 10 pangkat 21. Satu Zettabytes setara dengan 1 triliun gigabyte (GB) atau bila satu film high definition (HD) berdurasi 2 jam berukuran 1,5 GB makan 1 zettabyte itu setara dengan 152 juta tahun film HD.

Terkait pertumbuhan data tersebut, ada istilah terkait dengan perkembangan data tersebut yaitu data science, big data dan data analytics sebenarnya apa sih perbedaannya

Data Science adalah bidang dengan kemampuan mengambil, memahami, memproses dan menyaring nilai dari suatu data serta memvisualisasikannya, kemampuan yang berurusan dengan segala hal yang berhubungan dengan pembersihan data, persiapan data dan analisisnya, kegiatan yang berkaitan dengan data yang acak (unstructured) dan data yang siap diolah (structured). Data science merupakan ilmu yang menggabungkan sebuah kemahiran di bidang ilmu tertentu dengan keahlian pemrograman, matematika dan statistik, kemahiran yang berkaitan dengan algoritma machine learning yang mengolah teks, gambar, video, audio dan lain - lain untuk menghasilkan kecerdasan buatan. Hasilnya yang dapat dimanfaatkan oleh analis dan pengguna untuk merancang strategi yang tepat dalam menyelesaikan suatu masalah atau mencapai sebuah tujuan. Data science menjadi penting karena jika suatu organisasi tidak mampu mengolah data, organisasi tidak akan memiliki pedoman untuk strategi operasi yang efektif dan efisien.

Big Data adalah tentu saja adalah data yang berukuran sangat besar tetapi besar disini pengertiannya bukan saja berbicara volume tetapi juga cepat dan kompleks sehingga sulit atau tidak mungkin untuk diproses menggunakan metode tradisional. Perkembangan big data ini salah satunya dipengaruhi oleh meningkatnya perkembangan teknologi yang semakin canggih sehingga menghasilkan begitu banyak data yaitu dapat diklasifikasikan sebagai data structured, semi structured dan unstructured. Structured data adalah data yang tertulis dengan format yang spesifik dan terorganisir sehingga mudah untuk diolah dan dianalisa secara efektif, sementara unstructured data adalah data dalam bentuk yang tidak dikenal membutuhkan proses lebih lanjut untuk diolah dan dianalisis untuk mendapatkan nilai kemudian semi stuctured merupakan data yang tidak sekompleks i unstructured data, data semistructured bisa diolah dan analisa dengan bantuan tagging metadata yang dapat menangkap informasi berguna yang bersangkutan dengan tag tersebut.

Terakhir, istilah data analytic adalah suatu ilmu yang memeriksa data mentah untuk menyimpulkan informasi yang diproses dengan melibatkan penerapan proses algoritma dalam memperoleh gambaran misalnya dalam memproses beberapa dataset untuk mencari korelasi antara satu sama lain. Dapat dikatakan Data Science, Big Data dan Data Analytics merupakan satu kesatuan yang dimulai dengan seleksi data dan berakhir dengan menghasilkan sebuah aksi/keputusan/langkah oleh organisasi dan ketiganya menggunakan data sebagai dasar dalam melakukan tindakan.