DATA adalah suatu pernyataan atau fakta yang merepresentasikan hasil dari suatu pengamatan baik dalam bentuk text, image, audio, video dan data dengan bentuk lainya sebelum diolah menjadi sebuah informasi yang bermanfaat bagi manusia.
Perkembangan teknologi yang pesat membuat kecepatan pertumbuhan data semakin masif. Menurut Lembaga Ilmu Pengetahuan Indonesia atau LIPI pada tahun 2012, manusia menghasilkan data rata-rata sebanyak 6,5 Exabyte setiap harinya, jumlah tersebut setara dengan 6,5 Milyar Gigabyte atau setara dengan 1.382.978.724 buah keping DVD berkapasitas 4,7Gb tiap kepingnya.
Bahkan pada tahun 2020 jumlah rata-rata data yang dihasilkan per-harinya diperkirakan akan meningkat menjadi 119 Exabyte. Jumlah tersebut setara dengan 119 Milyar Gigabyte atau setara dengan 25.319.148.937 buah keping DVD. Jika satu keping DVD memiliki ketebalan 4mm maka kita dapat menumpuk kepingan tersebut setinggi 101.276 Km.
Menurut Wikipedia, jumlah pengguna akun gmail pada tahun 2018 mencapai kira-kira 1,5 Milyar orang. Jika diasumsikan seluruh pengguna akun gmail itu menggunakan layanan versi gratisnya (gmail free memiliki kapasitas maksimum 15 GB ), maka setidaknya google harus menyiapkan datacentre dengan kapasitas setidaknya kira-kira 20 Exabyte. Itu berarti, kapasitas datacenter google untuk gmail free pada tahun 2018 hanya 16,896 dibandingkan dengan jumlah data harian yang dihasilkan tahun 2020. Bisa kita bayangkan berapa jumlah data yang dihasilkan pada tahun 2025 nanti atau pada tahun tahun selanjutnya.
DARIMANA DATA – DATA TERSEBUT BERASAL ?
Data – data tersebut dihasilkan oleh berbagai macam sumber, seperti penggunaan smartphone, Internet of Things (IOT), menjelajah halaman website, menggunakan mesin ATM, melakukan transaksi lewat e-banking, email, social media, youtube, riwayat sekolah, riwayat pendidikan, riwayat kesehatan dan masih banyak lagi. Kelahiran teknologi internet sejak tahun 1993 telah mempercepat proses pembuatan, pengolahan, penyimpanan serta penyediaan data secara dramatis.
SEKILAS TENTANG JENIS – JENIS DATA
Terdapat 3 jenis data berdasarkan strukturalnya yaitu :
APA ITU BIG DATA ?
Seluruh data tersebut saling terhubung satu sama lain melalui jaringan internet. Kumpulan data-data ini biasa disebut sebagai Big Data. Definisi dasar dari big data adalah kumpulan atau himpunan data yang bervariasi dalam jumlah yang sangat besar dan tidak mampu diolah oleh sistem komputer atau perangkat konvensional biasa.
Saat ini, big data banyak digunakan dalam berbagai bidang ilmu. Kebanyakan big data digunakan dalam melakukan proyeksi bisnis untuk mengambil keputusan di masa yang akan datang, lalu big data digunakan dalam bidang peramalan cuaca, bidang sains dan lainya.
Big Data memiliki banyak karakteristik, tapi yang menjadikannya big data adalah 3 karakteristik dasar atau biasa disebut sebagai 3V yakni :
(1) VOLUME
Ukuran dan jumlah data yang dihasilkan sangat banyak dan besar
(2) VELOCITY
Aktivitas proses, input dan output data berkecepatan tinggi
(3) VARIETY
Memiliki jenis data yang sangat bervariasi dan beraneka ragam
Namun, menurut para ahli dan praktisi bidang teknologi dan informatika saat ini big data sendiri memiliki 8 karakteristik lainya yaitu Kebenaran, Lengkap, Berbutir halus dan leksikal unik, Relasional, Ekstensional, Skalabilitas, Nilai, Variabilitas.
Big Data adalah : Seluruh data tersebut saling terhubung satu sama lain melalui jaringan internet. Kumpulan data-data ini biasa disebut sebagai Big Data. Definisi dasar dari big data adalah kumpulan atau himpunan data yang bervariasi dalam jumlah yang sangat besar dan tidak mampu diolah oleh sistem komputer atau perangkat konvensional biasa.
PENERAPAN BIG DATA
Banyak bidang keilmuan yang telah menerapkan konsep Big Data untuk berbagai keperluan. Contohnya : bisnis, cuaca, sains, kesehatan, medis, geologi, astronomi dan industri.
Misalnya pada bidang kesehatan, Big Data dapat digunakan untuk membuat prediksi perkiraan penyakit yang akan muncul pada bulan berikutnya.
Pada E-Commerce, salah satu kegunaan Big Data adalah memprediksi penjualan barang yang akan atau sedang trend saat ini. Konsep Big Data juga telah diterapkan pada bidang scientific untuk mencari anti partikel pada partikel akselerator Large Hadron Collider (CERN) dan masih banyak lagi.
Selain bidang ilmu yang telah disebutkan, sebenarnya masih banyak lagi yang menganalisa serta memanfaatkan big data untuk tujuan tertentu. Big data saja sebenarnya tidak berguna, hanya saja dengan dipadukan dengan proses data analisis, big data menjadi sangat penting karena bertindak sebagai sumber atau resource yang cukup untuk membuat sebuah model dalam memprediksikan sesuatu.
Semakin banyak data atau sample yang tersedia jika ditunjang dengan infrastruktur dan metode yang baik hal itu jelas berpengaruh pada ketepatan prediksi.
Data-data itu dihasilkan oleh berbagai macam sumber, seperti penggunaan smartphone, internet of thing (IOT ), menjelajahi halaman website, menggunakan mesin ATM, melakukan transaksi melalui e-banking, email, social media dan masih banyak lagi.
Terdapat 3 jenis data berdasarkan strukturalnya yaitu data terstruktur, semi struktuktur dan tidak terstuktur.
Data terstruktur merupakan data yang tersusun rapih dalam bentuk baris dan kolom seperti pada database atau spreadsheet, data ini lebih mudah untuk diambil, dioprasikan dan disimpan kembali sesuai dengan parameter yang kita inginkan.
Data semi terstruktur merupakan suatu data yang di representasikan oleh suatu bahasa pemrograman dimana objeknya dapat di ambil dari berbagai sumber yang berbeda dan disatukan menjadi sebuah bentuk data baru. Contohnya adalah file.xml.
Data tidak terstuktur adalah data yang sulit diolah diklasifikasikan berdasarkan parameter tertentu. Contoh data tidak terstuktur adalah file image, file audio, file video dan lain-lain.
Kita optimis dengan adanya Big Data karena dengan adanya Big Data segala informasi dapat kita peroleh dari sumber manapun, dan tidak menutup kemungkinan bahwa nantinya pekerjaan akan lebih banyak di pakai dan akan banyak membutuhkan data sciencetist yang banyak dan berpengalaman.
PENGERTIAN BIG DATA
Seluruh data tersebut saling terhubung satu sama lain melalui jaringan internet. Kumpulan data- data ini biasa disebut juga Big Data . Definisi dasar Big Data adalah kumpulan atau himpunan data jumlah yang sangat besar dan tidak mampu diolah oleh sistem komputer atau perangkat konvensional.
BIG DATA & REVOLUSI INDUSTRI 4.0
Big Data memiliki 11 karakteristik yang didalamnya terdapat Volume, Variasi, Kecepatan, Kebenaran, Lengkap, Berbutir halus dan leksikal unik, Relasional, Ekstensional, Skalabilitas, Nilai, Variabilitas.
(1) Volume merupakan kuantitas data yang dihasilkan dan disimpan, Ukuran data menentukan nilai dan potensi wawasan.
(2) Variasi adalah jenis data yang membantu seseorang menganlisa secara efektif menggunakan wawasan yang dihasilkan.
(3) Kecepatan dimana data yang dihasilkan dan diproses untuk memenuhi tantangan yang ada di jalur pertumbuhan dan pembangunan.
(4) Kebenaran merupakan definisi yang diperluas untuk data yang besar, yang mengacu pada kualitas data dan nilai data.
(5) Lengkap dimana apakah seluruh sistem yaitu (n = semua ) ditangkap atau tidak.
(6) Berbutir halus adalah setiap data spesifik dari setiap elemen per elemen dikumpulkan dan jika elemen dan karakteristiknya di identifikasi dengan benar.
(7) Relasional adalah data yang dikumpulkan berisi bidang umum yang memungkinkan gabungan, atau meta analisis, dari kumpulan data yang berbeda.
(8) Ekstensional merupakan data baru di setiap elemen data yang dikumpulkan dapat ditambahkan atau diubah dengan mudah.
(9) Skalabilitas merupakan data yang berkembang sangat pesat.
(10) Nilai adalah Utilitas yang dapat di ringkas dari data.
(11) Variabilitas mengacu pada nilainya dalam kaitannya dengan konteks yang dihasilkan.
Banyak bidang keilmuan yang telah menerapkan konsep Big Data untuk berbagai keperluan, misalnya pada bidang kesehatan, Big Data dapat digunakan untuk membuat prediksi perkiraan penyakit yang akan muncul pada bulan berikutnya. Pada E-Commerce, salah satu kegunaan Big Data adalah memprediksi penjualan barang yang sedang trend saat ini.
Volatility pada Big Data terkait dengan penentuan berapa lama data harus disimpan. Sebelum Big Data, organisasi cenderung menyimpan data tanpa batas. Ketika data menjadi sangat besar, hal ini akan menjadi masalah, karena tidak semua data yang harus disimpan dan diperlukan dalam melakukan analisis.
Pada jenis data tertentu, data dapat langsung diolah dan hanya disimpan bagian yang penting saja untuk analisis selanjutnya. Data yang lain dapat ditentukan untuk disimpan selama periode tertentu dan setelah itu dibuang. Sehingga perlu ada kebijakan arsip data.
Visualization karakteristik lain dari big data adalah betapa sulitnya memvisualisasikan alat visualisasi big data untuk saat ini dalam menghadapi tantangan teknis karena keterbatasan teknologi dalam memori dan skalabilitas, fungsionalitas, dan waktu respons yang buruk. Value merupakan kualitas data yang disimpan dan penggunaan lebih lanjut.
IMPLEMENTASI BIG DATA
(1) Impelementasi Big Data Dalam Bidang Kesehatan. Menggunakan teknologi Hadoop untuk pemantauan kondisi vital pasien, karena di beberapa rumah sakit di seluruh dunia telah menggunakan teknologi Hadoop untuk membantu staffnya bekerja secara efisien, tanpa Hadoop sebagian besar sistem layanan kesehatan hampir tidak mungkin menganalisis data yang tidak terstruktur.
(2) Implementasi Big Data Dalam Bidang Pendidikan. Kalau dulu siswa belajar menggunakan satu sumber yaitu buku, sekarang dengan adanya big data pembelajaran bisa menggunakan data atau sumber dari internet, selain data yang lebih detail penerapan teknologi big data ini juga bisa menentukan pembelajaran apa yang cocok buat siswa dengan mengumpulkan data masing — masing siswa.
Tantangan Big Data bukan hanya mencangkup heterogenitas dan ketidaklengkapan skala data, melainkan masalah SDM dan alat yang kurang memadai. Karena di indonesia banyak membutuhkan data scientist oleh karena itu ini menjadi tantangan yang sangat komplek bagi perkembangan big data saat ini.
Big Data juga memiliki sejumlah resiko yaitu Data Security, Data Privacy, Costs, Bad Analytics, Bad Data, Rules and Regulations.
(1) Volume merupakan sejumlah besar data yang berpacu pada kualitas data yang dikerjakan dan di jabarkan untuk mendapatkan hasil yang di inginkan.
(2) Velocity adalah kecepatan data yang dibentuk secara real-time.
(3) Variety merupakan karakteristik data yang di simpan, analisis dan digunakan.
(4) Variability dalam konteks big data mengacu pada beberapa hal yang berbeda. Salah satunya adalah jumlah tidak konsisten dalam data. Ini perlu ditemukan dengan metode deteksi anomali dan pencilan agar analitik yang bermakna dapat terjadi.
(5) Veracity adalah karakteristik dalam big data yang menyatakan seberapa akurat data yang dikumpulkan.
(6) Validity adalah seberapa tepat/sesuai data yang digunakan untuk kebutuhan analisis tertentu berdasarkan data tersebut Validity mirip dengan kebenaran, validitas merujuk pada seberapa akurat dan benar data untuk penggunaan yang di maksudkan.
(7) Vulnerability Big Data membawa masalah keamanan baru. Apapun pelanggaran datanya dengan data yang besar adalah pelanggaran.
Referensi :
Sumber Asli : Buletin APTIKOM edisi Maret 2020. Silahkan Download disini