Karakteristik Big Data
Sebelum melangkah pada System Integrasi, kita perlu mengenal
kerakteristik Big Data. Big Data memiliki 5 karakteristik penting yang harus
dipahami. Berikut karakteristik Big Data:
1. Data Lebih Banyak
Random sampling pada Small Data
sebenarnya adalah alternatif dari mengumpulkan dan menganalisis dataset penuh,
karena keterbatasan teknologi dan kapasitas penyimpanan. Kelemahannya adalah
sampling membutuhkan perencanaan dan eksekusi yang hati-hati serta bekerja
dalam subset membantu perusahaan meadapat apa yang dicari lebih cepat dan murah
tetapi melewatkan pertanyaan yang tidak terpikirkan sebelumnya.
Big Data sebagai meruapakan
keseluruhan informasi, namun ukurannya data sendiri tidak melulu besar.
Contahnya saat terngukapnya kecurangan pertandingan sumo di Jepang. Data yang
digunakan bukan sampel, tapi N=all. Setelah mengumpulkan data 64.000
pertandingan selama 11 tahun terakhir, ternyata data tersebut hanya berukura
sama dengan file foto digital. Dengan prisip N=all diperoleh suatu pola yang
menunjukan baha pesumo yang lebih membutuhkan kemenangan memiliki peluang 25%
lebih besar untuk menang.
2. Berantakan (Messy)
Big data meciptakan dataset yang
lebih berantakan, namun mampu memberikan gamberab yang lebih menyeluruh, meskipun
tidak terstruktur. Contohnya Google Translate, perusahaan yang bermarkas di
Mountain View, California, AS ini mengumpulkan seluruh dokumen dengan
terjemahan yang mereka bisa kumpulkan dengan kualitas yang berbeda-beda. Data
yang dikumpulkan memang berantakan namun terjemahan yang dihasilkan lebih
akurat daripada sistem yang lebih berdasarkan alogaritma, dan jauh lebih kaya
(meliputi 60 bahasa).
3. Korelasi
Big Data sering memprediksi
berdasarkan korelasi, ketimbang hungungan sebeb akibat. Contoh, pada awalnya
Amazon.com mengandalkan review dari suatu tim ahli “The Amazon Voice”. Kemudian
mereka menggunakan rekomendasi yang dihasilkan dari personalisasi penjualan
produk (pelangga yang memberi produk A cenderung membeli produk B maka juka
pelanggan lain membeli produk A, Amazon akan merekomendasikan produk B). Kini
sepertiga penjualan Amazon diperoleh dari penawaran produk ke user dari hasil
rekomendasi berdasarkan personalisasi.
4. Datafikasi
Mendatafikasi suatu fenomena adalah
menyimpannya dalam format yang terkuantifikasi agar bisa ditabulasi dan
dianalisis serta menangkap informasi dan menyimpannya dalam format data yang
memudahkannya untuk digunakan kembali. Memindahkan data ke bentuk digital belum
tentu mendatafikasi.
5. Value
Mengumpulkan data adalah hal yang
krusial namun tidak cukup karena kebanyakan nilai dari data terletak pada
penggunaan, bukan kepemilikan. Dalam era Big Data, seluruh data akan dianggap
berharga, bahkan data paling menda dan sepele. Tidak seperti sumber daya lain,
nilai data tidak berkurang setelah digunakan. Biaya petimpanan digital telah
berkurang setengahnya setiap dua tahun, sementara storage density meningkat 50
juta kali dalam 50 tahun terakhir
0 komentar:
Posting Komentar