Model Pemrograman Big Data
Berbagai macam model pemrograman yang digunakan pada Big Data
meliputi penggunaan data intensif, komputasi data streaming, pemrosesan banyak
data, tingkat performansi yang tinggi (throughput), dan pemrosesan data yang berorientasi pada kolom data.
Berikut ini beberapa proses pemrogra- man pada Big data.
1. MapReduce
Merupakan sebuah model pemrograman tingkat tinggi yang memban-
gun sebuah peta dan mengurangi fungsi pengelompokan data yang didistribusikan
dari beberapa node yang ada. Peta yang dibangun berfungsi untuk memfillter dan
mengurutkan data sedangkan fungsi Reduce adalah menggabungkan beberapa hasi
outputan peta untuk menjadi suatu hasil akhir. Beberapa contoh aplikasi yang
menggu- nakan model pemrograman MapReduce adalah Hadoop MapReduce, Apache
Spark, Aneka MapReduce.
2. Thread/Task Data
Intensive Mode
Model pemrograman yang digunakan pada aplikasi tingkat tinggi
den- gan sebuah logika komputasi yang didasarkan pada batas waktu teng- gat
sebuah aplikasi. Model pemrograman ini biasanya digunakan untuk pemrograman suatu
alur kerja, misalnya Aneka.
3. Machine Learning
Tools
Merupakan sebuah pembelajaran pada suatu mesin yang digunakan
un- tuk pengambian sebuah keputusan. Contoh beberapa perangkat yang menggunakan
pemrograman ini adalah Hadoop Mahout.
4. Big Query Language
Merupakan sebuah generasi baru dalam hal pengenalan suatu bahasa.
Model pemrograman ini biasanya melibatkan pencarian data teks. Salah satu
contoh aplikasi dari pemrograman ini adalah pencarian suatu kata berdasarkan
frekuensi kemunculan menggunakan Google Big Query Data Analisis. Selain model
pemrograman, sistem komputasi pada Big Data juga membu- tuhkan mekanisme
penjadwalan. Pada sistem komputasi big data terdapat dua jenis penjadwaan yang
digunakan yaitu Query Schedulling dan Intensif
Data Scheduling. Query
Scheduling merupakan sebuah penjadwaan yang di- dasarkan dengan adanya
permintaan dari beberapa data baru yang masuk. Sedangkan intensif data
merupakan penjadwalan yang didasarkan pada be- saran data yang ada pada
database guna mendapatkan waktu yg lebih efektif dan efisien
0 komentar:
Posting Komentar