Archive for Maret 2017
BIG DATA - Tugas Teknologi Informasi & Multimedia
By : UnknownNama : Rizky Budhi Setiawan
Kelas : 4IC01
NPM : 27413962
Kelas : 4IC01
NPM : 27413962
BAB I
PENDAHULUAN
A.
LATAR BELAKANG MASALAH
Beberapa tahun belakangan ini, jika ditanyakan tentang apa yang sedang
menjadi trend dalam dunia Teknologi Informasi (TI), mungkin
banyak yang akan menjawab "Cloud Computing". Tetapi, sejak
awal tahun 2011 muncul istilah "Big Data" yang kemudian
menarik perhatian banyak profesional maupun pemerhati Teknologi Informasi.
Sejauh ini, perusahaan-perusahaan terkemuka telah memberdayakan infomasi dan
data dengan beragam teknologi manajemen data guna menunjang kemajuan bisnisnya.
Sebagian besar telah menggunakan tools seperti Data
Warehouse (DWH) maupun Business Intelligence (BI) serta
aplikasi manajemen harga dan penjualan lainnya sebagai alat pengolah data yang
mereka perlukan dalam aktifitas bisnis.
Sudah
banyak sekali kejadian yang merugikan perusahaan karena tidak memanfaatkan
infromasi yang ada atau bahkan membuang informasi yang didapat, hal seperti itu
sangat merugikan perusahaan karena tidak dapat memaksimalkan fungsi dari
informasi yang ada untuk mempermudah proses pengambilan keputusan, perencanan
strategis, dan perencanaan operasional. Hal seperti ini harus dapat dicegah
dengan penanganan yang baik serta perhatian yang ekstra agar informasi tersebut
dapat berguna maksimal bagi perusahaan.
Saat
ini sudah banyak perusahaan yang menyadari pentingnya pengelolaan data dengan
cara memanfaatkan big data, big data sendiri adalah “media penyimpanan data
yang menawarkan ruang tak terbatas, serta kemampuan untuk mengakodasi dan
memproses berbagai jenis data dengan sangat cepat”, hal ini jelas sangat
membantu perusahaan dalam mengelola informasi yang dimiliki perusahaan
B. RUMUSAN MASALAH
1. Pengertian big data
2. Konsep big data
3. Manfaat dan sumber big data
4. Contoh manfaat big data
C. TUJUAN MASALAH
1. Untuk mengetahui pengertian big data
2. Untuk mengetahui konsep big data
3. Untuk mengetahui manfaat dan sumber big data
4. Untuk mengetahui contoh
manfaat big data
BAB II
PEMBAHASAN
A. PENGERTIAN BIG DATA
Big Data adalah data dengan ciri berukuran sangat
besar, sangat variatif, sangat cepat pertumbuhannya dan mungkin tidak
terstruktur yang perlu diolah khusus dengan teknologi inovatif sehingga
mendapatkan informasi yang mendalam dan dapat membantu pengambilan keputusan
yang lebih baik." Keempat karakterik
tersebut: berukuran sangat besar (high-volume), atau sangat bervariasi (high-variety),
atau kecepatan pertumbuhan tinggi (high-velocity), dan sangat tidak
jelas (high veracity) sering disebut dengan 4V's of Big Data.
Teknologi Big Data diciptakan untuk
menangani keempat ciri di atas. Jadi jika data Anda memiliki satu ciri saja
atau beberapa kombinasi ciri di atas, tentunya dapat memanfaatkan teknologi Big
Data yang tersedia di pasaran.
Mahadata, lebih dikenal dengan istilah bahasa Inggris big data, adalah istilah umum untuk segala himpunan data (data set) dalam jumlah yang sangat besar, rumit dan tak
terstruktur sehingga menjadikannya sukar ditangani apabila hanya menggunakan
perkakas manajemen basis data biasa atau aplikasi pemroses data tradisional belaka.
Tantangannya meliputi pemerolehan, kurasi, penyimpanan,
penelusuran (search), pembagian, pemindahan, analisis, dan visualisasi data. Tren kian membesarnya himpunan data terjadi akibat bertambahnya informasi
dari himpunan-himpunan besar yang saling terkait, dibandingkan dengan
himpunan-himpunan kecil lain dengan jumlah total data yang sama. Korelasi baru
dapat ditemukan dalam analisis himpunan data guna "mencermati tren bisnis,
menentukan kualitas penelitian, mencegah penyakit, melawan tindak pidana, dan mengetahui kondis lalu lintas jalan raya secara waktu nyata". Banyak yang telah mencoba memberikan definisi terhadap
big data. Dari Wikipedia:
“Big data is a broad term for data sets so large or
complex that traditional data processing applications are inadequate.
Challenges include analysis, capture, data curation, search, sharing, storage,
transfer, visualization, and information privacy.”
Sedangkan definisi big data dari Gartner,
“Big data is high-volume, high-velocity and high-variety information assets
that demand cost-effective, innovative forms of information processing for
enhanced insight and decision making.”
Definisi big data dari Teradata dan Hortonworks kira-kira seperti ini kalau
dalam bahasa Indonesia,
“Big Data adalah gerakan atau inisiatif organisasi-organisasi untuk
mengambil, menyimpan, memroses, dan menganalisa data-data yang sebelumnya tidak
memungkinkan atau tidak ekonomis untuk diambil, disimpan, diproses, dan
dianalisa.”
B. KONSEP BIG
DATA
Di berbagai organisasi, terminologi “data science”,
“big data”, dan “hadoop” seakan sudah menjadi setali tiga uang. Kita akan
jarang mendengar suatu diskusi atau pembicaraan tentang salah satunya tanpa
disertai yang lainnya. Kalau melihat dari trend, data science adalah sebuah
terminologi yang mulai ngetrend di tahun 2013; ketika Hadoop dan big data sudah
menjadi buzzword di berbagai organisasi. Kita bisa melihat hal tersebut dari
google search trend.
Teknologi yang berkembang di dunia big data ada untuk
memecahkan suatu masalah atau mempermudah penyelesaian suatu masalah. Dari
berbagai literatur, terdapat 3 dimensi atau masalah utama yang big data coba
selesaikan. 3 masalah biasa disebut “The 3V of Data”, atau secara singkat
disebut 3V; Volume, Velocity, Variety.
1. Volume
Mari kita bahas
mulai dari volume. Salah satu permasalahan yang big data coba pecahkan adalah
meledaknya volume data yang suatu organisasi ingin simpan atau proses. Salah
satu perusahaan telekomunikasi yang pernah saya tangani butuh menyimpan lebih
dari 1 milyar record data aktivitas browsing internet pengguna. Jangan
kaget, 1 milyar record itu hanya data sehari, dan data yang ingin dikumpulkan
tentunya berbulan-bulan. Apakah permasalahan volume data ini hanya bisa
dipecahkan oleh big data? Jawabannya, tidak juga.Sebenarnya suatu sistem
database atau data warehouse pun bisa menyimpan data yang sangat besar. Namun,
price per terabyte Hadoop, sebagai platform big data, jauh lebih rendah
dibandingkan keduanya. Selain itu, berbeda dengan sekedar network storage,
teknologi big data tidak hanya menyediakan solusi untuk menyimpan data, namun
juga untuk mengolah dan menganalisa data bervolume besar. Lalu, kenapa tidak
semua data dilempar ke big data saja? Kenapa harus masih memakai database atau
data warehouse atau network storage? Saya akan mencoba menjawab dengan analogi
simple: mobil sport bagus untuk berlari kencang di jalanan mulus, truk berguna untuk
mengangkut barang dalam jumlah besar, mobil MPV umumnya hemat bensin, nyaman
dan mampu membawa banyak orang.
Database/ data
warehouse sangat ideal untuk menyimpan data yang dibutuhkan untuk operasional
day-to-day suatu organisasi, atau untuk menghasilkan report bulanan. Namun,
cost per terabyte (biaya penyimpanan) jauh lebih tinggi dibandingkan big data
platform seperti Hadoop. Oleh karena itu, untuk menyimpan data-data yang
belum diketahui nilai bisnisnya dan dalam volume besar, platform berbasis big data
seperti Hadoop memberikan solusi yang lebih masuk akal. Lalu, sebesar apakah
volume data agar bisa disebut big data? Apakah jumlah datanya harus selalu
lebih dari 1 milyar record per hari? Walaupun masih banyak perdebatan soal ini,
sekarang sudah banyak pihak yang sepakat bahwa: jika volume data membuat data
tersebut tidak ekonomis / mungkin lagi untuk disimpan di solusi penyimpanan
data tradisional (network storage / database / data warehouse), maka “Houston,
we’ve got the volume problem!”
2. Velocity
Permasalahan
yang kedua: data velocity atau kecepatan data dibuat. Bisa dibilang,
permasalahan ini berkaitan erat dengan permasalahan volume data, karena
kecepatan data dibuat umumnya berbanding lurus dengan volume data. Data tidak
hanya datang dalam jumlah besar, tetapi juga dalam tempo yang lebih singkat dan
bahkan ada yang real-time.
3. Variety
Variety!
Finally! Ini adalah permasalahan, yang menurut saya, “Big data banget!”.
Mengapa? Menurut saya pribadi, permasalahan ini akan sangat sulit dipecahkan
oleh data platform tradisional, baik itu database atau data warehouse. Variety
adalah permasalahan yang terjadi karena keberagaman data, baik itu dari format
file data yang masuk, maupun format / struktur dari isi data tersebut.
Berbicara
tentang masalah data variety, saya teringat salah satu project di produsen hard
disk server. Perusahaan tersebut telah memproduksi hard disk dari tahun 90-an,
dan apabila telah terpasang di server, hard disk itu akan mengirimkan log
pemakaian blok-blok memori hard disk secara periodik. Data log tadi akan
dianalisa untuk mencari part yang bermasalah dari hard disk (apabila ada
laporan dari customer). Jika diketahui part mana yang bermasalah, perusahaan
tersebut bisa mencari hard disk lain yang menggunakan part yang sama dan dari
batch produksi yang sama. Perusahaan tersebut lalu bisa mengganti hard disk
lainnya sebelum hard disk itu rusak dan customer komplain.
Permasalahannya,
data-data tersebut dikirimkan dalam format yang berbeda-beda. Untuk 1 data yang
sama saja, bisa berbagai macam variasi format atau struktur data. Ada yang
berupa file XML, CSV, TSV, dan bahkan ada yang dikompresi dalam format GZip,
Zip, dan Tar. Karena kasus seperti ini bukan tidak mungkin
terjadi, platform big data memungkinkan kita untuk “store first, define
structure later”. Pada Hadoop, contohnya, kita bisa menaruh file-file tadi
dalam format mentahnya, lalu kita kelompokkan saja file-file yang sejenis. Lalu
ketika kita butuh membaca data, baru kita gunakan tools yang tersedia untuk
mengekstrak sisi data. Hal ini dengan implementasi database atau data warehouse
di mana kita harus menerapkan dan meng-enforce skema/struktur ketika kita
memulai akuisisi data.
C. CONTOH
MANFAAT BIG DATA
Beberapa contoh manfaat big data yang dapat disebutkan
: Perusahaan ritel dapat menggunakan informasi dari social media seperti
Facebook, Twitter, Google+ untuk menganalisis bagaimana perilaku, persepsi
pelanggan terhadap suatu produk atau brand dari perusahan.
1.
Perusahan
manufaktur dapat memantau kondisi peralatan setiap saat (real-time), sehingga
dapat memperkirakan waktu terbaik untuk mengganti peralatan. Karena mengganti
terlalu cepat akan merugikan/buang-buang uang atau kalau terlambat akan
menyebabkan produksi terganggu karena kerusakan peralatan. Perusahaan
manufaktur juga bisa memantau produk yang baru launching melalui social sedia
untuk mengetahui apakah ada isu after-sales sehingga
dapat mencegah kegagalan garansi yang menyebabkan publikasi besar yang dapat
merusak citra produk dan perusahaan.
2.
Perusahaan
periklanan dapat menggunakan informasi dari social media untuk mengetahui
tanggapan terhadap promosi/iklan yang baru diluncurkan.
3.
Rumah sakit
dapat merekam catatan medis pasien sehingga big data tersebut bisa digunakan
untuk menganalisis kecenderungan sakit pasien.
4.
Pemerintahan
dapat menggunakan informasi dari social media untuk mengetahui tingkat kepuasan
masyarakat terhadap pemerintah.
5.
Jasa Keuangan
dapat menggunakan analisis big data untuk melihat aplikasi asuransi yang dapat
segera diproses, dan mana yang perlu divalidasi dengan dilakukan kunjungan oleh
agen asuransi.
6.
Jasa Perbankan
dapat menggunakan rekaman transaksi nasabah untuk mengetahui kemungkinan adanya
kegiatan kejahatan seperti pencucian uang, atau juga untuk merekam catatan
kebiasaan karyawan dalam rangka mendeteksi kemungkinan fraud.
7.
Tim olahraga
dapat menggunakan big data untuk tracking penjualan
tiket, mengetahui kondisi pemain dan probabilitas akan mengalami cedera dan
bahkan strategi bermain dari tim.
BAB III
PENUTUP
A. KESIMPULAN
Berdasar uraian diatas, dapat ditarik kesimpulan bahwa Big Data itu adalah
limpahan data dengan volume dan ragam yang melampaui kapasitas sistem manajemen
data konvensional, yang terbentuk dari meluasnya penggunaan internet maupun
pemanfaatan teknologi informasi yang semakin canggih, dan memiliki tiga ciri
khas : volume, variety, velocity.
DAFTAR PUSTAKA