BAB
I
PENDAHULUAN
1.1
LATAR BELAKANG
Pada
masa sekarang, Sistem Informasi Manajemen sangat diperlukan dalam dunia bisnis.
Sistem Informasi Manajemen yang baik akan memberikan dampak yang baik pula bagi
suatu perusahaan. Dari tahun ke tahun perkembangan Teknologi pula semakin
canggih. Hal ini berdampak juga pada Informasi-informasi yang di peroleh dalam
Sistem Informasi.
Suatu
bisnis tentunya memerlukan suatu informasi yang dapat menunjang perusahaannya.
Informasi-informasi yang didapatkan akan diproses sedemikian rupa hingga
menjadi suatu keputusan dalam manajemen. Dalam memperoleh Informasi tentunya
dibutuhkan suatu media untuk menampung segala informasi yang didapatkan dari
sumber-sumber terpercaya. Dengan demikian terciptalah Big Data dalam dunia
Teknologi Informasi.
Big
Data sendiri merupakan media penyimpanan data yang menawarkan ruang tak
terbatas, serta kemampuan untuk mengakodasi dan memproses berbagai jenis data
dengan sangat cepat. Jadi kini, banyak perusahaan yang sudah memanfaatkan Big
Data agar dapat menyimpan segala datanya tanpa kendala dan menghindari
hilangnya informasi-informasi yang dimiliki.
1.2
RUMUSAN MASALAH
1. Apa
yang dimaksud dengan Big Data?
2. Apa
saja karakteristik dari Big Data?
3. Bagaimana
penggunaan Big Data dalam Perusahaan?
4. Apa
saja permasalahan dalam Big Data?
1.3
TUJUAN
1. Mengetahui
tentang sejarah Big Data
2. Mengetahui
tentang pengertian Big Data
3. Mengetahui
tentang karakteristik Big Data
4. Mengetahui
tentang penggunaan Big Data dalam Perusahaan
5. Mengetahu
permasalahan dalam Big Data
BAB
II
PEMBAHASAN
2.1
SEJARAH BIG DATA
Sebelum
mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau sejarah
dari hal yang ingin dipelajari tersebut, ada pun tentang topic kali ini penulis
akan memperkenalkan sejarah big data. Berikut urutannya;
1944
- Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa Perpustakana
yang ada di amerika serikat ukurannya meningkat dua kali lipat setiap 16 tahun
1961
- Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan cara
melihat jumlah pertumbuhan jurnal ilmiah dan makalah
1967
- B.A. Marron dan P.A.D. De Maine menerbitkan "Automatic data
compression" dalam Komunikasi dari ACM, yang menyatakan bahwa
"ledakan informasi” tercatat dalam beberapa tahun terakhir membuatnya
penting bahwa persyaratan penyimpanan untuk semua informasi harus dijaga agar
tetap minimum.
1971
- Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan,
"Terlalu banyak informasi. pengurus tampaknya mengukur seorang pria
seimbang dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi."
1975
- Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus
Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide
pertama kali diusulkan dalam makalah 1969)
1980
- I.A. Tjomsland memberikan ceramah berjudul "Where do we go from
here?" Di IEEE keempat Symposium on Mass Storage Systems, dia
mengatakan "Mereka yang terkait dengan perangkat penyimpanan lama
menyadari bahwa Hukum parkinson Pertama dapat diparafrasekan untuk
menggambarkan Industry kami 'Data mengembang untuk mengisi ruang yang
tersedia'.
1981
- Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan
informasi indsutri negara, termasuk mengukur Volume informasi dalam bit.
1983
- Ithiel de Sola Pool menerbitkan "Pelacakan Arus Informasi" di
Science. Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977, ia
menyimpulkan bahwa "kata-kata yang tersedia untuk Amerika (di atas usia
10) melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar
benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada
periode pengamatan, sebagian besar pertumbuhan arus informasi adalah karena
pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah,
media point-to-point yang tumbuh lebih cepat dari penyiaran."
2.2 PENGERTIAN INFORMASI
(R.
Kelly Rainer, 2011) Information, merupakan data yang telah terorganisir agar
dapat memberikan arti dan nilai kepada penerima.Berdasarkan pengertian di atas,
hasil penyusunan dan transformasi data yang dapat memberikan makna baru kepada
data tersebut.
2.3
PENGERTIAN BIG DATA
Big
Data adalah istilah umum untuk segala kumpulan himpunan data dalam jumlah
yang sangat besar dan kompleks sehingga menjadikannya sulit untuk ditangani
atau di proses jika hanya menggunakan manajemen basis data biasa atau aplikasi
pemroses data tradisional.
Big
Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada
untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran
dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan
dengan tujuan bisnis.
Hal
terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data
melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big
Data Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian
web yang mengolah data dengana gregasi yang terdistribusi sangat besar dan
tidak terstruktur.
Contoh
Big Data dapat berupa data yang berukuran hingga petabytes (1,024 terabytes)
atau exabytes (1,024 petabytes), seperti milyaran hingga triliunan catatan
personal seseorang yang semuanya berasal dari sumber berbeda seperti web,
sales, customer service, social media, data mobile dan sebagainya.
Data-data
ini biasanya tidak terstruktur, sering tidak lengkap dan tidak dapat diakses.
Pada saat berhadapan dengan kelompok data yang lebih besar, perusahaan
menghadapi kesulitan membuat, memanipulasi dan mengelola Big Data. Big Data sesungguhnya
masalah dalaman alisis bisnis karena tools dan prosedur standar tidak didesain
untuk mencari dan menganalisa kumpulan data yang massive.
2.4
KARAKTERISTIK BIG DATA
1.
Volume
Seberapa
besar data yang bisa anda olah saat ini? Apakah dengan jumlah data yang anda
miliki anda sudah lebih baik dibanding kompetitor? Data yang ada saat ini
berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data
tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35
zettabyte di tahun 2020 atau bahkan lebih. Bayangkan jika anda membutuhkan
analisis terhadap 1 persen saja dari seluruh data untuk mendapatkan keuntungan
dibandingkan kompetitor anda, apakah teknologi yang anda miliki sekarang mampu
melakukannya?
2.
Variety
Selain
data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah
sensor, dan perangkat pintar , dan juga teknologi social networking yang
menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional
database. Kita tidak akan pernah tahu jika kita tidak menyimpan semua data yang
tidak terstruktur ini seperti halaman web, web log, search index, forum social
media, email, dokumen, data sensor, dll. Data-data seperti inilah yang mungkin
akan memberikan keuntungan jika kita mampu mengolahnya.
3.
Velocity
Seberapa
cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada
dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini kita
lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis
terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan
datangnya data tersebut. Bayangkan jika kita memiliki sistem yang mampu
mendeteksi buronan yang tertangkap kamera cctv, ataumendeteksi dini titik
kritis seorang bayi dari suhu tubuh, tekanan darah, denyut jantung, kecepatan
bernafas bayi tersebut, melakukan sensor terhadap kata kasar atau kata yang
tidak seharusnya diucapkan yang diucapkan pada siaran langsung di tv atau pada
percakapan telepon customer service sebuah perusahaan.
2.5
CONTOH BIG DATA DALAM BERBGAI BIDANG
1. Contoh di
Sektor Swasta
Perusahaan
eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop
klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di
dalam eBay 90PB data warehouse. Amazon.com menangani jutaan operasi back-end
setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak
ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan
pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan
kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB .
Walmart
menangani lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke
database diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte )
data - . Setara dengan 167 kali informasi yang terdapat dalam semua buku di
Perpustakaan Kongres AS.
FICO
Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif
di seluruh dunia .
Volume
data bisnis di seluruh dunia , di semua perusahaan , dua kali lipat setiap 1,2
tahun , menurut perkiraan. Windermere Real Estate menggunakan sinyal GPS anonim
dari hampir 100 juta driver untuk membantu pembeli rumah baru menentukan waktu
berkendara khas mereka ke dan dari tempat kerja di berbagai kali dalam sehari .
2. Contoh
di Bidang Arsitektur
Pada
tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut
MapReduce yang menggunakan arsitektur tersebut . MapReduce framework
menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses
sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di
seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan
disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru
algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce
diadopsi oleh sebuah proyek open source Apache Hadoop bernama
Teknologi
Topological Program Analisis Data DARPA.
3. Contoh
di Bidang Pasar
"
Big Data " telah meningkatkan permintaan spesialis manajemen informasi
dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan
Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak
hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 ,
industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10
persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak
secara keseluruhan .
Negara
maju membuat meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar
langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang
mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di
seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang
memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan
pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar
informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 ,
471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada
tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui
internet akan mencapai 667 exabytes per tahun pada tahun 2013.
2.6
PENGGUNAAN BIG DATA DALAM PERUSAHAAN
·
IT logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang
sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem,
mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti
kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti
yang dapat digunakan sebagai solusi masalah sistem.
·
Fraud Detection Pattern
Banyak
digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung
·
The Social Media Pattern
Pengunaan
Big data untuk analisa media social dan sentiment pelangan, memberikan
kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas,
mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen
terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap
pemasaran yang dilakukan.
·
The Call centere Mantra
Penyimpanan
hasil perbincangan atau laporan customer dalam bentuk text yang kemudian
digunakan sebagai data untuk analisa masalah yang dihadapai customer,
memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat
maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan
unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan
ketidakpuasaan.
·
Risk: Patterns for Modeling and Management
Memberikan
kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan
menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya
secara tepat dan langsung
·
Big data and The Energy Sector
Memberikan
kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk
memisahkannya dari signal.
2.7
PERMASALAHAN MENGENAI BIG DATA
1. Bukan
Hanya Masalah Ukuran, Tapi Lebih pada Ragam
Kini
jelas bahwa Big Data bukan hanya masalah ukuran yang besar, terlebih
yang menjadi ciri khasnya adalah jenis datanya yang sangat beragam dan laju
pertumbuhan maupun frekwensi perubahannya yang tinggi. Dalam hal ragam
data, Big Data tidak hanya terdiri dari data berstruktur seperti
halnya data angka-angka maupun deretan huruf-huruf yang berasal dari sistem
database mendasar seperti halnya sistem database keuangan, tetapi juga terdiri
atas data multimedia seperti data teks, data suara dan video yang dikenal
dengan istilah data tak berstruktur. Terlebih lagi, Big Data juga
mencakup data setengah berstruktur seperti halnya data e-mail maupun XML.
Dalam
hal kecepatan pertumbuhan maupun frekwensi perubahannya, Big
Data mencakup data-data yang berasal dari berbagai jenis sensor,
mesin-mesin, maupun data log komunikasi yang terus menerus mengalir. Bahkan,
juga mencakup data-data yang tak hanya data yang berada di internal perusahaan,
tetapi juga data-data di luar perusahaan seperti data-data di Internet. Begitu
beragamnya jenis data yang dicakup dalam Big Data inilah yang kiranya
dapat dijadikan patokan untuk membedakan Big Data dengan sistem
manajemen data pada umumnya.
2. Fokus
pada Trend per-Individu, Kecepatan Lebih Utama daripada Ketepatan
Hingga
saat ini, pendayagunaan Big Data didominasi oleh
perusahaan-perusahaan jasa berbasis Internet seperti halnya Google dan
Facebook. Data yang mereka berdayakan pun bukanlah data-data internal
perusahaan seperti halnya data-data penjualan maupun data pelanggan, lebih
menitik beratkan pada pengolahan data-data teks dan gambar yang berada di
Internet. Bila kita melihat gaya pemberdayaan data yang dilakukan oleh
perusahaan-perusahaan pada umumnya, yang dicari adalah trend yang
didapat dari pengolahan data secara keseluruhan. Misalnya, dari data konsumen
akan didapat informasi tentang trendkonsumen dengan memproses data
konsumen secara keseluruhan, bukan memproses data per-konsumen untuk
mendapatkan trend per-konsumen.
Dilain
pihak, perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big
Data justru memfokuskan pemberdayaan data untuk mendapatkan
informasi trendper-konsumen dengan memanfaatkan atribut-atribut yang
melekat pada pribadi tiap konsumen. Sebut saja toko online Amazon yang
memanfaatkan informasi maupun atribut yang melekat pada diri per-konsumen,
untuk memberikan rekomendasi yang sesuai kepada tiap konsumen. Satu lagi,
pemberdayaan data alaBig Data ini dapat dikatakan lebih berfokus pada
kecepatan ketimbang ketepatan.
2.8 ANALISA
SOLUSI BIG DATA
Sejumlah
vendor di pasar saat ini mendukung solusi data yang besar . Berikut ini adalah
daftar beberapa solusi diantaranya adalah :
1. IBM
( www.ibm.com ) mengambil pendekatan perusahaan untuk data yang besar dan
mengintegrasikan seluruh platform termasuk embedding / bundling nya analisis .
Produknya termasuk gudang ( warehouse InfoSphere ) yang memiliki built -in
data-mining sendiri dan cubing kemampuan . ini baru PureData Systems ( kemasan
teknologi analisis canggih ke dalam platform sistem terintegrasi ) mencakup
banyak dikemas analitis integrasi . Produk InfoSphere Streaming Its
terintegrasi dengan Paket perangkat lunak statistik statistik untuk Ilmu Sosial
( SPSS ) untuk mendukung real-time analisis prediktif , termasuk kemampuan
untuk dinamis memperbarui model berdasarkan data real-time . Hal ini bundling
terbatas penggunaan lisensi Cognos Business Intelligence dengan data kunci
besar yang kemampuan platform ( kelas enterprise Hadoop , komputasi aliran ,
dan solusi gudang ) .
2. SAS
( www.sas.com ) memberikan beberapa pendekatan untuk menganalisis data
besar via infrastrukturnya analisis kinerja tinggi dan yang statistic software
. SAS menyediakan beberapa pilihan pemrosesan terdistribusi . ini termasuk
dalam database analytics , in- memory analytics , dan komputasi grid .
Penyebaran bisa di tempat atau di awan .
3. Tableau
( www.tableausoftware.com ) , sebuah business analytics dan data
perusahaan perangkat lunak visualisasi , menawarkan kemampuan visualisasi untuk
berjalan di atas peralatan dan infrastruktur lain yang ditawarkan oleh
berbagai besar mitra data, termasuk Cirro , EMC Greenplum , Karmasphere ,
Teradata / Aster, HP Vertica , Hortonworks , ParAccel , IBM Netezza , dan
sejumlah lain .
4. Oracle
( www.oracle.com ) menawarkan berbagai alat untuk melengkapi yang besar
platform data disebut Oracle Exadata . Ini termasuk analisis canggih melalui
bahasa pemrograman R , serta database in- memory pilihan dengan Oracle
Exalytics di memori mesin dan data Oracle gudang . Exadata terintegrasi dengan
platform perangkat keras nya .
5. Pentaho
( www.pentaho.com ) menyediakan analisis bisnis open source melalui edisi
komunitas dan perusahaan. Pentaho mendukung terkemuka Distribusi Hadoop - based
dan mendukung kemampuan asli, seperti NFS kinerja tinggi sistem file mountable
MapR itu .
BAB
III
PENUTUP
3.1
KESIMPULAN
Big
Data adalah kemampuan untuk mengelola data dengan volume besar
yang berbeda dengan kecepatan yang tepat, dan dalam dalam kerangka waktu yang
tepat memungkinkan analisis dan reaksi secara langsung. bukan hanya tentang
data yang berukuran raksasa. Big Data juga dapat didefinisikan
sebagai data berukuran raksasa yang volumenya terus bertambah, terdiri dari
berbagai jenis atau varietas data, terbentuk secara terus menerus dengan
kecepatan tertentu dan harus diproses dengan kecepatan tertentu pula.
sekali perusahaan yang memiliki kumpulan data
yang menumpuk, karena terlalu banyaknya data tersebut, terkadang perusahaan
tidak mengetahui tindakan apa yang harusnya dapat dilakukan terhadap kumpulan
data tersebut.
Sebuah
informasi atau data dapat disebut sebagai Big Data apabila memiliki 1
(satu) dari 3 (tiga) karakteristik yang terdiri dari Volume (jumlah
data yang dapat diolah oleh sebuah perusahaan), Variety (variasi data
yang dapat diolah dan dianalisis lebih lanjut oleh perusahaan),
dan Velocity (kecepatan sebuah perusahaan di dalam melakukan
pemrosesan data).
Banyak
perusahaan yang menganggap Big Data adalah kumpulan data dalam ukuran
besar padahal Big Data bukan hanya sekedar ukuran, namun juga
terdapat keragaman di dalamnya. Hal inilah yang membedakan Big
Data dengan sistem manajemen data lainnya.
DAFTAR
PUSAKA
http://learnmine.blogspot.co.id/2015/02/pengertian-tentang-big-data.html
https://www.it-jurnal.com/pengertian-big-data/
http://adhityaibarda.blogspot.co.id/2014/03/big-data.html
Tidak ada komentar:
Posting Komentar