Apa itu Big Data? Pengenalan, Jenis dan Karakteristik
Seiring bertambahnya pengguna internet di seluruh dunia tidak terkecuali di indonesia menyebabkan data yang dihasilkan oleh penggunaan internet itu pun menjadi semakin besar sehingga munculah istilah Big Data . Lalu apa itu Big Data ? . Sebelum kita mulai berkenalan dengan big data alangkah baiknya jika kita terlebih dahulu mengenal apa itu data.
Apa Itu Data ?
Sekumpulan keterangan atau fakta mentah berupa simbol, angka, kata-kata, atau karakter, yang didapatkan melalui proses pengamatan atau pencarian ke sumber-sumber tertentu yang dapat disimpan dan dikirim dalam bentuk sinyal listrik dan direkam pada media perekam magnetik, optik, atau mekanis.
Apa Itu Big Data ?
Seperti namanya Big data sendiri dapat diartikan sebagai data yang ukuranya sangat besar .Data disini dapat berupa mulai data yang berupa teks, gambar atau foto, video dan lain sebagainya . Big Data adalah merupakan sebuah istilah yang digunakan untuk mendiskripsikan kumpulan data yang sangat besar volumenya yang terus tumbuh dan bertambah banyak secara eksponensial seiring bertambahnya waktu. Big Data ini tidak dapat disimpan dan diproses menggunakan pendekatan tradisional . Karena data tersebut kemungkinan berisi informasi berharga, maka dari itu perlu diproses dalam kurun waktu yang relatif singkat. Jika kita menggunakan pendekatan tradisional, maka akan membutuhkan banyak waktu untuk melakukan tugas tersebut karena terbatasnya kapasitas penyimpanan dan pemrosesan data dikarenakan data yang diproses cukuplah banyak.
Jenis-Jenis Big Data
Ada 3 jenis atau type big data diantaranya seperti berikut ini :
- Structured(Terstruktur)
Setiap data yang dapat disimpan, diakses dan diolah dalam bentuk format tetap disebut sebagai data ‘Structured’. Data yang sudah trestruktur sendiri akan lebih mudah pengolahanya karena formatnya sudah diketahui sebelumnya sehingga data terstruktur ini biasanya dapat langsung digunakan tanpa dilakukan filtering atau pengolahan lebih lanjut. Data yang termasuk ke dalam jenis ini ialah data pada excel atau spreadsheet
- Unstructure(Tidak Terstruktur)
Setiap data dengan bentuk atau struktur yang tidak diketahui diklasifikasikan sebagai data tidak terstruktur. Selain ukurannya yang sangat besar, data yang tidak terstruktur menimbulkan banyak tantangan dalam hal pemrosesannya untuk mendapatkan nilai darinya. Contoh umum dari data tidak terstruktur adalah sumber data heterogen yang berisi kombinasi file teks sederhana, gambar, video, dll. Sekarang banyak perusahaan yang memiliki banyak data, tetapi sayangnya, mereka tidak tahu bagaimana cara mendapatkan nilai darinya karena data ini dalam bentuk mentah atau format tidak terstruktur. Contoh data yang tidak terstruktur adalah output dari mesin pencari seperti google dll.
- Semi-structured(Semi Terstruktur)
Data semi terstruktur dapat berisi kedua bentuk data tersebut yaitu terstruktur dan tidak terstruktur.Jenis data ini merujuk pada data yang belum diklasifikasikan di bawah repository tertentu tetapi mengandung informasi penting yang memisahkan elemen individu dalam data. Contoh yang termasuk ke dalam jenis data ini ialah, data dalam bentuk file xml, file json, dan file csv.
Karakteristik Big Data
Big data memiliki enam karakteristik atau atribut.
- Volume berarti data bisa dikategorikan ke dalam big data jika memiliki ukuran yang besar atau dimungkinkan bisa sangat cepat membesar sehingga membutuhkan disk space yang sangat besar pula.
- Variety berarti data bisa disebut sebagai big data jika memiliki karakteristik yang bermacam-macam dan tidak homogen, tetapi memiliki banyak sekali variabel dan sangat beragam meliputi berbagai jenis data baik data yang telah terstruktur dalam suatu database maupun data yang tidak terorganisir dalam suatu database.
- Velocity berarti big data memiliki karakteristik cepat sekali berubah baik dari sisi variabel maupun tipe data. Dengan karakteristik ini, perlu sentuhan khusus dalam mengolah big data.
- Veracity berarti big data memiliki kerentanan dari sisi keakuratan dan kevaliditasan sehingga memerlukan kedalaman untuk menganalisis big data agar bisa menghasilkan keputusan yang tepat.
- Value yang berarti big data memiliki nilai yang sangat tinggi apabila diolah dengan cara yang tepat guna .Value ini adalah vektor terpenting dalam hal big data, tetapi tidak terlalu terkait dengan data besar, dan itu juga berlaku untuk data kecil. .
- Variability adalah faktor big data ini berasal dari kurangnya konsistensi atau pola tetap dalam data. Ini berbeda dari variasi. Pertimbangkan hal yang sama untuk data; jika arti dan pengertian data terus berubah, itu akan berdampak besar pada analisis dan upaya Anda mengidentifikasi pola.
Sekian Penjelasan singkat saya mengenai pengertian big data . Jangan lupa baca artikel saya yang lain mengenai Cara Web Scraping Shopee dengan Python