l Teknologi database cenderung membentuk suatu konfigurasi sistem pengolahan data yang terpusat.
l Secara teoretis database dapat didistribusikan dimana datanya didistribusikan ke berbagai tipe konfigurasi
l Sebelum mendistribusikan database perlu ditentukan lokasi dan mapping antara database akan ditanamkan atau dilaksanakan.
l Jadi data dapat berada dilokasi yang jauh, lalu sistem yang mencarinya.
Konsep Basis Data Terdistribusi
1. Sistem Komputasi Terdistribusi adalah
l sejumlah elemen proses yang terkoneksi melalui jaringan komputer dan saling bekerjasama dalam melakukan suatu tugas
2. Basis Data Terdistribusi adalah
l kumpulan basis-basis data yang saling berhubungan secara logika dan tersebar pada sebuah jaringan komputer
3. Sistem Manajemen Basis Data adalah
l sebuah sistem software yang mengelola basis data terdistribusi
Distributed Processing (Distributed Computing)
1. Apa itu Distributed Processing (Distributed Computing)?
2. Beberapa sinonim dari Distributed Processing:
l Distributed Function: Distribusi fungsi (CPU atau I/O) meskipun dalam sistem single-processor komputer.
l Distributed Computing System: Interkoneksi sejumlah elemen-elemen pengolahan (computing device yang dapat mengeksekusi program di masing-masing) dalam suatu jaringan komputer dan bekerjasama dalam menjalankan suatu tugas.
l Network
l Multiprocessors
l Timeshared systems
3. Apa yang didistribusikan?
l Processing logic, seperti definisi dari Distributed Computing System diatas.
l Functions, pendelegasian ke bermacam-macam hardware/software (tergantung fungsi komputer)
l Data, pendistribusian data ke sejumlah site pengolahan.
l Control, kontrol eksekusi sejumlah task secara terdistribusi.
DEFINISI
Basis Data Terdistribusi adalah kumpulan data logic yang saling berhubungan secara fisik terdistribusi dalam jaringan komputer, yang tidak tergantung dari program aplikasi sekarang maupun masa yang akan datang.
File merupakan kumpulan data yang dirancang untuk suatu aplikasi atau sekumpulan aplikasi yang dekat hubungannya.
1. Distribusi data yang terpisah secara fisik akan menimbulkan masalah yang tidak dijumpai ketika database ada di komputer yang sama.
à Inilah yang membedakan antara DDBS dengan Multiprocessor.
2. DDBS bukan merupakan sistem dimana meskipun ada jaringan komputer, tapi databasenya hanya terletak disatu node dari jaringan tsb.
Jaringan Komputer atau Kolesi File, tidak cukup untuk membentuk DDBS!!!.
Contoh Basis Data Terdistribusi
l Misalnya sebuah bank yang memiliki banyak cabang, bahkan di sebuah kota bisa terdiri dari beberapa cabang/kantor.
l Masing-masing lokasi memiliki jaringan lokal sendiri, dan semua jaringan lokal itu dihubungkan satu sama lain membentuk sebuah jaringan nasional.
Struktur Basis Data Terdistribusi
1. Sebuah sistem basis data terdistribusi hanya mungkin dibangun dalam sebuah sistem jaringan komputer.
2. Topologi Jaringan
a. Topologi Bintang (star)
b. Topologi Cincin (ring)
c. Topologi Bus
3. Perbedaan utama di antara berbagai topologi di atas terletak pada:
a. Biaya Instalasi
Biaya dalam membangun hubungan link antar simpul.
b. Biaya Komunikasi
Waktu dan biaya dalam pengoperasian sistem berupa pengiriman data dari satu simpul ke simpula lain
c. Kehandalan
Frekuensi/tingkat kegagalan komunikasi yang terjadi.
d. Ketersediaan
Tingkat kesiapan data yang dapat diakses sebagai antisipasi kegagalan komunikasi.
Jenis Transaksi
l Transaksi Lokal
Transaksi yang mengakses data pada suatu simpul (mesin/server) yang sama dengan simpul dari mana transaksi tersebut dijalankan.
l Transaksi Global.
Transaksi yang membutuhkan pengaksesan data di simpul yang berbeda dengan simpul dimana transaksi tersebut dijalankan, atau transaksi dari sebuah simpul yang membutuhkan pengaksesan data ke sejumlah simpul lainnya
Ciri Ciri Basis Data Terdistribusi
l Data disimpan di sejumlah tempat
l Prosessor pada tempat yang berbeda tersebut dihubungkan dengan jaringan komputer
l Sistem basis data terdistribusi bukan terdiri dari sekumpulan file yang berada pada berbagai tempat tetapi pada sebuah basis data di berbagai tempat
l Setiap tempat secara mandiri memproses permintaan user yang membutuhkan akses ke data di tempat tersebut dan juga mampu untuk memproses data yang tersimpan di tempat lain.
Teknologi DDBS (Distributed Database System)
1. merupakan gabungan dari dua pendekatan pengolahan data yang sama sekali berlawanan :
l Database System, dan
l Teknologi Jaringan Komputer.
2. Tujuan utama Database System
l Mengintegrasikan data dan sentralisasi, sehingga akses (deskripsi, manipulasi dan kontrol) terhadap data sangat terkontrol
à Integration, not Centralization
3. Tujuan utama Jaringan Komputer
l Membuat mode kerja yang benar-benar menghindari terjadinya sentralisasi beban kerja.
4. Teknologi DDBS mengintegrasikan sistem database yang terdistribusi, untuk menghasilkan suatu teknologi yang powerful dan menjanjikan
à Integration without Centralization
Keuntungan yang diberikan oleh sistem basis data terdistribusi
l Pembagian dan pemakaian data dan kontrol yang tersebar
l Pengelolaan secara transparan data yang terdistribusi
l Mengacu pada struktur organisasi
l Meningkatkan untuk berbagi dan otonomi lokal
l Meningkatkan ketersediaan data
l Meningkatkan performasi kerja
l Memudahkan pengembangan sistem
l Kecepatan query
Kerugian yang diberikan sistem basis data terdistribusi
l Kompleksitas manajemen
l Kontrol integritas lebih sulit
l Biaya pengembangan
l Potensi sumber kesalahan program (bug) yang lebih besar
l Peningkatan waktu proses (overhead)
l Keamanan
l Sulitnya standarisasi
l Menambah kebutuhan penyimpanan
l Lebih sulit dalam mengatur lingkungan data
Struktur dari database terdistribusi
l Sistem database terdistribusi terdiri dari kumpulan tempat, masing-masing memelihara sistem database lokalnya, masing-masing tempat dapat memproses transaksi lokal.
l Beberapa konfigurasi dari sistem database terdistribusi:
l Fully connected Network
l Partially connected Network
l Tree connected Network
l Star network
Fully connected Network
Partially connected Network
Tree connected Network
Star Network
DESAIN BASIS DATA TERDISTRIBUSI
l Ada beberapa pendekatan yang berkaitan dengan penyimpanan data/tabel dalam sebuah sistem basis data terdistribusi, yaitu
1. Replikasi
2. Fragmentasi
3. Replikasi dan Fragmentasi
1. Replikasi
l Sistem memelihara sejumlah salinan/duplikat tabel-tabel data.
l Setiap salinan tersimpan dalam simpul yang berbeda, yang menghasilkan replikasi data
2. Fragmentasi
l Data dalam tabel dipilah dan disebar ke dalam sejumlah fragmen.
l Tiap fragmen disimpan di sejumlah simpul yang berbeda-beda.
l Fragmentasi dapat berbentuk fragmentasi horizontal (pemilahan record data) atau fragmentasi vertikal pemilahan field/atribut data)
3. Replikasi dan Fragmentasi
l Merupakan kombinasi dari replikasi dan fragmentasi.
l Data/tabel dipilah dalam sejumlah fragmen.
Keuntungan & kerugian :
1. Ketersediaan yang tinggi.
2. Peningkatan Keparalelan (Increased paralelism)
3. Peningkatan beban pengubahan data (Increased overhead on upate)
Fragmentasi Data
l Dapat diterapkan operasi union ataupun operasi natural join.
l Contoh
nasabah = (no_nas, nama_nas, alamat_nas, kota, saldo_simpan, saldo pinjam)
l Fragmentasi Horizontal
nasabah1 = skota=‘Medan’ (nasabah)
nasabah2 = skota=‘Padang’ (nasabah)
Fragmentasi Data – Horizontal
l Akan diperoleh 2 buah fragemen
- Fragmen Nasabah1
- Fragmen Nasabah2
l Terapkan operasi union
nasabah = nasabah1 È nasabah2
l Fragmentasi Vertikal
nasabah1 = pno_nas, nama_nas, alamat, kota (nasabah)
nasabah2 = pno_nas, saldo_simpan (nasabah)
nasabah3 = pno_nas, saldo_pinjam (nasabah)
l Replikasi dan Fragmentasi
Upaya untuk replikasi dan fragmentasi data dapat dilakukan sekaligus pada sebuah tabel, yaitu dengan mereplikasi fragmen-fragmen yang telah terbentuk. Misalnya, dalam sebuah sistem terdistribusi terdapat 5 buah simpul S1, S2, S3, S4 dan S5.
Kita dapat memilah tabel nasabah sesuai dengan kota dimana nasabah mengajukan permohonan menjadi nasabah1, nasabah2 dan nasabah3.
Kemudian dengan pertimbangan tertentu, fr agmen nasabah1 disimpan di simpul S1, S2 dan S3. lalu fragmen nasabah2 disimpan disimpul S3 dan S4 dan fragmen nasabah3 disimpan di simpul S1 dan S3.
PEMROSESAN QUERY DALAM BASIS DATA TERDISTRIBUSI
l Dalam sistem terpusat, kriteria utama untuk mengetahui cost dari sebuah strategi query adalah jumlah/waktu akses ke disk.
l Faktor-fakor yang perlu dipertimbangkan:
1. Biaya/waktu untuk transmisi data
2. Potensi peningkatan karena adanya sejumlah simpul yang dapat melaksanakan query secara paralel.
Transformasi Query
l Jika tabel telah direplikasi atau difragmentasi atau sekaligus direplikasi dan fragmentasi maka kita dapat memenuhi query tersebut dengan memilih salah satu simpul tempat suatu tabel berada kemudian mengeksekusi qury.
l Jika tabel tidak direplikasi atau difragmentasi, pemilihan simpul akan didasarkan pada simpul yang memberikan ongkos transmisi data yang paling rendah.
l Jika tabel difragmentasi dan ditempatkan di berbagai simpul yang berbeda, maka kita harus melakukan operasi Join atau Union untuk merekonstruksi isi seluruh ini disamping tergantung pada query, juga tergantung pada jenis fragmentasi yang diterapkan terhadap tabel yang terlibat dalam query.
l Jika fragmentasi yang dilakukan horizontal maka operasi Union dapat dilakukan.
l Jika fragmentasi vertikal dan query menghendaki penayangan semua atribut maka operasi Natural Join yang harus digunakan.
Contoh :
l Tabel Mahasiswa
l Ekspresi Standar dari query :
skota = ‘Bandung (mahasiswa)
l Jika tabel mahasiswa difragmentasi secara horizontal di dua fragmen (diberi nama mahasiswa1 dan mahasiswa2) sehingga tabel mahasiswa sesungguhnya merupakan hasil operasi Union dari keduanya.
mahasiswa1 È mahasiswa2
l Maka query di atas dapat kita translasi menjadi :
skota=‘Bandung’ (mahasiswa1 È mahasiswa2)
SUmber :zhaki-informatika.blogspot.co.id