Data Warehouse dan Data Mining: Snowflake Schema

 


Apa Itu Snowflake Schema?

Snowflake Schema adalah basis informasi multidimensi di pusat distribusi informasi. Basis informasi pola ini memiliki beberapa tabel di dalamnya yang terlihat seperti keadaan kepingan salju atau snowflake. Selanjutnya, namanya disinggung sebagai diagram kepingan salju atau pemetaan kepingan salju. Pola ini dibuat dari tabel realitas atau tabel kebenaran di tengah. Tabel ini terhubung ke berbagai aspek yang juga dirangkai dalam tabel. Tabel ini disebut tabel dimensi atau tabel dimensi. Data atau informasi dalam tabel ini kemudian distandarisasi untuk mengurangi kelebihan atau redundansi informasi yang ada. Garis besar semacam ini benar-benar sesuai untuk menangani informasi dengan koneksi dan tabel yang membingungkan, berbeda dengan diagram bintang.

Meskipun demikian, menurut Educba, konstruksi atau desain komposisi ini tidak jauh berbeda dari cetak biru bintang. Meski demikian, ia bisa memberikan jawaban atas persoalan yang ada dalam konstruksi bintang karena informasi yang belum terstandarisasi.

Berikutnya adalah ilustrasi dari struktur skemanya.


Karakteristik snowflake schema

Diumumkan dari Geeks for Geeks, salah satu atribut mendasar dari garis snowflake adalah ukurannya yang kecil. Selain itu, tidak sulit untuk menambahkan aspek ke skema Anda saat Anda membutuhkannya. Namun, mengingat banyaknya tabel di dalamnya, penyajian kerangka ini secara umum juga akan lebih lambat. Meskipun demikian, setiap tabel aspek dapat memiliki setidaknya dua susunan kualitas yang mencirikan data dalam berbagai butir informasi.

Kelebihan Snowflake Schema

  1. Cocok ke lebih banyak tool
Snowflake schema bisa digunakan dengan lebih banyak OLAP database modeling tools. OLAP database modeling tools adalah tool yang digunakan untuk analisis data dan modeling. Tool ini pada dasarnya dibuat dan didesain untuk memproses skema data tipe snowflake.

     2. Hemat storage

Karena ada proses snowflaking yaitu normalisasi data, pengulangan data yang sama bisa dikurangi. Dengan begitu, besar data yang harus disimpan juga semakin kecil.


Kekurangan Snowflake Schema

Meskipun memiliki banyak keuntungan, skema yang menyerupai kepingan salju ini juga memiliki kekurangan, seperti:

    1. Skema data kompleks
Skema database yang satu ini memiliki kemungkinan menciptakan banyak level kompleksitas saat proses normalisasi atribut dari star schema. Memang, ini akan berujung pada penyimpanan data yang lebih efektif. Namun, performanya bisa menurun akibat join query yang rumit. Akan tetapi, dengan berkembangnya teknologi, snowflake schema menjadi semakin cepat beberapa tahun belakangan ini. Oleh karena itu, skema ini semakin banyak digunakan dari waktu ke waktu.

    2. Proses lebih lambat
Skema ini lebih lambat dalam memproses cube data akibat join query yang kompleks. Dibanding star schema, kecepatannya masih kalah.

    3. Integritas data
Skema jenis ini memiliki integritas data yang lebih rendah. Snowflake schema pada dasarnya menawarkan pengambilan data yang lebih efektif dengan risiko minim setelah update dan memasukkan data baru. Akan tetapi, tidak ada jaminan integritas data seperti struktur database tradisional yang highly–normalized.


Membuat Snowflake menggunakan DB Designer
  • Buka software DB designer kita
  • Disini kita akan membuat beberapa tabel dimensi dan satu tabel fakta
  • Untuk membuat tabel baru, kita cukup pilih tools dengan icon seperti gambar dibawah ini

  • Buat beberapa tabel seperti gambar dibawah ini
  • dimensi_kategori_Moh. Ivan Firmansyah_14519123


  • dimensi_sub_kategori_Moh. Ivan Firmansyah_14519123


  • dimensi_pola_Moh. Ivan Firmansyah_14519123


  • dimensi_produk_Moh. Ivan Firmansyah_14519123


  • dimensi_pelanggan_Moh. Ivan Firmansyah_14519123


  • dimensi_wilayah_Moh. Ivan Firmansyah_14519123


  • dimensi_waktu_Moh. Ivan Firmansyah_14519123


  • dimensi_jenis_kelamin_Moh. Ivan Firmansyah_14519123


  • fakta_penjualan_Moh. Ivan Firmansyah_14519123


  • Hubungkan tabel
  • 1. dimensi_kategori_Moh. Ivan Firmansyah_14519123, dimensi_sub_kategori_Moh. Ivan Firmansyah_14519123, dimensi_pola_Moh. Ivan Firmansyah_14519123, dimensi_produk_Moh. Ivan Firmansyah_14519123 
  • 2. hubungkan tabel fakta dengan 4 tabel dimensi: pelanggan, produk, waktu, dan wilayah
  • 3. hubungkan tabel dimensi pelanggan dengan tabel dimensi jenis kelamin
  • Hubungkan dengan menggunakan 1:n Non-Identifying-Relation. maka tampilannya sebagai berikut:











Note: icon sebelum dan sessudah melakukan hubungan menggunakan 1:n Non-Identifying-Relation
  • Sebelum

  • Sesudah

  • Sebelum


  • Sesudah



























Posting Komentar

0 Komentar

Cari Blog Ini

Text Widget

Pages