Datawarehouse : Mengenal Fact Table

Kali ini kita akan berbicara mengenai fact table, pengukuran dan bagaimana seseorang mengimplementasikan fact table dalam sebuah data warehouse. Kita mulai dengan konsep dari pengukuran. Apa yang diukur? kita mengukur sebuah data. Dalam kasus data warehouse mengacu pada atribut/kolom dalam fact table yang berkorelasi dengan dimension table menggunakan key yang ada.



Misal fact table dengan data sales, memiliki data yang bisa diukur seperti jumlah penjualan, jumlah barang terjual, harga yang diberikan, diskon, pajak yang berpengaruh kepada sebuah penjualan. Dari sini kita bisa belajar bahwa untuk sebuah pengukuran diperlukan data dengan nilai numeric. Karena pengukur harus non-subjective dan sebuah nilai yang tidak bisa didebat. Contoh nilai yang tidak bisa di debat adalah 90 dari 100 tetapi nilai yang bisa di debat adalah sebuah nilai dengan kata "Bagus" karena bagus bagi setiap orang memiliki arti yang berbeda-beda. ada yang akan mengatakan bahwa bagus dimulai dari angka 60 dan ada orang lain yang mengatakan bahwa bagus dimulai dari angka 90. Sehingga nilai "Bagus" adalah sesuatu yang bisa di debat. Berikutnya ukuran ini bisa ditambahkan atau kita bisa lakukan perhitungan matematika terhadap nilai tersebut. Pendapatan "Bagus" dikurangi  Pengeluaran "Lumayan" menjadi sesuatu yang tidak jelas. Tetapi bila pendapatan 1.000.000 dan pengeluaran 300.000 maka kita bisa tahu dengan pasti total keuntungan yang diperoleh. Meski numeric ada beberapa data yang tidak termasuk numeric seperti no telepon, atau persentase. Meskipun persentase bisa diukur tetapi persentase bisa jadi sesuatu yang non-additive. Lalu juga ada granularity of measure atau ukuran terkecil, di mana fact table harus melihat kepada dimension table. Misal bila penjualan hanya diberi dimensi bulanan maka nilai yang disimpan dalam fact table haruslah nilai bulanan bukan nilai harian.





Sehingga bila dirimgkas maka fact table adalah sebuah table untuk mengukur dengan sifat
  1. Tipe data numeric
  2. bisa dilakukan additive/penambahan 
  3. Tidak semua numeric bersifat additive
  4. Perhatikan ukuran terkecil yang akan digunakan melalui dimension table
Sehingga  kita bisa lihat urutan dalam membangun  fact table dalam data warehouse.
  1. Identifikasi fact yang mau dianalisa.
  2. Identifikasi ukuran yang berelasi dengan fact tersebut
  3. Tentukan dimension yang dibutuhkan untuk analisa
  4. Tambahkan foreign key yang menghubungkan fact table ke dimension table
  5. implementasikan dalam bentuk star schema 
Kemudian akan ada urutan yang harus dilihat dalam menjalankan proses ETL di dalam fact table tersebut seperti yang ada dalam gambar berikut.
Begitulah mengenai fact table yang akan dibangun dalam datawarehouse dan mengisi ke dalam fact table.

Komentar