Veriambarı ve OLAP Nedir?

Günümüzde bir kurumun operasyonel seviyedeki hizmetlerini sunabilmesi için bilgi sistemleri vazgeçilmez olarak kabul edilmektedir.
Neden? Çünkü bilgi işlem hizmetleri aksadığında kurum çalışamaz hale gelir..!

Peki yöneticilerin karar verme sürecinde bilgi sistemlerinin rolu nedir?
Tahmin edilenden çok daha fazla. Bu konu yavaş yavaş kabul görmekte. Bu kabulu hızlandırmak için Veriambarı ve OLAP kavramlarını incelemeliyiz..

Kurum yöneticilerinin karar faaliyetlerinde doğru ve zamanında bilgi önemlidir. Bu bilgi gerçekte kurumun işleyişi sırasında toplanan verilerde mevcuttur. Karar destek sistemleri, kurum içi ve dışı verilerin, karar verme sürecinde kullanılabilecek bilgiye dönüştürülmesiyle ilgilenir.

Bir kuruma ait veri değişik kaynaklarda bulunabilir. Bunların kolay ulaşım için tek bir havuzda toplanması istenir. Ayrıca kurumun operasyonel işlemlerini gerçekleştirdiği OLTP (OnLine Transaction Processing) sistemler (veritabanları) bilgi toplama üzerine (kayıt ekleme, çıkarma, silme ki bunlar hareket/Transaction olarak bilinir) uzmanlaşmıştır. OLTP sistemlerin karar destek faaliyetlerinde kullanılması performans açısından tavsiye edilmez. OLTP sistemlerden, karar destek faaliyetlerinde kullanılacak verilerin, (denormalizasyon gibi) performans kazandırıcı değişimlerden sonra, bu tek havuza toplanması gerekir. Ek olarak, OLTP sistemlerde, verilerin geçmiş halleri tutulmayabilir. Aslında karar verme açısından verideki değişim, yani verinin tarihsel değişimi de önemlidir. Bunların da bu tek havuzda tutulması gerekecektir. İşte bu gibi nedenlerle oluşturulan bu havuza veri ambarı (data warehouse) diyoruz. Verilerin ilgili kaynaklardan çekilip veri ambarına aktarılması ETL (Extract Transform Load) olarak bilinir. Bu iş için Microsoft DTS (Data Transformation Services) aracı kullanılabilir.

Veri ambarındaki verilerin karar destek faaliyetlerinde kullanılması aşağıdaki şekillerde olabilir.
  • Sorgulama ve raporlama
  • OLAP
  • Veri madenciliği

Bu listede ilginç olanlar OLAP ve veri madenciliğidir.

Veri madenciliği (Data Mining), istatistiksel bazı yöntemlerin yardımıyla veri içinde gizli olan desenlerin ortaya çıkarılması ve bu desenlerin geleceği tahmin etmekte kullanılmasıdır. Hemen bir örnek verelim.. ASKİ'de çalışıyoruz. Şimdiye kadar tespit edilen kaçak su kullanan aboneleri veri madenciliği uygulamasına veriririz. Uygulama bu abone grubundaki gizli bağıntıları/desenleri bulur. Mesela su tüketim eğilimleri, borçlarını geciktirme süreleri vs.. Bundan sonra elimizdeki 1 milyon aboneye bu deseni uygularız ve muhtemel kaçaksu abonelerini buluruz...

OLAP (OnLine Analytical Processing) için üzerinde görüş birliğine varılan ortak özellik çok boyutlu veri analizidir (MultiDimensional analyzing). Çok boyutlu veri analizinde, veri değişik boyutlardan incelenir. Veri ve boyutları birlikte, küp olarak adlandırılır. Mesela satış verisinin, zaman, ürün ve bölge boyutlarından bakılarak değişimleri incelenebilir. Bu boyutlarda istenilen ayrıntı ve özet seviyesine çıkılabilir. Böylece değişimin sebebi daha iyi anlaşılabilir. Burada bir resim, çizim sağlayamıyorum. Ama biraz hayalgücüye bu sorunu aşabiliriz...
Bir OLAP küpü üzerinde şu işlemler yapılabilir:
  • Dice(Çevir) Satış verisinin bölge-zaman yüzünü incelerken, ürün-zaman yüzüne geçebiliriz.
  • Slice(Dilimle): Bütün aralığı değil de belirli bir aralığı seçebiliriz. Mesela son 1 yıla ait dilim..
  • Drill Down: Ayrıntı seviyesinde alta in. Mesela yıl bazından ay bazına geç.
  • Drill Up: Ayrıntı seviyesinde yukarı çık. Mesela şehir bazından bölge bazına çık.

Buradan OLAP küplerinin sadece 3 boyutlu olabileceğini çıkarmamalıyız. Daha az veya çok boyut da olabilir.

OLAP küpleri, tutuldukları yerlere göre farklı isimler alırlar. Eğer küpler çok boyutlu veritabanında tutuluyorsa MOLAP (Multidimensional OLAP), web üzerinden erişiliyorsa WOLAP (Web OLAP), uç birimde tutuluyorsa DOLAP (Desktop OLAP), ilişkisel veritabanında tutuluyorsa ROLAP (Relational OLAP) adını alır.

Biraz da OLAP küp tasarımından bahsedelim. Bildiğimiz gibi OLTP veri tabanı için tasarımı için entity-relationship modeli kullanılır. OLAP tasarımı içinse multidimensional modelleme kullanılır. Eğer depolama ortamı olarak ilişkisel veritabanı kullanıyorsak, genellikle star schema şeklinde (veya daha az kullanılan snowflake schema) olur. Tıpkı bir yıldız (star) gibi, ortada fact tablosunda değerler tutulur ve etrafında değişik seviyeleriyle boyut (dimension) tabloları bulunur.

Kaynaklar:
OLAP Report

Yorumlar

Bu blogdaki popüler yayınlar

create Virtual Machines in VMware with ansible

Yüksek Hizmet Sürekliliği (High Availability)