Veri Merkezi Teknolojileri

Sistem yöneticiliğine yeni adım atanlar için zor cevaplardan birisi nereden başlamalıyım sorusudur. Bu soruya cevap olabilecek ve her yeni sistem yöneticisinin faydalı bulacağı temel bir kitap elime geçti. Okuduğum yerlerin bir özetini burada sizlerle paylaşmaya çalışacağım.
Kitabın adı Administering Data Centers. Yazarı Kailash Jayaswal. Kitabı büyük oranda books.google.com üzerinden okuyabilirsiniz.
Artık özete başlayabiliriz...
Chapter 1: No Time For Downtime
Bir kurumda neden bilgisayarlar önemli.. durmaması için bu kadar çalışma neden ? Bunun sebepleri temel olarak aşağıda:
  • Kurumların iş süreçleri, eskiden kağıt, kalem ve insan gücüyle yapılırken, artık bilgisayar ortamında yapılmakta. Bilgisayar sistemi durduğunda kurum da durmakta
  • Pek çok işlem Web üzerinden yapılabilir hale geldi. Gece gündüz hizmetlerinizi vermeniz gerekiyor.
  • Globalleşme nedeniyle, sadece yurtiçi değil, dünyaya hizmet veriliyor. Bu yüzden 7/24 ulaşılabilir olmak zorundayız
Bu yüzden veri merkezlerinin kullanılabilir olması çok önemli! Kullanılabilirliği ölçmek için kullanılan yöntemlerden biri 9 yöntemi. Kullanılabilirliğin (Availability) zıddı kesinti (downtime) olarak biliniyor.
  • %99.99 kullanılabilir = 52.5 dakika kesinti / yıl
  • %99.9 kullanılabilir =  525 dakika kesinti / yıl
Kesinti sebeplerinde değişik yüzdeler veriliyor. şunları aklımızda bulundurabiliriz.
  • insan hataları donanım arızalarından daha fazla kesinti sebebi
  • yazılım sorunları insan hatalarından daha fazla kesinti sebebi
Chapter 2: The High Availability Continuum
Kesinti sebebi olarak baktığımızda, donanım hataları en az olanı.. Fakat teknoloji yoluyla en kolay çözülebilir olanı da bu.
Bir şeyi denetlemeye başlamadan once onu ölçebiliyor olmalıyız. Servis sürekliliği konusunda Önce kavramlara bakalım..
bir bileşenin hata yapmadan çalışması reliability/güvenilirlik olarak biliniyor. Benzer bir kavram MTBF (Mean Time between Failures), yani hatalar arası geöçen süre.. Bir sabit disk için MTBF 1.6 milyon saat olabilmekte. Bunun yolu parçayı olabildiğince sağlam yapmak. Bir sorun çıktığında tam veya kısmi olarka çalışmaya devam edebilme özelliği resiliency/dayanıklılık olarak biliniyor. Diskleri RAID gibi teknolojilerle bir araya getirip, disk çökse bile veri ve hizmet kaybı olmadan çalışmaya devam edebiliyoruz. servisi vermeye devam ediyorsak bu kullanılabilirlik/availability olarak biliniyor. Bunun için parça bazında redundant/fazla parça tutabiliriz. Mesela 2 adet güç kaynağı kullanılır sunucularda. Sunucu bazında clsuter/küme sistem kullanabiliriz. Bir sunucu arızalanda bile çok az veya hiç kesinti olmadan servis çalışmaya devam edebilir. Serviceability/Servis edilebilirlik ise sorun durumunda sorunun giderilebilmesini amaçlıyor. Mesela Hot swap disk ve güç kaynağı gibi teknolojilerle, sorunlu parça sistem çalışırken değiştirilebiliyor. Fekaket kurtarma/disaster recovery ise deprem vb gibi durumlarda, tüm bilgi işlem merkezi çöktüğünde, servislerin başka bir yerleşkeden ayağa kaldırılmasını ifade ediyor.
Availability=Uptime / (Uptime + Downtime)
Bir sistem tasarlarken servis sürekliliği konusunda, yapmamız gereken tasarımlar şöyle: (Artan süreklilik ihtiyacına göre)
  1. Diskleri RAID yapıda kurmalıyız
  2. Sunucu bileşenlerinin olabildiğince redundant olmasını sağlamalıyız. Güç kaynakları, fanlar, ağ kartları en az çiftli seçilmeli.
  3. Sunucular arasında cluster/küme yapı kurmalıyız. Burada birçok cluster yazılımı var. Veritas cluster server pek çok platformda çalışıyor, ama daha çok solaris üzerinde görülebilir. Microsoft Cluster Server (MSCS) windows ortamlarında kullanılır. IBM HACMP AIX ortamında kullanılmaktadır. HP Serviceguard ise HP-UX ortamlarında..
  4. felaket kurtarma merkezi hazırlamalıyız

Chapter 3: Data Center Requirements
Bir veri merkezi temelde şu gereksinimleri sağlamalıdır:
  • Sunucu, ağ ve depolama üniteleri için güvenli bir fiziksel ortam. Alan güç ve iklimlendirme ünitelerini de alacak kadar büyük olmalı. Deprem vb felaket bölgelerinden uzak seçilmeli.
  • 7x24 ağ bağlantısı
  • Elektrik : Kesntilere karşı akü beslemeli UPS ve devamında jeneratör koruması olmalı. UPS sadece birkaç saat veri merkezini besleyebilir. Devamında jeneratör devereye girmelidir. UPS gücü KVA (Kilo Volt Ampere) olarak güç tüketen bileşenlerden hesalanmalıdır.
  • iklimlendirme (soğutma ve nemlendirme). HVAC (Humidity, Ventilation Air Conditioning) olarak da bilinir. BTU biriminde bir iklimlendirme gücü belirlenmelidir, yine veri merkezinde ısı yayan bileşnlerin BTU ları esas alınarak.

Chapter 4: Data Center Design
Bu bölümde veri merkezine ait yapısal birimler inceleniyor.
Çoğu veri merlezinde sunucular yükseltilmiş zemin üzerine yayılan karoların üzerinde durur. Karoların altı güç ve veri kabloları için kanallar içerir. Ayrıca soğutma sisteminin hava dolaşımı bu boşluk içinden yayılır. Perfore edilmiş (ızgara boşlukları olan) karolardan soğuk hava, sunucuların olduğu üst bölüme çıkar. Karoların üzerinde sunucular yüz yüze ve sırt sırta dizilmiş olurlar. Yüz yüze duran sunucular arası koridordan 2 sıra karo bulunur.  Sırtların baktığı koridorda ise 1. Perfore karolar yüz yüze bakan koridor boyunca köşegen şeklinde yayılır. Yani birinci sırada  perfore karo, normal karo şeklinde giderken.. ikinci sırada normal karo, perfore karo şeklinde gider. Sunucular soğuk havayı ön kısımdan çekerler ve fanları aracılığıyla arka kısma (koridora) iterler. Bu koridorların üstünde hava emen bileşenlerle sıcak hava uzaklaştırılır.

Chapter 5: Network Infrastructure in Data Center

devam edecek...

Yorumlar

Bu blogdaki popüler yayınlar

create Virtual Machines in VMware with ansible

Yüksek Hizmet Sürekliliği (High Availability)