Sistem Yöneticisinin Bir Günü

Çalıştığım kurumda sistem yöneticiliği yapıyorum. Acaba sistem yöneticisinin bir günü nasıl geçiyor? Elbette sorumlu olunan işletim sistemi ve kurumsal yazılımlar ve bunlarla ilgili çalışmaların çeşitliliği kadar çok şeyle insan karşılaşabilir. İşte ben de 17/01/2006 tarihinde çalışma günümde yaptığım işleri merak edenler için bir tarafa yazdım.

Çalıştığım kurumda benim sorumluluğumda,

  • 4 unix makine
  • Bunlar üzerinde çalışan oracle uygulama ve veritabanı yazılımları
  • Karar destek yazılımı (Hyperion Performance Suite)
  • Windows sunucu makineler
  • Bunlar üzerinde çalışan Dokuman Yönetim sistemi yazılımı ve Microsoft'un Web sunucu yazılımı olan IIS
  • Windows Küme (cluster) yapısı
  • Ortak disk ünitesi
  • Teyp kütüphane cihazı ve yedekleme yazılımı

gibi yazılım ve donanım bileşenleri var.

08:20 (10dk) Sunulan servislerin çalışıp çalışmadığı ve makinelerin logları incelendi.
Servisleri tamamı web tabanlı olduğu için, ilgili web sitesine bağlanmak servisleri denetlemek için yeterli oluyor.

Unix üzerinde genellikle 2 tip loglama vardır. Metin(text) temelli ve ikili(binary) temelli loglar. Metin temelli log dosyaları metin düzenleme komutlarıyla (mesela vi ve cat komutları) okunabilirken, ikili olanlar özel komutları aracılığıyla okunurlar. Bu özel komutlar, her unix sisteminde değişiklik gösterir.

Unix sistem yöneticileri birçok işlerini betikler aracılığıyla yaparlar. Böylece yönetim işi otomatikleşir/kolaylaşır. Unix'in betik dilinin güçlü olması, sistem yöneticiliğ için önemli bir avantaj sağlar. Ben de log dosyalarında bulunan önemli bilgileri ekrana getiren bir betik yazdım. Betik şu bilgileri getiriyor:


  • ikili log dosyasının son mesajları
  • Metin log dosyasının son 10 satırı
  • Genel loglama dosyalarından biri olan messages dosyasının içeriğinin son kısmı
  • Disk bölümlerinin doluluk oranları
  • O sıradaki CPU sistem yükü
  • telnet oturumu açan kullanıcılar kimler ve nereden/ne zaman bağlanmışlar (güvenlik için)
  • Oracle log dosyası (alert file) son 30 satır ve son 5000 satır içinde ORA ile başlayan (hata mesajları) satırlar


Unix Sistemler üzerinde zamanlanmış bir çok iş çalışır. Bu işler cron daemon tarafından çalıştırılırlar. Bunların sonuçları e-posta ile geri bildirilir. Bu sonuçlar her sabah incelenir. Loglardan sonra bu e-postaları incelerim. Zamanlanmış görevlerde sorun olmuş mu diye ..


Bizim için, zamanlanmış görevler şu işleri yaparlar.

  • Yedekleme: Yedekleme sırasında Oracle veritabanının kapatılıp tekrar açılması gerekir.
    Böylece dosya bazında alınan yedeğin tutarlı olması sağlanmış olur.
  • Saat senkronizasyonu: Sunucu saatleri senkronize edilir.(ntp ile..)
  • Oracle kullanıcısına ait bazı toplu iş betikleri
  • Oracle'a ait bazı yedekler.(Kullanıcı bazında export)
08:40 (10dk) CA ArcServe Yedekleme yazılımı ile zamanlanmış yedekler gozden gecirildi.

Burada yedegi alinamayan bir makine gozlendi ve durum makineden sorumlu kisiye eposta ile bildirildi. Cunku hata baglanti kurulamamasiydi. Yani ag veya makine ulasilabilirligi konusunda problem var!

08:50 (20dk): Sistem odasinda uzaktan destek için modem bağlantısının kurulumu tamamlandı.

Kurumsal sistemlerde hizmet sürekliliği çok önemlidir. Bu yüzden makineleri satın aldığımız firma uzaktan destek verilebilmesi için modem bağlantısını önermişti. Biz de problem durumunda hızlı sorun giderme için bu bağlantıyı ancak bu gün bitirebildik.

Bu arada sistem odasında çalışırken ilginç bir şey de gozlemledik. Sunucuların yerleştirildiği sistem odasında, rack kabinetler vardır. Sunucular bu kabinetler içerisine monte edilmişlerdir. Bu sunucular oldukça incedir ve çekmece rafları gibi kabinet içerisine yerleştirilirler. Dün gece, modem için belirlenen telefon numarasini arkadaş, 1U (5-10cm) kalınlığındaki makinenin önüne koymuştu. Halbuki makine soğutmasını, ön kısımdan havayı çekip arka kısma göndererek sağlıyordu. Kağıt bu kısmı tamamen kapattığı için, makine soğutma işini yapamamış ve otomatik olarak yarı-kapanmış. Yani işletim sistemi çalışmıyor. Biz makinenin çıkardığı garip sesten şüphelendik. Kağıdı çekip restart yapınca makine düzeldi. Yukarıda yedeği alınamayan makine de buydu!


09:10: (20dk) Dokuman Yönetim Sistemine (DYS) taranmış dosya eklenemiyor problemiyle gelindi


DYS'nin donanım altyapısı, dosya ve uygulama sunucularından oluşuyor. Uygulama sunucu web tabanlı arayüz sağlıyor. Burada IIS çalışmakta. Dosya sunucu ise üzerinde taranmış dosyaları (TIFF uzantılı) saklıyor. DYS, Windows küme yazılımı kurulu 2 makinede çalışıyor. Dosya ve Uygulama sunucu servisleri küme yazılımı sayesinde makineler arasında kaydırılabilmekte. Böylece makinelerden birisi çökse bile servis kesintisiz verilmeye devam etmektedir. Her 2 servisi dosya sunucu makinesine kaydırınca problem duzeldi. Makinelerden birisi problem giderme çalışmaları için kapatıldı. Bir sure her 2 servis de aynı makineden verilecek.



09:40: (30dk) Problemi giderebilmek için IIS ile ugrasildi.

11:00 (40dk) Oracle veritabanı uzerinde CPU kaynak tuketimi > %99 olduğu gozlendi.
Buna sebep değişen bir SQL cümleciği olabileceği tahmin edildi. Programcilardan biri bu tip bir değişiklik yapmis olabileceğini kabul etti. CPU kaynagini çokça tuketen SQL cumleler tespit edilip programciya gonderildi. Alternatif olarak, ogle tatilinde bu değişikliklerin geri alinip sonucun izlenmesi de kararlaştırıldı.

12:00 (20dk)Bilgisayarla uğraşı bedenin yapısına hiç uygun değil! Bu yüzden zaman zaman molalar vermek ve hareket etmek gerekli. Benim için bu tip molaların yerini namaz mükemmel olarak tutuyor.


12:30(Oglen tatili, 1 saat) Sistem yöneticilerinin en yoğun çalışma zamanları mesai harici saatlerdir. Çünkü mesai saatleri içerisinde çalışan sisteme dokunmamız fazla mümkün olmaz! Bu yüzden mesai harici saatlere ve hafta sonları çalışma için hazırlıklı olmak gerekir. Bu oglen tatili boyunca oracle uygulama sunucuya ait performans testleri kapsamında kullanılacak Borland OptimizeIt aracının kurulumuyla uğraşıldı

13:30 (30 dk) OptimizeIT aracı kurcalandı.

14:10 (10dk) oglen yemegi (= 1.5 poaca, biraz ceviz ve fındık ve enerji vermesi için kuru uzum) Bu arada üzüm hafızaya da iyi geliyor diye duydum.

16:00 (40 dk) Unix notlarini gozden gecirme..Yeni bilgiler edinme..Her zaman öğrenecek yeni şeyler vardır. İlerleyecek yeni bir adım..

Yorumlar

Bu blogdaki popüler yayınlar

create Virtual Machines in VMware with ansible

Yüksek Hizmet Sürekliliği (High Availability)