×
Failover Cluster Node'u Karantina Durumundan Çıkarmak

Failover Cluster Node’u Karantina Durumundan Çıkarmak

Merhaba, bu yazımda sizlere Failover Cluster Node’u Karantina Durumundan Çıkarmak konusundan bahsedeceğim. Windows Failover Cluster ortamlarında, bir node beklenmedik bir hata nedeniyle karantina moduna geçebilmektedir.

Karantina, genellikle ağ bağlantısı sorunları, disk erişim problemleri veya diğer donanım/yazılım uyumsuzlukları sonucu gerçekleşmektedir. Bu durum, nodu yeniden başlatmadan cluster üzerinde tekrar aktif hale getirmek için bazı teknik adımlar gerektirir. PowerShell, bu tür sorunları çözmek için güçlü ve etkili bir araçtır.

Karantina Durumundaki Node’u Belirleme

İlk adım, hangi nodun karantina durumunda olduğunu belirlemektir. Bunun için aşağıdaki PowerShell komutunu kullanabilirsiniz:

Get-ClusterNode

Bu komut, tüm nodların durumlarını görüntüler. “Quarantined” olarak listelenen bir node, karantina modundadır.

Örnek çıktı:

  • Name                 State
  • —-                 —–
  • Node1                Up
  • Node2                Quarantined
  • Node3                Up

Bu örnekte Node2 karantina modunda.

Karantina Modunun Sebebini Analiz Etme

Karantina moduna düşen nodun sorunlarını incelemek için aşağıdaki komutları kullanabilirsiniz:

Node’un Cluster Event Kayıtlarını İnceleme

Get-ClusterLog -Node Node2 -TimeSpan 5m | Out-File C:\ClusterLogs\Node2_Log.txt

Bu komut, son 5 dakikalık olay kayıtlarını bir dosyaya aktarır. Log dosyasını analiz ederek sorunun kaynağını bulabilirsiniz.

Detaylı Node Bilgisi Alma

Get-ClusterNode -Name Node2 | Format-List *

Bu komut, nodun ayrıntılı bilgilerini listeler. Karantina durumuna neyin yol açtığını anlamak için kullanışlıdır.

Karantina Modundaki Node’u Aktif Hale Getirme

Node’u “Pause” ve “Resume” Yaparak Yeniden Katılım Sağlama

Karantina modundaki nodu yeniden aktif hale getirmek için “Pause” ve ardından “Resume” komutları kullanılabilir:

  • Suspend-ClusterNode -Name Node2
  • Resume-ClusterNode -Name Node2

Bu komutlar, nodu geçici olarak cluster görevlerinden çıkarır ve ardından tekrar dahil eder.

Force Start ile Cluster’a Yeniden Katılım

Eğer yukarıdaki işlem sorunu çözmezse, Force Start seçeneği kullanılabilir:

Start-ClusterNode -Name Node2 -Force

Bu komut, nodu zorla cluster’a yeniden ekler. Ancak bu adım öncesinde log analizini dikkatlice yapmanız önemlidir.

Network veya Disk Kaynaklarını Kontrol Etme

Cluster kaynaklarının düzgün çalıştığından emin olun. Özellikle network adaptörleri ve disk erişiminde sorun varsa, bunları düzeltmek gerekebilir.

Ağ Bağlantılarını Kontrol Etme

Test-Cluster -Node Node2

Bu komut, nod üzerindeki tüm cluster testlerini çalıştırır ve potansiyel sorunları raporlar.

Disk Kaynaklarını Kontrol Etme

Get-ClusterResource | Where-Object {$_.OwnerNode -eq “Node2”}

Bu komut, Node2 tarafından sahip olunan tüm kaynakları listeler. Disk veya diğer kaynaklarda hata varsa düzeltici adımlar atılabilir.

Karantina Süresini Yeniden Yapılandırma

Cluster’ın varsayılan karantina süresi, bazı durumlarda yeniden yapılandırılarak sorunun önüne geçilebilir. Varsayılan süreyi değiştirmek için aşağıdaki komutu kullanabilirsiniz:

(Get-Cluster).QuarantineDuration = 0

Son olarak karantinadan çıkarmak için aşağıdaki komutu kullanabilirsiniz.

Start-ClusterNode -ClearQuarantine

Bu ayar, karantina süresini sıfırlar. Ancak bu ayar dikkatli kullanılmalıdır, çünkü potansiyel sorunları maskeleyebilir.

Failover Cluster node’ları arasında yaşanan kesintiler, özellikle karantina durumunda zorlu bir problem olabilir. Ancak PowerShell ile etkili bir şekilde bu sorunları çözmek mümkündür. Yukarıdaki adımları izleyerek, nodu yeniden başlatmadan cluster üzerinde tekrar aktif hale getirebilirsiniz. Bu yazımda sizlere Failover Cluster Node’u Karantina Durumundan Çıkarmak konusundan bahsettim. Faydalı olması dileğiyle.


 

1988 İstanbul doğumluyum. Bilgisayar dünyasına olan hayranlığım çok küçük yaşlarda başladı. Bu sebeple sistem alanında kendimi geliştirmeye karar verdim. Celal Bayar Üniversitesi Bilgisayar Programcılığı ve Anadolu Üniversitesi İşletme mezunuyum. Beykent Üniversitesi'nde Yönetim Bilişim Sistemleri Bölümü'nde yüksek lisans eğitimimi tamamladım. 2005 yılında Bilge Adam Sistem & Network Mühendisliği eğitimi aldım. Hemen ardından IT dünyasına giriş yaptım. Collezione şirketinde 2006 - 2018 yılları arasında Sistem Uzmanı olarak görev yaptım. 2018 Temmuz ayından beri LCWAIKIKI şirketinde System Engineer pozisyonunda çalışmaktayım. Sektörde 19 yıllık deneyime sahibim. Birçok önemli projede görev aldım. Sayfanın en alt kısmından Linkedin profilime ulaşabilirsiniz. Bilgi ve tecrübemi hem bu blog üzerinde hem de Çözümpark Bilişim Portalı üzerinde paylaşıyorum.

Yorum gönder