Merhaba, bu yazımda sizlere Failover Cluster Node’u Karantina Durumundan Çıkarmak konusundan bahsedeceğim. Windows Failover Cluster ortamlarında, bir node beklenmedik bir hata nedeniyle karantina moduna geçebilmektedir.
Karantina, genellikle ağ bağlantısı sorunları, disk erişim problemleri veya diğer donanım/yazılım uyumsuzlukları sonucu gerçekleşmektedir. Bu durum, nodu yeniden başlatmadan cluster üzerinde tekrar aktif hale getirmek için bazı teknik adımlar gerektirir. PowerShell, bu tür sorunları çözmek için güçlü ve etkili bir araçtır.
Karantina Durumundaki Node’u Belirleme
İlk adım, hangi nodun karantina durumunda olduğunu belirlemektir. Bunun için aşağıdaki PowerShell komutunu kullanabilirsiniz:
Get-ClusterNode
Bu komut, tüm nodların durumlarını görüntüler. “Quarantined” olarak listelenen bir node, karantina modundadır.
Örnek çıktı:
- Name State
- —- —–
- Node1 Up
- Node2 Quarantined
- Node3 Up
Bu örnekte Node2 karantina modunda.
Karantina Modunun Sebebini Analiz Etme
Karantina moduna düşen nodun sorunlarını incelemek için aşağıdaki komutları kullanabilirsiniz:
Node’un Cluster Event Kayıtlarını İnceleme
Get-ClusterLog -Node Node2 -TimeSpan 5m | Out-File C:\ClusterLogs\Node2_Log.txt
Bu komut, son 5 dakikalık olay kayıtlarını bir dosyaya aktarır. Log dosyasını analiz ederek sorunun kaynağını bulabilirsiniz.
Detaylı Node Bilgisi Alma
Get-ClusterNode -Name Node2 | Format-List *
Bu komut, nodun ayrıntılı bilgilerini listeler. Karantina durumuna neyin yol açtığını anlamak için kullanışlıdır.
Karantina Modundaki Node’u Aktif Hale Getirme
Node’u “Pause” ve “Resume” Yaparak Yeniden Katılım Sağlama
Karantina modundaki nodu yeniden aktif hale getirmek için “Pause” ve ardından “Resume” komutları kullanılabilir:
- Suspend-ClusterNode -Name Node2
- Resume-ClusterNode -Name Node2
Bu komutlar, nodu geçici olarak cluster görevlerinden çıkarır ve ardından tekrar dahil eder.
Force Start ile Cluster’a Yeniden Katılım
Eğer yukarıdaki işlem sorunu çözmezse, Force Start seçeneği kullanılabilir:
Start-ClusterNode -Name Node2 -Force
Bu komut, nodu zorla cluster’a yeniden ekler. Ancak bu adım öncesinde log analizini dikkatlice yapmanız önemlidir.
Network veya Disk Kaynaklarını Kontrol Etme
Cluster kaynaklarının düzgün çalıştığından emin olun. Özellikle network adaptörleri ve disk erişiminde sorun varsa, bunları düzeltmek gerekebilir.
Ağ Bağlantılarını Kontrol Etme
Test-Cluster -Node Node2
Bu komut, nod üzerindeki tüm cluster testlerini çalıştırır ve potansiyel sorunları raporlar.
Disk Kaynaklarını Kontrol Etme
Get-ClusterResource | Where-Object {$_.OwnerNode -eq “Node2”}
Bu komut, Node2 tarafından sahip olunan tüm kaynakları listeler. Disk veya diğer kaynaklarda hata varsa düzeltici adımlar atılabilir.
Karantina Süresini Yeniden Yapılandırma
Cluster’ın varsayılan karantina süresi, bazı durumlarda yeniden yapılandırılarak sorunun önüne geçilebilir. Varsayılan süreyi değiştirmek için aşağıdaki komutu kullanabilirsiniz:
(Get-Cluster).QuarantineDuration = 0
Son olarak karantinadan çıkarmak için aşağıdaki komutu kullanabilirsiniz.
Start-ClusterNode -ClearQuarantine
Bu ayar, karantina süresini sıfırlar. Ancak bu ayar dikkatli kullanılmalıdır, çünkü potansiyel sorunları maskeleyebilir.
Failover Cluster node’ları arasında yaşanan kesintiler, özellikle karantina durumunda zorlu bir problem olabilir. Ancak PowerShell ile etkili bir şekilde bu sorunları çözmek mümkündür. Yukarıdaki adımları izleyerek, nodu yeniden başlatmadan cluster üzerinde tekrar aktif hale getirebilirsiniz. Bu yazımda sizlere Failover Cluster Node’u Karantina Durumundan Çıkarmak konusundan bahsettim. Faydalı olması dileğiyle.