Failover Cluster Ayarları

Failover Cluster Ayarları

Merhaba, bu yazımda sizlere Failover Cluster Ayarları konusundan bahsedeceğim. Failover cluster yapılandırmasında, bir node down olduğunda diğer node’a failover yapılması yerine node’un quarantine moduna geçmesi birkaç olası sebepten kaynaklanabilir.

Bu durum, cluster’ın default ayarları veya belirli network, storage ve quorum yapılandırmaları ile ilgili olabilir. Bu sorunun çözülmesi ve failover’ın sorunsuz çalışabilmesi için yapılması gereken ayarlar şunlardır.Öncelikle daha önce yazmış olduğum Failover Cluster Kurulumu kılavuzunu da inceleyebilirsiniz.

Windows Failover Cluster Yapılandırması: Adım Adım Kılavuz

QuarantineMode Ayarı

Windows Server 2016 ve üzeri versiyonlarda, cluster’a eklenen bir özellik olan QuarantineMode, belirli bir süre boyunca bir node sürekli sorun yaşarsa onu karantinaya alır. Bu mod, varsayılan olarak aktiftir ve sık sık kesinti yaşayan node’ları karantinaya alır.

Eğer bu node’un normal bir failover yapmasını istiyorsanız, aşağıdaki komutla QuarantineThreshold değerini kontrol edebilirsiniz. Varsayılan olarak bu değer “3”tür, yani bir node 3 kez sorun yaşarsa karantinaya alınır.

Get-Cluster | Select-Object QuarantineThreshold

Quarantine modunu tamamen devre dışı bırakmak için:

(Get-Cluster).QuarantineThreshold = 0

Failover Threshold ve Ayarları

Failover Cluster’da bir node down olduğunda failover işlemi gerçekleştirilir. Ancak, failover’ın sorunsuz çalışması için Failover Threshold değerlerinin doğru ayarlanması gerekir. Bu ayarlar, cluster’ın belirli bir süre boyunca bir node ile bağlantı kuramadığında diğer node’a geçiş yapmasını sağlar.

Failover için en önemli iki parametre Threshold ve Period ayarlarıdır:

Threshold: Bu ayar, bir node’un cluster ile iletişiminin başarısız sayılmadan önce kaç kere denenmesi gerektiğini belirler. Default olarak “5” olarak ayarlanmıştır.

Period: Threshold testlerinin yapılacağı süreyi belirtir.

(Get-Cluster).SameSubnetThreshold = 5

(Get-Cluster).SameSubnetDelay = 1000

Quorum Ayarları

Failover Cluster’ın doğru çalışması için quorum ayarlarının düzgün yapılması önemlidir. Node Majority gibi quorum modelleri kullanılıyor olabilir. Ancak, özellikle küçük cluster’lar için (örneğin iki node’lu), Node and Disk Majority veya File Share Witness gibi seçeneklerle quorum’un daha kararlı olmasını sağlayabilirsiniz.

Örneğin, quorum için bir disk veya file share eklemek için şu komut kullanılabilir:

Set-ClusterQuorum -NodeAndDiskMajority “DiskResourceName”

Eğer file share kullanıyorsanız:

Set-ClusterQuorum -FileShareWitness “\\WitnessServer\WitnessShare”

Heartbeat ve Network Ayarları

Failover cluster’da node’lar arasındaki iletişimin sürekliliği için heartbeat sinyalleri kullanılır. Bu sinyaller, node’lar arasındaki bağlantının devam ettiğini doğrular. Eğer heartbeat sinyalleri sürekli kesiliyorsa, cluster node’ları birbirini kaybetmiş gibi davranabilir ve node karantinaya alınabilir.

Heartbeat ayarlarını optimize etmek için CrossSubnetDelay ve CrossSubnetThreshold*değerlerini kontrol edebilirsiniz:

(Get-Cluster).CrossSubnetDelay = 1000

(Get-Cluster).CrossSubnetThreshold = 5

Cluster Shared Volumes (CSV) ve Depolama Ayarları

Eğer Cluster Shared Volumes (CSV) kullanıyorsanız, depolama performansı ve gecikmeler cluster stabilitesi üzerinde büyük bir etkiye sahiptir. CSV’ler üzerinde redirected IO gibi sorunlar yaşanıyorsa, node’lar arasında sorun oluşabilir.

Depolama erişimini izlemek için Failover Cluster Manager’da “Storage” bölümünü kontrol edin ve disk gecikmelerini veya IO sorunlarını izleyin. Ayrıca, depolama erişim sorunlarını gidermek için SMB Multichannel veya MPIO yapılandırmalarını gözden geçirebilirsiniz.

Cluster Log’larını İnceleyin

Quarantine sorunlarının kaynağını anlamak için cluster loglarını incelemek önemlidir. Cluster loglarını almak için şu komut kullanılabilir:

Get-ClusterLog -Node “NodeName” -TimeSpan 5

Log dosyaları üzerinden iletişim, quorum ve storage ile ilgili detaylı bilgi alınabilir.

Anti-Affinity Rule’ları

Cluster içindeki bazı kaynaklar bir node üzerinde çalışırken diğer node’a geçmemesi için Anti-Affinity Rule’lar konmuş olabilir. Bu ayarları kontrol ederek, kaynakların failover yapmasına engel olan bir kural olup olmadığını inceleyin:

Get-ClusterResource | Get-ClusterParameter AntiAffinityClassNames

Failover Cluster’ın sorunsuz çalışması için quorum yapılandırması, network ve heartbeat ayarları, storage performansı ve failover threshold değerleri optimize edilmelidir. Ayrıca quarantine modunun varsayılan ayarlarının cluster yapısına uygun olup olmadığını değerlendirmeniz gerekebilir. Bu yazımda sizlere Failover Cluster Ayarları konusundan bahsettim. Faydalı olması dileğiyle.


 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir