Merhaba, bu yazımda sizlere vSphere 7’de kritik DRS hatasının çözümünden VMware vSphere 7 ve üzeri bir sürüm yönetiyorsanız, cluster’larınızın üzerinde beliren “vSphere DRS functionality was impacted due to unhealthy state vSphere Cluster Services uyarısıyla karşılaşmış olabilirsiniz. Bu uyarı, ilk bakışta endişe verici görünebilir çünkü doğrudan cluster’ınızın kalbi olan Dağıtılmış Kaynak Zamanlayıcı’nın (DRS) sağlığını etkilediğini belirtir. Ancak panik yapmanıza gerek yok; bu sorun genellikle kontrollü adımlarla kolayca çözülebilir.
vSphere Cluster Services (vCLS) Nedir?
vSphere 7.0 ile VMware, DRS ve HA (High Availability) gibi temel cluster servislerinin işleyiş mantığını değiştirdi. Artık bu servisler, vCenter’dan bağımsız olarak çalışabilmek için vCLS (vSphere Cluster Services) adı verilen, her cluster’da otomatik olarak dağıtılan 1 ila 3 adet çok küçük sanal makineye (VM) bağımlıdır.
Gördüğünüz hata mesajı, bu kritik vCLS sanal makinelerinin bir veya daha fazlasının sağlıksız, kapalı veya ulaşılamaz durumda olduğunu söylüyor. vCLS VM’leri çalışmadığında, DRS beklendiği gibi yük dengeleme yapamaz. Bu durum, özellikle yoğun çalışan ortamlarda performans sorunlarına yol açabilir.
vCLS VM’lerini Yeniden Oluşturmaya Zorlama (Retreat Mode)
En etkili çözüm, vCenter’ı sorunlu vCLS sanal makinelerini silip sıfırdan, sağlıklı bir şekilde yeniden oluşturmaya zorlamaktır. Bu işleme “Retreat Mode” adı verilir ve cluster’a özel bir gelişmiş ayar ile etkinleştirilir.

Önemli Not: Bu işlem sırasında cluster’ınızdaki diğer sanal makineler etkilenmez ve çalışmaya devam eder.
Cluster UUID’sini Bulun
- vSphere Client’ta Host and Clusters görünümüne gidin.
- Sorun yaşadığınız Cluster‘ı seçin.
- Configure -> vSphere Cluster Services -> General sekmesine gidin.
- Burada “Cluster UUID” olarak belirtilen kimlik numarasını kopyalayın. domain-c ile başlayan bir kimlik olacaktır.
Retreat Mode’u Etkinleştirin
- En üst seviyedeki vCenter objesini seçin.
- Configure -> Settings -> Advanced Settings bölümüne gidin.
- EDIT SETTINGS butonuna tıklayın.
- Yeni bir ayar eklemek için ADD butonuna basın.
- Name (İsim) alanına config.vcls.clusters.CLUSTER_UUID.enabled yazın. Buradaki CLUSTER_UUID kısmını 1. adımda kopyaladığınız kendi cluster kimliğinizle değiştirin.
Örnek: config.vcls.clusters.domain-c8.enabled
- Value (Değer) alanına false yazın ve ADD butonuna tıklayın.
- Son olarak SAVE ile ayarı kaydedin.
Bu ayarı kaydettiğinizde, vCenter ilgili cluster için vCLS hizmetini devre dışı bırakır ve mevcut sağlıksız vCLS sanal makinelerini 2-3 dakika içinde otomatik olarak silecektir. vCenter arayüzünden vCLS VM’lerinin silindiğini doğrulayabilirsiniz.
Retreat Mode’dan Çıkın ve vCLS’i Yeniden Başlatın
- vCLS VM’lerinin silindiğinden emin olduktan sonra, aynı Advanced Settings ekranına geri dönün.
- Az önce eklediğiniz config.vcls.clusters… ayarını seçin ve REMOVE butonu ile silin. (Alternatif olarak değerini true olarak da değiştirebilirsiniz, ancak silmek en temiz yöntemdir.)
- Ayarı sildikten sonra SAVE butonuna basın.
Bu işlemle vCenter’a “Bu cluster için vCLS hizmetini yeniden etkinleştir” komutunu vermiş olursunuz. vCenter, yaklaşık 5-10 dakika içinde cluster’ınız üzerinde yeni ve sağlıklı vCLS sanal makinelerini otomatik olarak dağıtacaktır. Yeni VM’ler başarıyla açıldığında, cluster üzerindeki kırmızı uyarı mesajı kendiliğinden kaybolacaktır.
vSphere 7’nin bu yeni mimarisi, cluster hizmetlerini daha dayanıklı hale getirmeyi amaçlasa da bazen vCLS VM’leri depolama, ağ veya kaynak sorunları nedeniyle takılı kalabilir. Yukarıdaki “Retreat Mode” yöntemi, bu tür durumlarda servis kesintisi yaratmadan ve güvenli bir şekilde sorunu çözmek için VMware tarafından sağlanan resmi bir yoldur. Aşağıdaki link üzerinden inceleyebilirsiniz.
Disable vCLS on a Cluster via Retreat Mode
Bu yazımda sizlere vSphere 7’de kritik DRS hatasının çözümünden bahsettim. Faydalı olması dileğiyle.
