EMC Storage RAID-5 ve SAS Disklerin Getirdikleri

PostgreSQL veritabanımızda veri depolama için HP P2000‘i kullanırken yeni satın aldığımız EMC Clariion‘a geçme kararı aldık. Bir gece disklerimizi EMC disklerin üstüne taşıdık ve herşeyin çok daha renkli olacağını düşünmeye başlamıştık. Ancak..

Haftasonu yapılan bu işlem Pazartesi günü sabah saat 8-9’u gösterdiğinde hiç beklenmedik durumlara sebep oldu. Sürekli birer dakikalık ya da daha uzun kesintiler yaşamaya, veritabanı sunucusunun yükü 80-90‘lara çıktığını, herşey normalken bir anda gelen tüm sorguların sonuçlarının dönemediği bir durumda kendimizi bulduk. Mesela, 10 ms süren SELECT sorgusu saniyelerce çalışıyor fakat cevap dönmek bilmiyor. Hani, diskten okumaya çalışıyor ama beceremiyor gibi. Uzun uğraşlar sonucunda sorunun kaynağı bulundu.

EMC diskler RAID-5 yapısı kullanacak şekilde SAS ve NL-SAS‘lar üzerine konfigurasyonu yapılmış. NL-SAS dedikleri performans yoksunu olan ve EMC’nin pazarlama ürünü olarak satılan bildiğimiz SATA diskler. EMC üstünde veritabanının yanı sıra bir sürü medya, uygulama, vb.. sunucularının da diskleri bağlı.

Sorun ise şu şekilde meydana geliyor;

RAID-5*SAS* ve NL-SAS disklerden yazma işlemine dayanamadığı anda yığılıp kalıyor. Yani, write cache’in doluluğu tavan yaptığı sırada cache’teki verileri diske yazmaya başlıyor ve bu sırada EMC tüm IO’yu kesiyor. Böyle olunca da gelen hiç bir istek kabul edilemiyor, cevaplayamıyor.

Disk gruplarının yanlış bir şekilde RAID-5 ve SAS, NL-SAS‘ lı olarak yapılandırıldığını bilmiyorduk bunun üstüne yeni bir yapılandırmayla RAID-10 ve SSD‘li disklerle beraber sorun çözülmüş oldu.

Erkin Çakar

PostgreSQL DBA & Software developer