مفهوم قابلیت Compression و Deduplication
با گسترش داده های دیجیتال و اپلیکیشن های مبتنی بر داده در سال های اخیر، کارایی بالا و تاخیر پایین در دسترسی به داده ها از نیازمندی نوین سامانه های ذخیره ساز است. درهمین راستا، در مراکز داده، سامانه های رایج مبتنی بر دیسک سخت(HDD) در حال جایگزین شدن با سامانه های پرسرعت مبتنی بر دیسک حالت جامد(SSD) هستند. اما به دلیل قیمت بالای SSD در مقایسه با HDD، خرید سامانه های تمام SSD برای همه ی مشتریان میسر نیست. در این راستا، اکثر شرکت های خارجی و همچنین شرکت پرسا (HPDS) سعی کرده اند که با پیاده سازی تکنیک های کاهش داده (مانند فشرده سازی داده) هزینه ی تمام شده ی سامانه را کاهش دهند.
تکنیک های کاهش داده معمولا شامل دو بخش هستند: حذف داده های تکراری (Deduplication) و فشرده سازی (Compression). به طور خلاصه، معمولا پس از دریافت داده ها درسامانه ذخیره ساز، داده ها به ماژول Deduplication ارسال می شوند. ماژول Deduplication داده ها را به صورت بلوک ها با سایز مشخص (مثلا 4KB) در نظر گرفته و با داده هایی که از قبل در دیسک های سامانه موجود است، مقایسه می کند. اگر محتوای یک بلوک داده دقیقا مشابه یک بلوک داده موجود در سامانه باشد (در اصطلاح duplicate باشد)، محتوای داده ی دریافتی (مثلا آن بلوک با سایز 4KB) دوباره نوشته نمی شود و صرفا نیاز به یک اشاره گر به آدرس بلوک داده ی موجود در سامانه است. پس از عملیات حذف داده های تکراری، برروی داده های باقی مانده، عملیات فشرده سازی داده (Compression) انجام می شود. ماژول فشرده سازی با شناسایی الگوهای تکراری داده (در سطح بایت) داخل هر بلوک داده و تغییرencoding داده ها، می تواند حجم هر بلوک را کاهش دهد. در نهایت داده های فشرده شده ی غیرتکراری (compressed non-duplicate) برروی آرایه ی دیسک ها ذخیره می شود.
در کاربردهای واقعی مراکز داده (مانند محیط های دارای ماشین های مجازی فراوان)، مجموع deduplicationو compression می تواند از 50% تا 90% حجم داده ها را کاهش دهد. بدین ترتیب، یک سامانه با 100 ترابایت ظرفیت خام دیسک ها، می تواند از 200TB تا 1PB فضای موثر ذخیره سازی فراهم کند. در حال حاظر، برخی برندهای معروف خارجی تولیدکنند ی سامانه های ذخیره ساز (مانند EMC و HPE 3PAR) متناسب با رده ی محصول مربوطه، برخی روش های کاهش داده را در سامانه های تمام SSD پیاده سازی کرده اند. شرکت پرسا نیز پس از انجام تحقیق و توسعه در زمینه کاهش هزینه های ذخیره سازی داده، قابلیت جدیدی به نام "کاهش داده ی پیشرفته" یا "Advanced Data Reduction" را برای محصولات تمام SSD خود طراحی کرده و این قابلیت را در دستورکار تجاری سازی قرارداده است.
