ما هو Deduplication؟

إلغاء البيانات المكررة هي عملية تستخدم لإزالة البيانات الزائدة عن الحاجة. أثناء العملية ، يتم فحص القرص الصلب لجهاز الكمبيوتر بحثًا عن تسلسل كبير من البيانات عبر نوافذ المقارنة. أثناء المسح بحثًا عن بيانات مكررة ، عادةً ما يتم انتقاء تسلسلات من ثمانية كيلوبايت أو أكثر. إذا تم العثور على التسلسل في مكان آخر على نظام التخزين ، تتم الإشارة إلى الملف المكرر بدلاً من تخزينه مرة أخرى.

يمكن أن تؤدي عملية إزالة البيانات المكررة الناجحة إلى التخلص من عدة كيلوبايت من البيانات الموجودة على جهاز الكمبيوتر ، مما يؤدي إلى فوائد واضحة. تشغل عملية نسخ البيانات مساحة غير ضرورية في النظام ، وعندما تتم إزالة البيانات الدخيلة ، فإن هذا يترك للمستخدم مساحة تخزين أكبر على الكمبيوتر. سيسمح هذا للنظام بالعمل بشكل أسرع وأكثر كفاءة لأنه لا يتورط في البيانات الإضافية. بالإضافة إلى ذلك ، يكون تحسين النطاق الترددي دائمًا أكثر وضوحًا عندما يكون الكمبيوتر به مساحة خالية أكبر.

يتضمن إلغاء البيانات المكررة إحالة كمية كبيرة من البيانات إلى الموقع الأول وحذف النسخ الإضافية من البيانات ، والتي يتم ، مع ذلك ، فهرستها في حالة الحاجة إليها. في كثير من الأحيان ، يمكن تخزين نفس البيانات الدقيقة في ما يصل إلى 100 مكان مختلف على القرص الصلب. إذا كان كل منها يشغل مساحة واحدة ميغا بايت ، فإن ميزة إزالة البيانات المكررة ستقلل هذه المساحة على القرص الصلب من 100 ميغا إلى واحدة فقط. تعمل العملية عن طريق أرشفة البيانات ، وتعتبر المساحة الإضافية المكتسبة مفيدة جدًا لمحرك الأقراص الثابتة بجهاز الكمبيوتر.

تشمل المزايا الإضافية لإلغاء البيانات المكررة تقليل مقدار مساحة النسخ الاحتياطي المطلوبة بنسبة تصل إلى 90 بالمائة ، وتقليل التكاليف مثل متطلبات الطاقة والمساحة والتبريد ، واستعادة مستوى أعلى من الخدمة ، والقضاء على العديد من أنواع الأخطاء المختلفة واستعادة البيانات على عدة جهات نقاط مختلفة. عيب إلغاء البيانات المكررة هو أنه يحدد البيانات المكررة باستخدام وظائف تجزئة التشفير ، والتي قد تكون غير موثوقة ، وقد يؤدي التصادم أو أي نوع آخر من الأخطاء إلى فقدان البيانات. أيضًا ، إذا لم يكن الشخص الذي أذن بالإجراء على دراية بتقليل التكرار المتضمن ، فقد تتأثر موثوقية الكمبيوتر سلبًا.

يعمل إلغاء البيانات المكررة عن طريق تقسيم كل جزء من البيانات التي تتم معالجتها أولاً. يتم تحديد كل جزء ومقارنته بالبيانات الموجودة بالفعل في النظام. إذا كانت البيانات فريدة ، يتم تخزينها على قرص. إذا كانت قطعة بيانات مكررة ، يتم إنشاء مرجع بدلاً من ذلك. يمكن تنفيذ إلغاء البيانات المكررة باستخدام برنامج يسمى Data Domain ، والذي يعمل مع البيانات وأنظمة التخزين للتصفية من خلال البيانات أو الرجوع إلى كل بايت أو حذفه أو تخزينه ، حسب الاقتضاء.