ما هو ترميز الحروف؟

ترميز الأحرف ، في برمجة الكمبيوتر ، هو طريقة أو خوارزمية تستخدم للعثور على تمثيل عددي عادة لحرف أو حرف رسومي أو رمز. يعد استخدام ترميز الأحرف في أجهزة الكمبيوتر أمرًا ضروريًا لأن المعلومات الموجودة في ذاكرة الكمبيوتر وعلى الوسائط التي يمكن قراءتها بواسطة الكمبيوتر يتم تخزينها على شكل تسلسلات من وحدات البت أو الأرقام. يتطلب ذلك استخدام التشفير لترجمة الأحرف غير الرقمية المستخدمة للعرض أو الإخراج الذي يمكن قراءته بواسطة الإنسان إلى شكل يمكن للكمبيوتر معالجته. في تطبيق أكثر تحديدًا ، يمكن لمستندات HyperText Markup Language (HTML) التي تقرأها متصفحات الويب تحديد نوع ترميز الأحرف الذي تستخدمه للسماح للمستعرض بمعرفة مجموعة الأحرف المحددة التي يجب استخدامها عند عرض المعلومات في المستند. هناك العديد من أنظمة التشفير قيد الاستخدام ، على الرغم من أن العديد من هذه المجموعات الملكية والموروثة يتم استبدالها ببطء بمعيار الترميز Unicode®.

في الأيام الأولى لأجهزة الكمبيوتر ، عندما كانت مساحة الذاكرة محدودة ، كانت الأحرف الأساسية للأبجدية الإنجليزية – بما في ذلك علامات الترقيم والأرقام – مخزنة في تسلسلات من 7 بتات تسمح لـ 128 حرفًا مختلفًا. في هذا المخطط الأصلي ، يمثل كل بايت 7 بت حرفًا واحدًا من الأبجدية الإنجليزية ، مرقمة بالتسلسل. كان ترميز الأحرف هذا فعالًا وتم توحيده في النهاية واستخدامه في معظم أجهزة الكمبيوتر التي تم إنتاجها. على الرغم من أن نظام التشفير تطور إلى معيار ترميز Unicode® ، إلا أن المفهوم ظل كما هو. أي أن كل حرف مفرد في لغة ما يرتبط مباشرة برقم واحد ضمن مجموعة أحرف قياسية كبيرة ، وهذا الرقم هو ما يستخدمه الكمبيوتر لتخزين ومعالجة وفهرسة الحرف.

تم تطوير أنواع أخرى من ترميز الأحرف لأسباب مختلفة. بعض التي كانت موجهة خصيصًا للأبجدية الإنجليزية والمقصود استخدامها للنص ، قامت بتعيين أحرفها فقط على متواليات 7 بت ثم نشرها عبر 8 بتات ، أو ثماني بتات. كان لهذا تأثير توفير 1 بت لكل ثماني بتات ، باستخدام ترميز الأحرف بشكل فعال كنوع من الضغط. حاولت مخططات الترميز الأخرى توفير معلومات أساسية حول شخصية ما ، ثم أحرف إضافية لتمثيل لهجات خاصة يمكن استخدامها عند الكتابة بلغة مختلفة ، على الرغم من التخلي عنها إلى حد كبير لأساليب التشفير الفردية الأبسط.

في مستندات HTML ، يتشابه ترميز الأحرف تقريبًا مع المفهوم الأوسع ، باستثناء أن الترميز الذي يتم تعريفه يشمل مجموعة كاملة من الأحرف. قد يكون هذا مهمًا ليس فقط للغات الأجنبية ، ولكن للمستندات التي تستخدم رموزًا محددة للعلوم أو الرياضيات غير موجودة في جميع مجموعات الأحرف. يمكن أن يكون مفيدًا أيضًا في استخدام علامات الترقيم والحروف الرسومية الأخرى التي قد لا تكون موجودة أو تم تعيينها بشكل مختلف عبر أنظمة التشفير. قد يتم عرض المستندات التي لا تحدد ترميز الأحرف غير القياسي بشكل صحيح بشكل غير صحيح أو يتم ملؤها بأحرف وعناصر نائبة لا معنى لها بدلاً من المعلومات القابلة للقراءة.