تتعامل أجهزة الكمبيوتر بشكل عميق مع الأرقام ، ويتم تعيين كل حرف وعلامات ترقيم وحروف أبجدية ورمز وما إلى ذلك من خلال الأرقام المختلفة في الكمبيوتر.
قبل اختراع حرف Unicode ، كانت هناك طرق عديدة لتعيين رقم لأحرف مختلفة ، بما في ذلك تشفير الأحرف.
يعتبر Unicode رسميًا طريقة توفر أرقامًا فريدة لأحرف مختلفة إلى جانب الأنظمة الأساسية أو الأجهزة أو التطبيقات أو اللغات المختلفة.
الوجبات السريعة الرئيسية
- UTF-8 هو ترميز أحرف متغير الطول ، بينما UTF-16 هو ترميز أحرف ذو طول ثابت.
- يستخدم UTF-8 من واحد إلى أربعة بايت لتمثيل الأحرف ، بينما يستخدم UTF-16 اثنين أو أربعة بايت.
- يستخدم UTF-8 بشكل شائع لصفحات الويب والبريد الإلكتروني ، بينما يستخدم UTF-16 للغات التي تتطلب أكثر من XNUMX بايت لتمثيل الأحرف.
Utf-8 مقابل Utf-16
الفرق بين UTF-8 و UTF-16 هو أن UTF-8 أثناء ترميز أي حرف باللغة الإنجليزية أو أي رقم ، يستخدم 8 بتات ويعتمد الكتل 1-4 ، بينما من ناحية أخرى ، UTF-16 ، أثناء ترميز الأحرف والأرقام ، يستخدم 16 بت مع تنفيذ 1-2 كتل. أيضًا ، حجم ملف UTF-8 يتطلب مساحة أقل ، في حين أن الملف الموجه UTF-16 هو ضعف حجم UTF-8.

يرمز UTF-8 إلى تنسيق تحويل Unicode 8 الذي يستخدم 1-4 كتل مع 8 بتات ويحدد جميع نقاط رمز Unicode التي تم التحقق من صحتها. يبلغ الطول المتغير لـ UTF-8 حوالي 32 بت لكل حرف.
تم تشكيل UTF-8 بواسطة عقلين لامعين - كين تومسون وروب بايك في سبتمبر 1992. تم إنشاؤه عندما كانا مشغولين في إنشاء نظام التشغيل Plan 9 ، واستغرق الأمر أسبوعًا لصياغته.
يرمز UTF-16 إلى تنسيق تحويل Unicode 16 ، والذي يستخدم كتلتين مطبقتين على طول 1 بت للتعبير عن نقطة رمز. بعبارات بسيطة ، يتطلب UTF-2 Unicode ما لا يقل عن 16 بايت للتعبير عن نقطة رمز.
يتطلب UTF-16 أيضًا طولًا متغيرًا يصل إلى 32 بت لكل حرف. تم تشكيل UTF-16 للتغلب على استيعاب عدد نقاط الرمز.
جدول المقارنة
معلمات المقارنة | UTF-8 | UTF-16 |
---|---|---|
حجم الملف | إنه أصغر في الحجم. | إنه أكبر في الحجم بالمقارنة. |
توافق ASCII | وهو متوافق مع ASCII. | إنه غير متوافق مع ASCII. |
اتجاه البايت | إنه موجه للبايت. | انها ليست بايت المنحى. |
خطأ الاسترداد | إنه لأمر جيد في التعافي من الأخطاء التي ارتكبت. | انها ليست جيدة كما في التعافي من الأخطاء التي ارتكبت. |
عدد البايت | في حالة الحد الأدنى ، يمكن أن يستخدم فقط ما يصل إلى 1 بايت (8 بتات). | في حالة الحد الأدنى ، يمكن أن يستخدم ما يصل إلى 2 بايت (16 بت). |
عدد الكتل | إنها تتبنى 1-4 كتل. | لقد اعتمدت 1-2 كتل. |
الكفاءة | أكثر فعالية | أقل كفاءة |
الأكثر رواجا | إنه أكثر شيوعًا على الويب. | لا تحظى بشعبية كبيرة. |
ما هو UTF-8؟
يرمز UTF-8 إلى تنسيق تحويل Unicode 8. وهو يقوم بتنفيذ الكتل 1-4 مع 8 بتات ثم يحدد جميع نقاط الشفرة الصالحة لـ Unicode.
يمكن لـ UTF-8 صياغة ما يصل إلى 2,097,152 نقطة رمز بحد أقصى. يتم ترميز أول 128 نقطة رمز بواسطة كتلة واحدة تتكون من 8 بتات ثنائية ، وهي متطابقة مع ASCII حرفا.
العقول اللامعة وراء إنشاء UTF-8 هم كين طومسون وروب بايك. قاموا بإنشائه أثناء التخطيط لـ 9 أنظمة تشغيل في عام 1992 سبتمبر.
تم إنشاؤه في غضون أسبوع ، والنظام الدولي للتنظيم (ISO) هو ISO 10646. كما أنه أكثر تنسيق ترميز مقبول على نطاق واسع ، ويتم إنشاء ما يقرب من 95٪ من جميع صفحات الويب بناءً على تنسيق UTF-8.

ما هو UTF-16؟
يرمز UTF-16 إلى تنسيق تحويل الاتحاد 16. تنفيذ بايت واحد أو اثنين من كتل 16 بت للتعبير عن كل نقطة من نقاط الرمز. بعبارات بسيطة ، يتطلب تمثيل كل نقطة رمز في UTF-16 حدًا يصل إلى 2 بايت.
يعبر الطول المتغير لـ UTF-16 عن حوالي 1,112,064،XNUMX،XNUMX نقطة رمز.
حجم ملف UTF-16 هو ضعف حجم UTF-8. لهذا السبب ، يعتبر UTF-16 أقل كفاءة. UTF-16 ليس موجهًا للبايت ، كما أنه غير متوافق مع أحرف ASCII.
UTF-16 هو أقدم معيار ترميز في مجال سلسلة Unicode. التطبيق المتنوع لـ UTF-16 هو الاستخدام في برمجة Microsoft Windows و JavaScript وجافا داخليًا.

الاختلافات الرئيسية بين Utf-8 و Utf-16
- حجم ملف UTF-8 أصغر ، بينما نسبيًا ، من ناحية أخرى ، حجم ملف UTF-16 هو ضعف حجم ملف UTF-8.
- يُظهر UTF-8 التوافق مع ترميزات أحرف ASCII ، بينما من ناحية أخرى ، لا يُظهر UTF-16 أي توافق مع أحرف ASCII.
- ترميز UTF-8 موجه للبايت ، بينما نسبيًا ، من ناحية أخرى ، لا يكون ترميز UTF-16 موجهًا للبايت.
- يعد ترميز UTF-8 جيدًا جدًا في التعافي من الأخطاء التي تم ارتكابها ، بينما من ناحية أخرى ، فإن ترميز UTF-16 ليس جيدًا في الاسترداد من الأخطاء التي تم ارتكابها.
- يستخدم UTF-8 بايتًا واحدًا على الأقل (8 بتات) ، بينما يستخدم نسبيًا ، من ناحية أخرى ، بايت واحد أو اثنين على الأقل (16 بت).
- ينفذ UTF-8 حوالي 1-4 كتل ، بينما يستخدم نسبيًا ، من ناحية أخرى ، UTF-16 حوالي 1-2 كتلتين.
- يعتبر UTF-8 أكثر كفاءة ، بينما بالمقارنة ، من ناحية أخرى ، فإن UTF-16 أقل كفاءة.
- يعتبر UTF-8 أكثر شيوعًا على الويب ، بينما نسبيًا ، من ناحية أخرى ، لا يكتسب UTF-16 شعبية كبيرة على الويب.