یونی کد چیست

یونی کد چیست؟

همانطور که میدانید کامپیوترها کاراکترها را به آن شکلی که ما می بینیم نمی شناسند، کامپیوترها با کد اسکی ای (ASCII مخفف American Standard Code for Information Interchange) که به هر کاراکتر اختصاص دارد، آن کاراکتر را تشخیص میدهند. هر کد اسکی شامل 8 بیت  یا یک بایت است. درنتیجه درکامپیوتر میتوان از 128 = 8 ^ 2 کاراکتر استفاده کرد که این تعداد کمی است و همه کاراکترها و زبان ها در این تعداد (128) پوشش داده نمیشوند. از این رو از یونیکد برای کاراکترها استفاده میشود. یونی کد مجموعه‌ای بسیار بزرگ شامل کاراکترهای مختلف می‌باشد که تقریبا تمام کاراکترهای مورد نیاز کامپیوتر را در برمی‌گیرد از حروف الفبای فارسی گرفته تا حروف الفبای چینی و انواع و اقسام علائم. مهم‌ترین ویژگی این یونی کدها این است که به هر یک از این نویسه‌ها یک شماره یکتا تخصیص می‌دهد که به آن یونی کد آن نویسه گفته می‌شود. در این استاندارد برای هر کاراکتر 2 بایت یا 16 بیت استفاده میشود درنتیجه یونیکد میتواند از 65636 = 16 ^ 2 کاراکتر پشتیبانی کند. کد اسکی و یونیکد کاراکترهای انگلیسی باهم برابراند.

نکته مهم برای فارسی نویسی این است که برای نوشتن متون فارسی توصیه می‌شود که از روش کد گذاری utf-8 استفاده شود. مبحث مورد توجه در نمایش متون فارسی مشخص کردن نوع کد گذاری صفحات فارسی است برای این منظور در HTML4 از متاتگ خاصی با نام http-equiv در بخش head صفحه HTML استفاده می‌شود. به مثال زیر توجه کنید:

<meta http-equiv="content-type" content="text/html; charset=utf-8">

و در HTML5 دیگر لازم به نوشتن http-equiv="content-type"  نیست و تنها کافیست کد زیر را در بخش head صفحه HTML قرار دهید.

<"meta charset="UTF-8>
نویسنده : محمدهادی شریف  تاریخ : 17 / 2 / 98