برچسب: یونیکد
تغییر اِنکُدینگ کاراکتر
فایلها متنی فارسی در ویندوز با انکدینگ Windows-1256 ذخیره میشود. این فایلها در محیطهای دیگر مانند لینوکس یا مک او اس ممکن است درست نمایش داده نشود. مثلا فایلهای زیرنویس فارسی که در ویندوز تهیه شده، بر روی موبایل یا تلویزیون قابل استفاده نیست. باید انکدینگ آن را به UTF-8 تغییر داد تا همه جا به درستی نمایش داده شود.
در لینوکس یک نرم افزار قدرتمندی وجود دارد که میتواند هر انکدینگی را به هر انکدینگ دیگر تبدیل کند. نام این برنامه iconv است. این برنامه یک فایل متنی را دریافت میکند، سپس آن را به انکدینگ دلخواه شما تغییر داده و نتیجه را به در یک فایل جدید ذخیره میکند.
به عنوان مثال اگر نام فایل مورد نظرتان input.txt باشد و نام فایل اصلاح شده output.txt دستور به شکل زیر می باشد.
iconv -f windows-1256 -t UTF-8 input.txt > output.txt
اِنکُدینگ کاراکتر
در کامپیوتر همه چیز به صورت صفر و یک است. برای اینکه بتوان کاراکترهای مختلف را در کامپیوتر ذخیره کرد؛ باید به ازای هر کاراکتر یک کد عددی در نظر گرفت. و با آن عدد در کامپیوتر کار کرد. به لیست کاراکترها و کدهای مربوطه، اصطلاحاً انکدینگ کاراکتر (Character Encoding) میگویند. (بیشتر…)