文字コード 【character code】
読み方 : モジコード
別名 : キャラクタコード
文字や記号をコンピュータで扱うために、文字や記号一つ一つに割り当てられた固有の数字のこと。
欧米などで使われる英数字の文字コードは1バイトで表現されるが、これでは256文字しか表現できず、日本語の漢字などは収録できないため、日本や韓国、中国などではそれぞれ独自に2バイト(最大65536文字)のコード体系を定め、それぞれ自国内で使用している。
1バイトの文字コードとしてはASCIIが世界標準となっているが、一部の大型コンピュータではIBM社のEBCDICを使うものもある。
日本語の文字コードは、JIS(日本工業規格)で標準化されたJISコードの他、主にUNIXなどで使われるEUC、WindowsやMac OSなどで使われるシフトJISの3種類が利用されている。
最近では、世界のほとんどの主要な言語をサポートした2バイトの統一文字コード体系であるUnicodeの規格化が進み、一部で利用が始まっている。
Unicodeはこれまで各国でばらばらに制定されてきた文字コードを統一するものとして期待されているが、普段アルファベットしか使わない欧米の情報技術関連企業を中心に規格化が進んだこともあり、数多くの文字を抱えるアジアの国々からは批判されている。