はじめに
今回は文字列を扱う際には忘れてはならない文字コードについて,
US-ASCII
ASCIIは,
その後の多くの文字コードがASCIIのスーパーセットとして作られたため,
ASCII-8BIT
ASCII-8BITは
シフトJIS
シフトJISは日本でもっとも広く栄えた文字コードと言えるでしょう。しかし,
Shift_JIS
IANA Character Setsにpreferred MIME nameとして登録されている名前で,
Windows-31J
Windows 3.
Unicodeとの変換に際して,
MacJapanese
Mac OS 7.
日本語EUC
日本語EUCは,
日本語UNIXシステム諮問委員会は,
これをAT&T Unix Pacificが中国語や韓国語でも用いることができるように一般化したものがExtended Unix Code,
その後,
EUC-JP
IANA Character SetsではExtended_
ほぼ同じものがUI-OSF日本語環境実装規約 Version 1.
eucJP-ms
eucJP-msはTOG/
EUC-JPと文字集合としては同じですが,
CP51932
Windows Codepage 51932は、MicrosoftのInternet Explorerで