文字列
今回はいよいよ文字列を扱います。文字列。最も多用されるデータ型でもあり,
> Swift ’s String and Character types provide a fast, Unicode-compliant way to work with text in your code. -- The Swift Programming Language
「SwiftのString
およびCharacter
型は,
- 注1)
- ScratchやPietのように画像として表記するプログラミング言語もないわけではありませんが。
A Brief History of Characters
文字列==文字の列。前世紀までは,
表1 文字列の扱いの歴史
Year | Event | Comment |
---|---|---|
1963 | EBCDIC | 初の文字コード規格 |
1963 | ASCII | 最も普及した文字コード規格 |
1969 | JIS X 0201 | 初の日本語文字コード |
1978 | JIS C 6226 (JIS X 0208) | かな漢字を含む文字コード |
1982 | Shift_ | |
1985 | EUC-JP | |
1991 | Unicode 1. | 現在のデファクトスタンダード |
1992 | UTF-8 | 拡張ASCIIとしてのUnicode |
1993 | ISO-2022-JP | 電子メールにおける標準日本語文字コード |
1995 | Java 1. | 16bit Character |
1995 | JavaScript 1. | |
1996 | Unicode 2. | サロゲートペア標準化 |
2000 | Python 2. | バイト列 != 文字列 |
2002 | Perl 5. | Unicodeを言語としてフルサポート |
2007 | Ruby 1. | |
2008 | Python 3. | UCS2事実上の廃止 |
2010 | Unicode 6. | 絵文字追加 |
2014 | Swift 1. | Version 1. |
0と1という2種類の数値しか根源的に扱えない電子計算機 往時のプログラマたちにとって幸いなことに, 文字とは1byteに収まるものであり, そのような時代が長いこと続きました。 その原則を破ったのが, その状況は, 最初に登場した段階におけるUnicodeは, その一方で, 我々にとって不幸だったのは, Han Unificationのような 私自身,
2byte文字の誕生と混乱
Unicodeの誕生
Unicodeの不幸
(16 + 1) *2**16 == 1,114,112
文字まで扱えるようになりました。そしてASCII互換性も,文字コード統一の奇跡