アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » BK通信 ―Bad Knowhow Tsushin― » #06 文字コードのバッドノウハウ[最終回]

BK通信 ―Bad Knowhow Tsushin―

#06 文字コードのバッドノウハウ[最終回]

ソフトウェアなどを使いこなすために,ストレスを感じながらもしぶしぶ覚えなければならないようなノウハウ,「バッドノウハウ」がテーマの本連載,最終回の今回は文字コードのBKを取り上げたいと思います。

文字コードとバッドノウハウ

文字コードは,Web開発を行う上で避けては通れない分野です。文字化けを起こさずに,コンテンツをブラウザに正しく表示させることはWeb開発の基本といえます。

しかしながら,文字コードには歴史的な紆余曲折がいろいろあり,膨大なバッドノウハウが人類の英知として蓄積されています。今回は,その膨大なるBKの一部を紹介したいと思います。

機種依存文字は滅びず

文字コードのBKといえば,機種依存文字の存在を忘れてはなりません。インターネットの世界では,古くから「①などの丸付き数字は機種依存文字だから使うな」といわれています。これらの文字はその昔「NEC特殊文字」と呼ばれ,Macとの相性が悪いことで知られていました。たとえば,「①」が含まれるテキストファイルをWindowsで作ってMacで開くと「(日)」と表示されるといった具合です(注1)。

この問題は最近ではどうなったのかと思い,調べてみました。まず,丸付き数字① ② ③を含むページをCP932という文字コード注2)で保存し,Macのブラウザで表示してみました。その結果,Firefox,Safariとも,問題なく丸数字を表示できました(図1・注3)。幸いなことに,最近のMacのブラウザではこの問題は解決しているようです。

図1 無事に表示されました

図1 無事に表示されました

次に,丸付き数字①②③を含むメールをISO-2022-JP(注4)という文字コードで送信し,MacのMailで受信してみました(注5)。結果はなんと...(図2)。

図2 見事に文字化け

図2 見事に文字化け

見事に文字化け。機種依存文字という言葉は最近あまり聞かなくなりすでに克服されていると思っていたのですが,まだまだ健在のようです。

注1)
機種依存文字についての詳しい解説が以下にあります。とくに,Appleの歴史は興味深い内容です。URL:http://mikeneko.creator.club.ne.jp/~lab/kcode/vendor.html
注2)
Shift_JIS を拡張して,NEC 特殊文字などを含めた文字コード。以下に詳しい解説があります。同じ文字が重複して登録されているなど,奥が深い文字コードです。たとえば,髙はEEE0 でもFBFC の2 つのコードを持ちます。
注3)
Mac OS X 10.5のSafari 3.0.4,Firefox 3.0.5 動作確認。
注4)
厳密にはISO-2022-JP はこれら文字を含みませんが,Windows 上の多くのメーラでは送ることができます。
注5)
Mac OS X 10.5のMail 3.5。

絵文字をめぐる混乱

携帯電話の世界では欠かせない絵文字,これも機種依存文字の一種といえます。各キャリアごとに使える絵文字が異なり,使われている文字コードも異なります。たとえば,太陽の絵文字を各キャリアのShift_JIS(注6)で扱うにはDoCoMoの場合F89F,auの場合F660,SoftBankの場合F98Bというコードになります(注7)。

さらに厄介なことに,SoftBankの一部の絵文字は「IBM拡張文字」との互換性にも問題があります。たとえば,名字に使われる「瀨」という文字はCP932ではFB50というコードが割り当てられていますが,SoftBankのShift_JISではFB50はショックを受けた顔文字になります(図3・注8)。

図3 瀨戸のホームページ! のはずが...

図3 瀨戸のホームページ! のはずが...

これらの混乱のため,ネット上には絵文字に関する膨大なBKが蓄積されています。PerlのEncode::JP::Mobileといった相互変換ライブラリや,Six Apartの自由に使える絵文字アイコン画像といった先人の成果により,絵文字の扱いはだいぶ楽になりつつあります。

また,最近ではUnicodeの専門家等によるemoji4unicodeプロジェクトが発足し,絵文字をUnicodeに追加する計画が進行しています。絵文字の混乱を鎮めるためにはまだまだ多くの労力が必要そうです。

絵文字の登場により,機種依存文字の悪夢が再びやってきた,といった感じでしょうか。

注6)各キャリアともに絵文字を追加した独自のShift_JISを定義しています。
注7)
絵文字にはほかにも,auの<img localsrc>やSoftBankの「Webコード」といった恐るべきBKがあります。興味のある方は調べてみてください。
注8)
SoftBank 913SHで動作確認しました。

著者プロフィール

高林哲(たかばやしさとる)

ソフトウェアエンジニア。バッドノウハウの研究,スルー力の探究,自転車置場の建設,Binary 2.0の布教などの活動を行っている。共著に『Binary Hacks』(オライリー 2006年)。ブログはhttp://0xcc.net/

著書

  • Binary Hacks ハッカー秘伝のテクニック100選

    Binary Hacks ハッカー秘伝のテクニック100選(オライリー・ジャパン)

コメント

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス