アンケートご協力のお願いgihyo.jpでは,2010年度に向けて豪華プレゼントが当たる読者属性アンケートを実施しております。ご協力ください。

gihyo.jp » DEVELOPER STAGE » 連載 » SQLアタマアカデミー » 第6回 SQLで木構造を扱う~入れ子区間モデル (1)もしも無限の資源があったなら

SQLアタマアカデミー

第6回 SQLで木構造を扱う~入れ子区間モデル (1)もしも無限の資源があったなら

はじめに

前回では,入れ子集合モデルという,リレーショナルデータベースで木構造を扱うための新しい方法論を紹介しました。このモデルは,RDB,SQLと親和性の高い優れたものではあるのですが,挿入など更新時に,無関係のノードまで変更対象としなければならないのが大きな難点でした。

そこで今回は,上記の欠点を解消する進化版のモデルを紹介します。この方法を理解していく過程で,私たちはRDBと集合論の結び付きの深さを再確認することになります。

ふだんこの連載は,1回完結の読み切り形式なのですが,今回に限り,前号の内容を前提としています。未読の方は,前号を先に読むと理解が増すでしょう。

稼働環境
  • すべてのリレーショナルデータベース

もしも無限の資源があったなら

座標に整数のみを使う場合の限界

入れ子集合モデルの大きな欠点は,ノードを挿入(追加)するときに,自分より「右側」にある無関係なノードをもっと右へずらさなければならないことでした。前もってノード間に隙間を作って初期データを格納するという次善策もありますが,しょせんは一時しのぎです。このリソース枯渇の問題は,座標に整数を使う以上,原理的に不可避なものだからです。

そう,整数ならば,確かに,座標2と3の間にノードを追加しようと思ったとき,もう使える数はありません。手詰まりです。

有理数,実数にまで広げると

でも,もしこの小さな区間の間にも,利用できる点があったとしたらどうでしょう? たとえば,左端と右端の座標が2.3と2.7という小さな円ならば,まだ隙間に入れる余地があります(図1)。

図1 小数値の座標をとる円の挿入

図1 小数値の座標をとる円の挿入

実はノードの座標が整数でなければならない理由は別にないのです。今まで整数を使っていたのは,ただ11.298とか3.777とか半端な小数よりは見た目がすっきりしていて,モデルの骨子を説明するのに便利だから,という理由に過ぎません。むしろ,有理数や実数(有理数+無理数)にまで範囲を広げたほうが,使える資源がドーンと増えて便利です。

テーブルの再作成

そうと決まれば,まずはテーブルを作り直しましょう(リスト1)。左端と右端のデータ型の定義を,次のように実数型(REAL)にします(注1)。

リスト1 入れ子区間モデルによる木構造の表現

CREATE TABLE OrgChart
 (emp VARCHAR(32) PRIMARY KEY,
  lft REAL NOT NULL,
  rgt REAL NOT NULL,
    CHECK (lft < rgt));

初期データは,前回と同じく図2,3のような状態であるとします。

図2 初期データの状態

emp(社員名)lft(左端座標)rgt(右端座標)
足立114
猪狩23
上田413
江崎58
木島67
大神910
加藤1112

図3 初期データの入れ子集合による表現

図3
 初期データの入れ子集合による表現

追加するノードの座標を決めるアルゴリズム

さて,次に考える必要があるのは,追加するノードの座標を決めるアルゴリズムですが,これもとくに難しくはありません。挿入対象としたい区間の左端座標をplft,右端座標をprgtとすると,次の数式によって自動的に追加ノードの座標を計算できます。

  • 追加ノードの左端座標=(plft*2+prgt)/3 ― ⓐ
  • 追加ノードの右端座標=(plft+prgt*2)/3 ― ⓑ

なぜこれでうまくいくかというと,上記4つの座標について,必ず次の関係が成立するからです(図4)。

  • plft<(plft*2+prgt)/3<(plft+prgt*2)/3<prgt

図4 4点の大小関係はつねに成立する

図4 4点の大小関係はつねに成立する

理由は,すべての辺を3倍して比較してみればわかります。

  • 3plft<(plft*2+prgt)<(plft+prgt*2)<3prgt

今,定義によりplft<prgtです。従って,3plft<(plft*2+prgt)が成立します。あとの2辺の大小関係も同様に成立するので,区間にきちんと収まるように新しいノードを追加できることが保証されます。

注1)
厳密に言うと,利用する範囲は有理数に限られるのですが,「有理数型」というデータ型を持っているデータベースは存在しないので,実数型を使います。実数は有理数を包含するので問題ありません。

データを追加してみる

座標に整数のみを利用する場合(前回の方法)

これを,前回と同じ例で考えてみましょう。前回,猪狩氏(2, 3)の下に新たに部下の国見氏を追加したとき,猪狩氏の円を広げるために,無関係な方々の円を右へずらす必要がありました(図5)。

図5 整数だと,ノード追加のために無関係のノード位置をずらさなければならない

図5 整数だと,ノード追加のために無関係のノード位置をずらさなければならない

座標に有理数を利用する場合

しかし,座標に有理数を利用すれば,もうこんな大移動はする必要がありません。(2,3)の区間の中に国見氏の円を収められます(図6)。

国見氏の座標は,公式ⓐ,ⓑに従って次のように計算されます。

  • 左端座標=(2*2+3)=2.333…
  • 右端座標=(2+3*2)=2.666…

図6 有理数なら,既存ノードへの変更なし!

図6 有理数なら,既存ノードへの変更なし!

このように,座標の範囲を有理数へ広げることで,入れ子集合モデルの弱点であったノード追加時の更新処理を大きく軽減することが可能になるのです。挿入の対象とする区間は,この例のように円の「内部」でもかまいませんし,円と円の「隙間」でもかまいません。「ここに追加したい」と思う区間の左端と右端の座標を入力すれば,追加ノードの左端と右端の座標が自動的に計算されるのですから便利なものです(注2)。

注2)
ただし,追加ノードをリーフではなく親として挿入する場合は,持つことになる子供の円とぶつからないようにするため,もう少し計算が複雑になります。

著者プロフィール

ミック

SI企業に勤務するDBエンジニア。主にデータウェアハウス業務に従事している。自身のサイト「リレーショナル・データベースの世界」でデータベースとSQLについての技術情報を公開している。『Web+DB Press』で「SQLアタマアカデミー」を連載中。

著書:『達人に学ぶ SQL徹底指南書』(翔泳社、2008)訳書:J.セルコ『SQLパズル 第2版』(翔泳社、2007)

SQLアタマアカデミー:サポートページ

コメント

  • 入れ子区間モデル疑問点

    なぜ使用できる最大精度の整数型ではいけないのでしょうか。
    最初から座標間隔を莫大にとっておけば整数でも同じことができると思うのですが?

    Commented : #1  やすだ (2009/12/05, 07:57)

コメントの記入

パスサポ

多数の情報処理技術者試験対策書籍の発行実績を誇る技術評論社がお届けする,資格試験合格サイト「めざせ! 情報処理試験 パスサポ」が開設されました。

ピックアップ

サクセスストーリーに続く,快適サーバー運用管理のヒント!

データの増大,煩雑な管理,システムダウン,セキュリティなど,迫りくる課題からシステム管理者の負担を軽くするポイントを解説します。

gihyo.jp インフラエンジニア情報局

ネットワークやITにかかわるあらゆる業種で必要とされるインフラエンジニアに向けた技術情報や心構え,その魅力について多角的に紹介。

テストエンジニア ステーション

いま,ITに関わるあらゆる開発業務で注目されつつあるテスト系エンジニアをターゲットにしたコンテンツサイトを展開します。

一行クイックアンケート

gihyo.jpで取り上げてほしいネタは?

※検索はページ右上の検索ボックスをご利用ください。

その他の連載

読むウェブ ~本とインタラクション

ディスプレイで読む活字とそのインタラクション(interaction:相互作用)について,最新Webを紹介しながら読み解いていく。

いま,見ておきたいウェブサイト

この連載では,国内外の最新のウェブサイトを隔週更新で取り上げ,これら最新サイトの特徴や素晴らしい部分を,さまざまな角度から解説していきます。

Windows phoneアプリケーション開発入門

Windows Marcketplace for Mobileがサービス開始され,作成したアプリケーションを個人でも世界をターゲットに公開できる環境が整ってきました。これを機にWindows phoneアプリケーションの開発をしてみませんか?

ここは知っておくべき!Windows Server 2008技術TIPS

5年ぶりのサーバOSとなったWindows Server 2008が出荷されて早2年。2009年にはR2が出荷され,再び注目を集めています。発売前から実施したトレーニングによって感じた,インフラエンジニアの方々に知っておいていただきたい機能を中心にご紹介します。

キーパーソンが見るWeb業界

本連載はWeb Site Expert/gihyo.jpとの連動企画です。阿部淳也, 長谷川敦士, 森田雄のお三方による,Web業界をテーマにした座談会です。

きたみりゅうじの聞かせて珍プレー

ソフトウェア開発の現場で体験したトホホな失敗,思わずうなる珍プレーをきたみりゅうじ氏が四コママンガで紹介。みなさんからの投稿もお待ちしてます!

ActionScript 3.0で始めるオブジェクト指向スクリプティング

野中文雄氏が,簡単なスクリプトは書いたことがあるという初級者を対象に,ActionScript 3.0の基本からクラス定義までを解説します。

まだ間に合う「ITパスポート」受験対策 原山先生の短期合格塾

この連載では,4月18日のITパスポート試験の受験に向けて,短い期間で効率良く受験対策を行う方法や,確実に得点するための裏ワザなどを伝授していきます。

連載一覧

gihyo.jp

  • DEVELOPER STAGE
  • ADMINISTRATOR STAGE
  • WEB+DESIGN STAGE
  • LIFESTYLE STAGE
  • SCIENCE STAGE
  • NEWS & REPORT

書籍案内

  • 新刊書籍
  • 書籍ジャンル一覧
  • 書籍シリーズ一覧
  • 新刊ピックアップ
  • ロングセラー
  • 電脳会議

定期刊行物一覧

  • Software Design
  • WEB+DB PRESS
  • Web Site Expert
  • 組込みプレス