SQLアタマアカデミー

第10回結合大全 (2)内部結合

内部結合~何の「内部」なのか~

内部結合とは

内部結合inner joinは、一番よく使われる結合の種類です。ほとんどのSQLの参考書では、結合といえば最初に内部結合から話を始めるものです。構文についてはすでにご存じの方も多いでしょうが、一応ここで紹介しておきましょう。

今、図1の社員テーブルだけ見ると、社員の部署名はわかりません(わかるのは部署IDだけ⁠⁠。部署名を知るためには、部署テーブルの部署名(dept_name)列の情報を持ってこなくてはなりません。このときの結合キーはもちろん、どちらのテーブルにも存在している部署ID(dept_id)列になりますリスト2、図3⁠。

リスト2 内部結合を実行
SELECT E.emp_id, E.emp_name, E.dept_id, D.dept_name
  FROM Employees E INNER JOIN Departments D
    ON E.dept_id = D.dept_id;
図3 リスト2の実行結果
EMP_ID EMP_NAME DEPT_ID DEPT_NAME
------ -------- ------- ---------
001    石田     10      総務
002    小笠原   11      人事
003    夏目     11      人事
004    米田     12      開発
005    釜本     12      開発
006    岩瀬     12      開発

この結果と、先ほどのクロス結合の結果とを見比べたとき、何か気づくことはないでしょうか。実は、内部結合の結果は、そのすべてがクロス結合の結果の一部、つまり部分集合になっています図4⁠。

図4 内部結合の結果は必ずクロス結合の部分集合になる(クロス結合後の表内の網掛け部分が内部結合の結果)
EMP_IDEMP_NAMEDEPT_IDDEPT_IDDEPT_NAME
001石田1013営業
001石田1012開発
001石田1011人事
001石田1010総務
002小笠原1113営業
002小笠原1112開発
002小笠原1110総務
002小笠原1111人事
003夏目1111人事
003夏目1112開発
003夏目1113営業
003夏目1110総務
004米田1211人事
004米田1212開発
004米田1213営業
004米田1210総務
005釜本1212開発
005釜本1211人事
005釜本1210総務
005釜本1213営業
006岩瀬1211人事
006岩瀬1210総務
006岩瀬1213営業
006岩瀬1212開発

内部結合という語の由来はここから来ています。内部とは直積の部分集合の意味です。その証拠に、結合条件なしで内部結合を実行すると、その結果はクロス結合と完全一致します[2]⁠。

そのため、内部結合の演算を行うアルゴリズムとしても、クロス結合の結果に対して結合条件でフィルタリングをかける、という方法が最も単純です。ただし、実際にDBMSが内部結合を実行するアルゴリズムはこれとは異なります。理由は、先ほども触れたとおり、クロス結合の実行コストが並外れて高いためです。

内部結合と同値な相関サブクエリ

内部結合は、前回第9回で解説した相関サブクエリを使って代替可能なことが多くあります。たとえば、リスト2のコードを相関サブクエリで書き換えるとリスト3のようになります。

リスト3 リスト2を相関サブクエリで書き換えた例
SELECT E.emp_id, E.emp_name, E.dept_id,
       (SELECT D.dept_name
          FROM Departments D
         WHERE E.dept_id = D.dept_id) AS dept_name
  FROM Employees E;

これは最初見るときはちょっと驚く人が多いのですが、ロジックは見た目ほどトリッキーではありません。emp_id、emp_name、dept_idの3列は普通に社員テーブルから選択しているだけですので、肝心なのは部署名(dept_name)を選択している最後の列です。相関サブクエリの内部で結合条件を記述しているのですが、dept_idは部署テーブルの主キーですから、これで条件を指定すれば絶対にレコードが1行に定まります(これは主キーの定義です⁠⁠。したがって、この相関サブクエリは常にスカラサブクエリとして利用可能なことが保証される、というところがキーポイントです。

では内部結合と相関サブクエリとどちらを用いるのが良いか、という点ですが、基本的に結合で記述できる限りは結合を選択するのが良いでしょう。というのも、前号でも解説しましたが、相関サブクエリをスカラサブクエリとして使うとかなり高コストになり、パフォーマンスが悪いからです。

おすすめ記事

記事・ニュース一覧