はじめに
前回は,
データ処理における並列性について
並列データベースをはじめとするデータ処理系は,
- 問い合わせ間の並列性
(Inter-Query Parallelism) - 問い合わせ内の並列性
(Intra-Query Parallelism)
問い合わせ間の並列性は,
一方,
問い合わせ間の並列性は,
問い合わせ内の並列性
問い合わせ内の並列性は,
- オペレータ間の並列性
(Inter-Operator Parallelism) - オペレータ内の並列性
(Intra-Operator Parallelism)
オペレータ間の並列性は,
- パイプライン並列性
(Pipelined Parallelism) - 独立並列性
(Independent Parallelism)
パイプライン並列性
一方,
ここまで出てきた並列性を次にまとめておきます。
- 問い合わせ間の並列性
(Inter-query Parallelism) - 問い合わせ内の並列性
(Intra-query Parallelism)
- オペレータ間の並列性
(Inter-operator Parallelism)
- パイプライン並列性
(Pipelined Parallelism) - 独立並列性
(Independent Parallelism)
- オペレータ間の並列性
- オペレータ内の並列性
(Intra-operator Parallelism)
- パーティション並列性
(Partitioned Parallelism)
- パーティション並列性
次回以降は,
データの分割方法
データ処理において用いられるデータの分割方法には,
- ラウンドロビン分割
(Round-Robin Partitioning) - ハッシュ分割
(Hash Partitioning) - 範囲分割
(Range Partitioning)
ラウンドロビン分割
ラウンドロビン分割を用いて格納されたデータにおいては,
また,