OSSデータベース取り取り時報

第88回MySQL HeatWaveのSLAとスペック、PostgreSQL Conference Japan 2022とProject Tsurugi情報

この連載はOSSコンソーシアム データベース部会のメンバーがオープンソースデータベースの毎月の出来事をお伝えしています。

[MySQL]2022年11月の主な出来事

2022年11月のMySQLの製品リリースはありませんでした。クラウド版のMySQLであるMySQL HeatWave Database Serviceでは、OCI上でのサービスレベル合意(Service Level Agreement:SLA)が発表されました。

  • 米国AshburnなどADが3つのリージョン:99.99%の可用性
  • 東京や大阪などADが1つのリージョン:99.95%の可用性

こちらは高可用性構成を選択した場合のSLAです。高可用性構成ではないスタンドアロン構成の場合は全てのリージョンで99.9%となります。詳しくはOCIのSLAのドキュメントをご確認ください。

OCI上のMySQL HeatWaveの対応シェイプ(スペック)

OCIではVMやベアメタルマシンの構成のことをシェイプと表現します。現在MySQL HeatWave Database ServiceではAMDのCPUベースのE3とE4, IntelのCPUベースのX7とX9が利用可能です。利用可能なシェイプの一覧は、リファレンスマニュアルおよびMySQLのブログに掲載されています。

分析エンジン兼機械学習エンジンのHeatWaveを利用する際には、特定のシェイプでMySQLサーバーのインスタンスを作成する必要があります。当初はE3のシェイプのみが利用可能でしたが、11月からはE4のシェイプが選択できるようになりました。

  • MySQL.HeatWave.VM.Standard.E3(CPU E3 16コア、メモリ512GB)
  • MySQL.HeatWave.VM.Standard(CPU E4 16コア、メモリ512GB)
  • MySQL.HeatWave.BM.Standard.E3(CPU E3 128コア、メモリ2TB)
  • MySQL.HeatWave.BM.Standard(CPU E4 128コア、メモリ2TB)

BMはベアメタルマシンで、分析対象データが10TBを超える場合はこちらのシェイプを利用することが推奨されています。同様にHeatWaveノードもE4がベースのMySQL.HeatWave.VM.Standardが選択できるようになっています。

[PostgreSQL]2022年11月の主な出来事

PostgreSQL Conference Japan 2022がコロナ禍に負けずに今年もオンサイト(会場)にて開催されました。今回はこの報告を中心にお知らせします。その前に、PostgreSQLの最新のマイナーバージョンアップのお知らせからお伝えします。

PostgreSQL 15.1、14.6、13.9、12.13、11.18、10.23 がリリース

11月10日、リリースされたばかりでこの連載の前回にお知らせしたPostgreSQL 15を含むサポートされているすべてのバージョンのマイナーバージョンアップがリリースされました。今回のアップデートでは、過去数か月間に報告された 25 を超えるバグが修正されています。詳しくはリリースのお知らせを参照してください。

なお、PostgreSQL 10については今回が最終のリリースになります。

今年もPostgreSQL Conference Japan 2022がオンサイトで開催

11月11日はポッキー&プリッツの日だそうですが、日本PostgreSQLユーザ会(JPUG)のカンファレンスイベントであるPostgreSQL Conference Japan 2022が東京・日本橋の会場に多くのエンジニアを集めて開催されました。このイベントは2020年も2021年も途絶えることなく会場開催が実現できていますので、関係者の皆さんの行いがよほど良いのでしょう。今年もJPUGのロゴ入りマスク(3世代目)が配布されました。

カンファレンスは午前の基調講演と、午後は3つのトラックに分かれて技術発表とチュートリアルが設けられました。その中から皆さんに知って欲しいと思った発表をピックアップします。

国産RDB 劔について

ノーチラス・テクノロジーズの神林飛志さんによるProject Tsurugi(劔)の発表です。Project TsurugiとはオープンソースのRDBとして開発が進んでいるプロジェクトです。この連載とOSSコンソーシアムでは以前からこのプロジェクトに注目してきました2019年5月の第45回2021年12月の第75回⁠。プロジェクトは成果公開までカウントダウンの佳境に入りましたので、今回は少し詳しめに報告します。

神林さんによるProject Tsurugiの講演の様子
神林さんによるProject Tsurugiの講演の様子

プロジェクトの発端は、トランザクション処理のミドルウェアなどをやっているデータベース関係のメンバが集まった勉強会の中で、多数のCPUコア(メニーコア)と大容量メモリを使い切れるRDBが世の中に存在しないので、じゃあ有志で開発しようかという話が盛り上がったことがきっかけとのこと。その後、NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)が募集するプロジェクトに応募して採用され、いわゆる国プロとして活動中です。ここまで約4年間活動をして来て、2023年3月にいよいよ成果を公開する予定になっています。

新たに開発している画期的なTsurugiのデータベースエンジンですが、Tsurugiを呼び出すインタフェースのひとつとしてPostgreSQLが使われます。また、PostgreSQLから実行する以外に、独自のAPI経由での呼び出しや、Key-Valueストア(KVS)として使う方法も用意されています。

表面的にはPostgreSQLであるならば、PostgreSQLも機能と性能の両面で大きく向上しつつあるのでPostgreSQLを使えばいいのにという意見があるかもしれません。なぜTsurugiを新たに開発する必要があるのだろうかと。一言でまとめると、PostgreSQLを含む現存するデータベースのエンジンは「モダンアーキテクチャに対応できていない」ということになります。まずはこの点から説明します。

Tsurugiの技術面の特徴は、上記の様に多数のCPUコア(メニーコア)と大容量のメモリが使えるようになっていることです。Tsurugi以外の現存するデータベースではメニーコアの潜在能力を性能向上に活かせていません。これは現状のPostgreSQLも同様です。特に書き込み処理の性能に課題があります。その達成のために、トランザクションの分離性(アイソレーションレベル)はシリアライザブル(直列可能分離レベル)のみにしています。これまでのデータベースで当たり前のように行われている排他制御としてのロック処理を排除しています。この基本的な制御の方式であるシリアライザブルがどういうものなのか分かっていないと使いこなすことができないデータベースになっています。

主なターゲットはHTAP(Hybrid Transaction/Analytical Processing)で、トランザクション処理と分析処理の両立です。業務システムっぽい書き方をすると、オンライン処理を止めずに、同時にバッチでデータ処理も可能になります。これを実現するのはかなりたいへんなことです。⁠シリアライザブルではないHTAPでは、リアルタイムに近づけようとすればするほどデータが使い物にならなくなってしまう」とのこと。

プロジェクトではデータベースエンジン自体の開発の他に、適した分野へのアプリケーション開発も進められていて、5つの事例が紹介されました。ちょっと面白いと感じたので詳しめに紹介します。

1つめがオンラインを稼働させながらバッチ処理を高速化するアンデルセン(パンの製造販売を行う企業)での取り組み。2つめがテレコム系での請求処理計算への適用。この二つはオンライン処理とバッチ処理の共存のわかりやすい例でしょう。

3つめはLiDAR(Light Detection And Ranging)の点群データを使って公共交通機関の駅などでの人流と混雑度を計るケース。監視カメラ映像でもできますが、それだと人の顔が映ったデータの扱いが厄介になる課題があります。とくに公共施設の場合には個人を特定することなく混雑状況を見たい要望が大きくなり、LiDARの活用がとてもマッチする様です。ただ、意外だったのですがLiDARによるデータの方がずっとデータ量が増えてしまうために、膨大なデータを高速に書き込む処理を実現できる必要があったとのことです。

4つめは災害対策向けの事例です。オブリークカメラ(航空写真で垂直写真に加えて斜め写真も撮影してそれらを合成できるもの)の画像データ処理に採用する試みが進行中とのこと。

最後の5つめとして、国立天文台での天文データへの応用が紹介されました。まずはSpark(OLAP)で始めていて、これにTsurugiのOLTPを組み合わせているとのことです。扱うのは超新星爆発と彗星データとのことです。Tsurugiによるデータ処理が、画期的な科学的発見につながってくれるのが楽しみです。

さて、⁠TsurugiをRDBと呼ぶのが適当なのか?」という議論は関係者の中にある様です。むしろ超高速なKVS(Key-Value Store)であって、それを一貫性を担保してSQLを使える様にしているというのが正しい説明の仕方なのではないかと。これは一般にはNewSQLといわれるカテゴリなのかもしれないと話されていました。ただ、これはTsurugiに限ったことでは無く、昨今のデータベースエンジンは改善・向上されるにつれてRDBの枠には収まらなくなってきているのが実状だと感じます。

繰り返しになりますが、Project Tsurugiは2023年の2〜3月にTsurugi本体のα版を公開し、このα版を使ったPoCを支援するための商用サポートも開始する準備を進めているとのことです。その後にGA版に向けた改善も続けられ、解説する書籍の準備もされているとのことです。

カンファレンスで発表されたProject Tsurugiのほんの一部だけを紹介してきましたが、プロジェクトは学術研究からデータベースエンジンの実装やアプリケーション開発にまで多岐にわたりますのでその全容をお伝えしきれません。これまでも経過報告会としてプロジェクト成果を説明する機会が設けられていましたので、詳しい情報をお知りになりたい場合は過去の経過報告会の発表資料をご覧いただくのがよいでしょう(ご参考:Project Tsurugi(劔)ユーザー会 兼 経過報告会2021⁠。

pg_ivm: マテリアライズドビューを高速に更新するためのPostgreSQL拡張モジュール

SRA OSSの長田悠吾さんの発表で、日本のエンジニアがPostgreSQLの機能向上に大きく寄与している事例の1つです。

マテリアライズドビューをリアルタイムで高速に更新する機能としてPostgreSQL本体に組み込むことを目標に開発しているのがIVM(Incremental View Maintenance)ですが、これを拡張機能として切り出すことで、リリース済みのPostgreSQLでも利用可能になったり、IVMへの理解やフィードバックが得られることが期待できるのが、拡張モジュールとしての「pg_ivm」になります。この連載ではPostgreSQLエンタープライズ・コンソーシアム(PGECons)の成果報告会で紹介をされたときに報告をしていました。今回のカンファレンスでは技術的な解説も含めて詳しく説明がされていました。なお、今回の発表資料についてはSRA OSSのWebサイトですでに公開されていますので、そちらをご覧いただくのをお薦めします。

2022年12月以降開催予定のセミナーやイベント、ユーザ会の活動

オープンソースカンファレンス 2023 Online

日程 〔Online Osaka〕2023年1月28日(土)10:00~18:00
〔Online Spring〕2023年3月10日(金⁠⁠・11日(土)10:00~18:00
場所 オンライン開催(ZoomおよびYouTube Live)
内容 オープンソースカンファレンスは、オープンソースの「今」を伝える総合イベントとして、東京だけでなく、北は北海道、南は沖縄まで全国各地で開催しています。2020年の春以降はオンラインでの開催となっています。今後の開催予定は2023年1月のOnline/Osakaと、3月のOnline/Spring(全国大会の位置づけ⁠⁠ です。
主催 オープンソースカンファレンス実行委員会

OSS-DB Exam Silver 技術解説セミナー

日程 2022年12月4日(日)13:00~14:15
2023年1月21日(土)13:00~14:15
場所 オンライン開催(Zoomウェビナー)
内容 OSS-DB Exam Silverの出題範囲からの解説を行うセミナーですが、12月4日の回では運用管理の「標準付属ツール」をテーマに解説、1月21日の回では運用管理から「基本的な運用管理作業」について解説します。
主催 特定非営利活動法人LPI-Japan

脱Oracleを実現!EDBの基本サービスと無料移行診断ツールの使用法をシンプルに解説

日程 2022年12月7日(水)10:00~10:30
2022年12月20日(火)10:00~10:30
場所 オンライン開催(Zoomウェビナー)
内容 EDBを全く / あまり知らない方を対象にして、DB移行検討の第一歩目となるEDBの診断ツール Migration Portal の使用法について解説します。両日ともに同じ内容です。
主催 エンタープライズDB株式会社

第37回 PostgreSQLアンカンファレンス@オンライン

日程 2022年12月20日(火)20:30~23:00
場所 オンライン開催
内容
  • 初心者による「使ってみた/動かしてみた」
  • 中級者による「こういうノウハウ使ってる」
  • 上級者(?)による「こういう拡張してみた」
その他、PostgreSQLに関連する話題であれば何でもOK!アンカンファレンス形式なので、何が出るかは当日参加してのお楽しみ。
主催 PostgreSQLアンカンファレンス

MySQLテクノロジーセミナー スペシャルエディション “Facebook & MySQL”

日程 2022年12月2日(金)18:00~19:30
場所 日本オラクル株式会社 セミナールーム
内容 MySQL株式会社のコンサルタントで現在はFacebookのオンライン・データベース技術スタックのプロダクション・エンジニアとして活躍されている松信さんによる特別講演です。今回はFacebookにおけるMySQL 5.6から8.0へのバージョンアップの全貌をご紹介いただきます。なお本イベントは日本オラクルのセミナールームにて開催いたします。オンラインでの配信およびイベントの模様の動画公開はございませんのであらかじめご了承ください。
主催 日本オラクル株式会社 MySQL Global Business Unit

MySQLサーバーを守るセキュリティの5つのポイント

日程 2022年12月8日(木)16:00~17:30
場所 オンライン(Zoom)
内容 データはどの企業や組織にとって最も重要な資産の1つです。特にデータベースには機密情報が多く格納させていることもあり、多様な攻撃の標的となり得るため確実な対策が必須となっています。データベースに対する攻撃は外部からとは限らず、組織の内部の者である可能性もおおいにあります。このウェビナーではMySQLが提供するデータベース監査や暗号化、マスキングなどの包括的なデータ保護を主に5つのポイントから解説していきます。
主催 日本オラクル株式会社 MySQL Global Business Unit

これが本当のマルチクラウド Oracle の商用版MySQLとHeatWaveをAWS上で利用する。最適なサービスのみを選択する時代へ

日程 2022年12月15日(木)16:00~17:30(予定)
場所 オンライン(Zoom)
内容 AWS上で動作する「MySQL HeatWave on AWS」のアーキテクチャや利用方法を解説するウェビナーです。
主催 日本オラクル株式会社 MySQL Global Business Unit

MySQL Autopilotが実現するデータベース管理の自動化

日程 2022年12月21日(水)16:00~17:30(予定)
場所 オンライン(Zoom)
内容 MySQL Autopilotが機械学習を活用してデータベースの運用自動化や運用負荷の軽減を実現する機能です。MySQL Autopilotにはデータベースの負荷に応じた最適なスペックの提案やデータロード時の並列度の自動調整、さらにはクエリ実行時の最適化などが含まれます。MySQL HeatWave Lakehouseでのロード対象のデータにする高効率のサンプリングやデータ型の推論を行った上でのテーブル構造のDDLの自動生成もMySQL Autopilotの一環です。このウェビナーではこれらのMySQL Autopilotの機能によるデータベース管理の自動化と運用効率化についてご紹介いたします。
主催 日本オラクル株式会社 MySQL Global Business Unit

新春恒例「MySQL 8.0 入門 チューニング基礎編、SQLチューニング編 2023」

日程 2023年1月12日(木)14:00~17:00(予定)
場所 オンライン(Zoom)
内容 毎年ご好評をいただいている新春恒例のMySQLパフォーマンス・チューニングセミナー。この1年で追加や変更になった機能も反映しさらにブラッシュアップ。MySQLのチューニング時に役立つさまざまな機能やチューニングの基礎知識を解説します。講師はMySQLのパフォーマンスチューニングに関する執筆も行った日本オラクルの稲垣大助が担当予定。MySQLをチューニングする時に役立つ様々な機能やチューニングの基礎知識を解説します。
主催 日本オラクル株式会社 MySQL Global Business Unit

おすすめ記事

記事・ニュース一覧