業界初、オラクルがレイクハウスのパフォーマンスをデータベースのクエリ性能と同等に
テキサス州オースティン – 2023年7月26日
(本資料は2023年7月20日にオラクル・コーポレーションより発表されたプレスリリースの抄訳です)
オラクルは本日、「MySQL HeatWave Lakehouse」の一般提供開始を発表しました。業界で初めて、データベース内データへのクエリと同等に高速なオブジェクト・ストレージ内データに対するクエリ実行を実現しました。「MySQL HeatWave Lakehouse」は、CSV、Parquet、他のデータベースからエクスポート・ファイルなど、オブジェクト・ストアのさまざまなファイル形式をサポートし、これらのファイルをMySQLデータベースのトランザクション・データと組み合わせることもできます。さらに、MySQLデータベースにデータをコピーすることなく、オブジェクト・ストア内のファイルに対して直接クエリを実行できます。その結果、「MySQL HeatWave Lakehouse」は、クエリ処理のスケーラビリティとパフォーマンス、データのロード速度、クラスタのプロビジョニング時間、オブジェクト・ストレージ内データのクエリ自動化において、新たな基準を打ち立てました。
オラクルのチーフ・コーポレート・アーキテクト、エドワード・スクリーベン(Edward Screven)は、次のようには述べています。「データの80%以上がファイル・システムに保存されており、この数値は増加しています。お客様は、さまざまな外部データを社内のトランザクション・データと統合して分析したいと考えていますが、処理が複雑すぎたり、コストがかかりすぎたりすることが問題となっていました。『MySQL HeatWave Lakehouse』は、より高速なクエリ性能とデータ・ロードをより低コストで提供し、お客様はオブジェクト・ストレージのデータとデータベースのデータを組み合わせて、価値あるリアルタイムのインサイトを容易に手に入れることができるようになります。」
データベース内データへのクエリと同等の高速なオブジェクト・ストレージ内データに対するクエリ
10 TB TPC-H*ベンチマークで実証されたように、「MySQL HeatWave Lakehouse」を使用したオブジェクト・ストレージ内の一般的なファイル形式のデータに対するクエリは、MySQLデータベース内のデータへのクエリと同じくらい高速に実行することができます。これを可能にするのは、「MySQL HeatWave」 の組み込み機能である「MySQL Autopilot」です。「MySQL Autopilot」は、機械学習ベースの自動化を提供し、クエリ実行からの学習により将来のクエリ実行計画を改善します。「MySQL Autopilot」は、他では見られない「MySQL HeatWave」独自のイノベーションです。「Oracle Cloud Infrastructure(OCI)」上の「MySQL HeatWave」は、AMD EPYC™プロセッサ上で稼働してしています。
AMDのデータセンター・ソリューションズ・ビジネス・グループ担当エグゼクティブ・バイスプレジデント兼ジェネラル・マネージャーであるForrest Norrod氏は、次のように述べています。「AMDと『MySQL HeatWave』のエンジニアリング・チームは緊密に協力し合い、『MySQL HeatWave』をAMD EPYCプロセッサ専用に最適化して、これらのプロセッサの新機能を活用しています。このコラボレーションにより、AMD EPYC CPUを搭載したOCIインスタンスで『MySQL Heatwave』を実行しているMySQLの顧客は、オブジェクト・ストレージに保存された膨大なデータのリアルタイム分析など、ビジネス・クリティカルなワークロードにおいてコストパフォーマンスの面で大きなメリットを享受することができます。」
レイクハウスのユースケースに最適なパフォーマンス
500 TB TPC-H*ベンチマークでは、「MySQL HeatWave Lakehouse」のクエリ性能が次のように実証されています。
-
Amazon Redshiftと比較して9倍高速
-
Snowflakeと比較して17倍高速
-
Databricksと比較して17倍高速
-
Google BigQueryと比較して36倍高速
「MySQL HeatWave Lakehouse」でオブジェクト・ストアからのデータをロードする際の性能は、以下の通りです。
-
Amazon Redshiftと比較して9倍高速
-
Snowflakeと比較して2倍高速
-
Databricksと比較して6倍高速
-
Google BigQueryと比較して8倍高速
「MySQL Heatwave」の比類のないパフォーマンスは、クラスタのプロビジョニング、データのロード、クエリ処理において大規模並列処理を可能にするスケールアウト・アーキテクチャによって実現されており、最大512ノードをサポートします。また、「MySQL Autopilot」の機能強化により、オブジェクト・ファイルのメタデータ生成が自動化され、基盤となるオブジェクト・ストレージのパフォーマンスに動的に適応できるようになり、すべてのOCIリージョンで最高のパフォーマンスを提供できるようになりました。
「MySQL Heatwave」は、トランザクション処理、リアルタイム分析、機械学習、データレイク・クエリ、機械学習ベースの自動化を、単一のMySQLデータベース・サービス内で提供する唯一のクラウド・サービスです。オラクルの分散クラウド戦略の中核となる「MySQL HeatWave」は、OCIのほか、Amazon Web Services、「Oracle Database Service for Azure」、および「OCI Dedicated Region」をご利用のお客様のデータセンター内でも利用可能です。
MySQL HeatWave Lakehouseに関するお客様、パートナー様、アナリストのコメント
Natura&Co.のソリューション・アーキテクト、Fabricio Rucci氏は、次のように述べています。「データは指数関数的に増加しており、データレイクに保存するデータ量も増加しています。MySQLの標準的な構文を使用して、データベースとオブジェクト・ストレージのデータをクエリし、リアルタイムのインサイトを得られることは、当社にとって非常に重要です。競合他社よりも高速にすべてのデータを分析することができれば、大きな競争力となります。」
Deloitte Consultingのクラウド・インフラストラクチャおよびエンジニアリング担当リーダー、Henry Tullis氏は、次のように述べています。「『HeatWave Lakehouse』は、その優れたスケールアウト機能により、オブジェクト・ストレージからのデータのロードとオブジェクト・ストレージでのクエリ実行を可能にしてくれます。データのサイズが大きくなり、それに応じてHeatWaveクラスタのサイズが大きくなっても、ロード時間とクエリ時間はほぼ一定です。データ管理のための『HeatWave Lakehouse』のこのスケールアウト機能は、非常に大量のデータを効率的に処理するためのカギとなります。」
Constellation Researchのバイス・プレジデント兼プリンシパル・アナリストであるHolger Mueller氏は、次のように述べています。「ビッグデータやレイクハウスのクエリがトランザクション・クエリよりも大幅に遅いことは、ビッグデータが登場して以来、周知の事実でした。MySQLのHeatWaveは、この問題に終止符を打ち、レイクハウスのパフォーマンスをトランザクション・クエリのパフォーマンスと同等にしてくれました。これは業界初の快挙です。クエリ・パフォーマンスが同等になることで、経営陣は、データの置き場所やクエリ方法について悩む必要がなくなります。これを可能にしてくれるのが、クエリを最適化するHeatWaveのAutopilotです。またしても、HeatWaveチームは「業界初」を成し遂げました。」
参考リンク
・LinkedIn オンデマンド:Edward ScrevenとAMDのForrest Norrod氏が語る、「MySQL HeatWave Lakehouse」 URL: https://www.linkedin.com/events/mysqlheatwavelakehouse-scale-ou7080595565201289216/about/
・動画:Nipun AgarwalとPradeep Vincentによる「Inside MySQL HeatWave Lakehouse on OCI(MySQL HeatWave Lakehouse on OCIの内側に迫る)」 URL: https://www.youtube.com/watch?v=qPRASkvmFMw
・テクニカル・ブログ:Announcing: MySQL HeatWave Lakehouse General Availability URL: https://blogs.oracle.com/mysql/post/announcing-mysql-heatwave-lakehouse-general-availability
・MySQL Heatwave移行プログラムの詳細 URL: https://www.oracle.com/jp/mysql/migration/
*免責事項:ベンチマーク・クエリはTPC-Hベンチマークに由来しますが、TPC-H仕様に準拠していないため、結果を公開済みのTPC-Hベンチマーク結果と比較することはできません。
オラクルについて
オラクルは、広範かつ統合されたアプリケーション群に加え、セキュリティを備えた自律型のインフラストラクチャをOracle Cloudとして提供しています。オラクル(NYSE:ORCL)に関するより詳細な情報については、https://www.oracle.com/jp/ をご覧ください。
商標
Oracle、Java、MySQL及びNetSuiteは、Oracle Corporation、その子会社及び関連会社の米国及びその他の国における登録商標です。NetSuiteは、クラウド・コンピューティングの新時代を切り開いたクラウド・カンパニーです。文中の社名、商品名等は各社の商標または登録商標である場合があります。本文書は情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。