日本オラクル/オラクル、MySQL HeatWave MLを発表 – 開発者が簡単、迅速、経済的に利用可能なMySQL アプリケーション向けの強力な機械学習機能を提供

  • このエントリーをはてなブックマークに追加

「HeatWave ML」で、モデルのトレーニング、推論、説明を完全に自動化

オラクルは本日、「Oracle MySQL HeatWave(https://www.oracle.com/mysql/heatwave/)」が、従来提供しているトランザクション処理とアナリティクスに加えて、インデータベース機械学習(ML)に対応することを発表しました。この機能を提供するMySQLクラウド・データベース・サービスは、唯一「Oracle MySQL HeatWave」のみです。「MySQL HeatWave ML」はMLライフサイクルを完全に自動化し、トレーニング済みのすべてのモデルをMySQLデータベース内に格納し、データやモデルを機械学習ツールやサービスに移動する必要はありません。ETL(データの抽出、変換、書き出し)を不要とすることで、アプリケーションの複雑さを軽減し、コストを削減し、データとモデルの両方のセキュリティを向上させることができます。「HeatWave ML」は、37の「Oracle Cloud Infrastructure(OCI)」リージョンで利用可能な「MySQL HeatWave」データベース・クラウド・サービスに含まれます。
News Release Summary
(本資料は米国2022年3月29日にオラクル・コーポレーションより発表されたプレスリリース(https://www.oracle.com/news/announcement/mysql-heatwave-supports-in-database-machine-learning-2022-03-29/)の抄訳です)

オラクル、MySQL HeatWave MLを発表 開発者が簡単、迅速、経済的に利用可能なMySQL アプリケーション向けの強力な機械学習機能提供

「HeatWave ML」で、モデルのトレーニング、推論、説明を完全に自動化

「HeatWave ML」はAmazon Redshift MLの1パーセントのコストで25倍高速な処理を可能に

2022年3月30日

オラクルは本日、「Oracle MySQL HeatWave(https://www.oracle.com/mysql/heatwave/)」が、従来提供しているトランザクション処理とアナリティクスに加えて、インデータベース機械学習(ML)に対応することを発表しました。この機能を提供するMySQLクラウド・データベース・サービスは、唯一「Oracle MySQL HeatWave」のみです。「MySQL HeatWave ML」はMLライフサイクルを完全に自動化し、トレーニング済みのすべてのモデルをMySQLデータベース内に格納し、データやモデルを機械学習ツールやサービスに移動する必要はありません。ETL(データの抽出、変換、書き出し)を不要とすることで、アプリケーションの複雑さを軽減し、コストを削減し、データとモデルの両方のセキュリティを向上させることができます。「HeatWave ML」は、37の「Oracle Cloud Infrastructure(OCI)」リージョンで利用可能な「MySQL HeatWave」データベース・クラウド・サービスに含まれます。

これまで、MySQLアプリケーションに機械学習機能を追加することは、多くの開発者にとって非常に難しく、時間を要するものでした。第一に、MLモデルの作成とデプロイのために、データベースからデータを抽出し、別のシステムに移すというプロセスがあります。このアプローチでは、アプリケーション・データに機械学習を適用するためのサイロが複数作られ、データが移動することによるレイテンシが発生します。また、データベースの外にデータが拡散し、セキュリティの脅威にさらされやすくなり、開発者が複数の環境でプログラミングを行う複雑さが増します。第二に、既存のサービスでは、開発者がMLモデルの学習プロセスをガイドするエキスパートであることがと求められます。そうでなければ、モデルは最適でなくなり、予測精度が低下してしまうからです。最後に、既存のMLソリューションのほとんどは、開発者が構築したモデルがなぜ特定の予測を実現するのかについて説明する機能を備えていません。

「MySQL HeatWave ML」は、機械学習機能をMySQLデータベース内にネイティブに統合し、データを別のサービスにETL処理する必要をなくすことで、これらの問題を解決しています。「HeatWave ML」は、学習プロセスを完全に自動化し、与えられたデータセットと指定されたタスクに対して、最良のアルゴリズム、最適な機能とハイパーパラメーターを持つモデルを作成します。「HeatWave ML」で生成された全てのモデルは、モデルと予測の説明を提供することができます。

このような高度なML機能を自社のデータベース・サービス内で直接提供するクラウド・データベース・ベンダーは他にありません。オラクルは、Numerai、Namao、Bank Marketingなど、利用可能な多数の機械学習分類および回帰データセットで実施したMLベンチマークを公開しています。最小のクラスターでは、平均して「HeatWave ML」はRedshift MLと比較して1%のコストで25倍速く機械学習モデルを学習させます。さらに、より大きな「HeatWave」クラスターで学習を行うと、Redshift MLに対する性能の優位性が高まります。学習は時間のかかる作業ですが、「MySQL HeatWave」では非常に効率的かつ迅速に行うことができるため、お客様はより頻繁にモデルを再学習させ、データの変更に対応することができるようになります。これにより、モデルを最新の状態に保ち、予測精度を向上させることができます。

オラクルのチーフ・コーポレート・アーキテクトであるエドワード・スクリーベン(Edward Screven)は次のように述べています。「アナリティクスとトランザクション処理を1つのデータベースに統合したのと同様に、今回は『MySQL HeatWave』内に機械学習機能を追加します。『MySQL HeatWave』は、オラクルで最も成長が著しいクラウド・サービスの1つです。多くのお客様がAmazonやその他のクラウド・データベース・サービスから『MySQL HeatWave』に移行し、大幅なパフォーマンス向上と低コストを実現しています。この他にも、『HeatWave』の機能強化、可用性の向上、低コストを実現するための多くのイノベーションを発表しています。透明性が確保された状態で新たに公開されたベンチマークの結果では、Snowflake、AWS、Microsoft、Googleが『MySQL HeatWave』よりも大幅に低速かつ高コストであることが示されています。」

「HeatWave ML」は、他のクラウド・データベース・サービスと比較すると、以下のような機能を備えています。
完全に自動化されたモデルのトレーニング: 「HeatWave ML」のモデル生成の各ステージは完全に自動化され、開発者の手を煩わせることはありません。トレーニングされたモデルはより正確で、手動での作業は必要なく、またトレーニングのプロセスが必ず完了することとなります。Amazon Redshiftなど他のクラウド・データベース・サービスはデータベース外の機械学習の機能と統合した上で、機械学習のトレーニングのプロセスを開発者が数多く手動で進める必要があります。

モデルと予測の説明: モデルの説明可能性は機械学習のモデルの挙動の理解のために役立ちます。例えば、銀行が顧客のローンを断る場合、モデルのどのパラメータが要因となったのか、またモデルにはバイアスがかかっていないかを特定できる必要があります。予測の説明可能性は、ある機械学習のモデルが特定の予測に影響した理由の理解に役立つ手法の集まりです。企業が機械学習のモデルから意思決定理由の説明を可能とするために、予測の説明可能性が重要となってきています。「HeatWave ML」はモデルと予測の説明をモデルのトレーニングのプロセスの一部として統合しています。結果として、「HeatWave ML」で生成された全てのモデルは、予測の説明時にトレーニング・データなしでモデルと予測の説明ができるようになっています。オラクルは既存の説明手法から性能、解釈可能性、および品質を改良しました。他のクラウド・データベース・サービスでは、全ての機械学習のモデルに対するこれほど高度な説明可能性を提供していません。

ハイパーパラメーターのチューニング: 「HeatWave ML」はハイパーパラメーターのチューニングに勾配降下法に基づくアルゴリズムを採用しています。これによりモデルの精度に影響を与えることなくハイパーパラメーターの探索を可能としています。ハイパーパラメーターのチューニングは機械学習のモデルのトレーニングの工程において最も時間のかかるステージとなっており、この独特の仕組みは、機械学習のモデルを生成する他のクラウド・サービスに対して圧倒的な性能の高さを「HeatWave ML」にもたらします。

アルゴリズムの選択: 「HeatWave ML」では、これは複雑なモデル全体の特性を表すシンプルなモデルであるプロキシ・モデルの概念を採用して、トレーニングに用いる最適な機械学習のアルゴリズムの決定に利用しています。シンプルなプロキシ・モデルを利用することで、正確性を失うことなく非常に効率的にアルゴリズムの選択ができます。他のデータベース・サービスではこのプロキシ・モデルによる機械学習のモデル生成の仕組みはありません。

インテリジェントなデータのサンプリング: モデルのトレーニングにおいて、「HeatWave ML」は性能向上のためにデータのわずかな部分をサンプリングします。このサンプリングが対象のデータセットの中で全ての特徴的なデータ・ポイントを収集する形で実行されます。機械学習のモデルを生成する他のクラウド・サービスは、データをランダムにサンプリングするという非効率な方法を採っています。データの分散傾向を考慮せずにデータの一部分をサンプリングという方法です。

特徴選択: 予測の作成に用いられる機械学習のモデルのふるまいに影響する訓練データの選択に特徴選択は役立ちます。特徴選択のために「HeatWave ML」で用いられる手法は、複数の分野やアプリケーションの広範なデータセットに対してトレーニングされてきました。ここから得られた統計やメタ情報は、新しいデータセットに対して「HeatWave ML」が効率的に関係する特徴を特定することを可能としています。

オラクルは、機械学習機能に加えて、「MySQL HeatWave」サービスのさらなる革新的な機能を提供開始しました。リアルタイムの伸縮性により、お客様はダウンタイムや読み取り専用時間なしで「HeatWave」クラスターのノード数を自由に増減できます。クラスターを手動でリバランスする必要もありません。 データ圧縮により、ノードあたり2倍多くのデータを処理できるようになります。同じコスト効率が維持され、コストはほぼ半減されます。新しい一時停止/再開機能は、「HeatWave」を一時停止してコストを節約できるようにします。再開時は、「MySQL Autopilot」に必要なデータと統計情報が自動的に「HeatWave」内にリロードされます。

お客様企業、パートナー企業およびアナリストのコメント
コンシューマ向けゲーム機やスマートデバイス用ゲームの企画・開発・販売を行うジニアス・ソノリティ株式会社 取締役 最高技術責任者 川本 昌之 氏は次のように述べています。「『MySQL HeatWave』を導入したおかげで、想定の最大90倍もの高速化を実現し、リアルタイム分析を毎時間行うことができます。プログラム開発の負荷や事前に検証した想定処理時間では実現不可能と思っていたので、本当に驚きです。この高い性能により、世界中のユーザーが楽しめるゲーム体験提供やサービス向上に継続的に取り組んできます。」

Astute Business Solutionsは、Oracle Cloud MSP Partnerの一社です。同社の共同創設者兼CEOであるArvind Rajan氏は次のように述べています。「最近当社では、『HeatWave ML』の機械学習機能を利用する機会に恵まれました。非常に革新的で、使いやすく、高速であり、そして何よりも重要なのは、データやモデルがデータベースの外に出ることがないため、安全であることがわかりました。インデータベース機械学習の提供は、当社のお客様の大きな関心事であり、『MySQL HeatWave』の採用をさらに加速させるものと考えています。」

Estuda.comは、高校生以下を対象とするテストを提供しているブラジルの教育SaaSプロバイダーです。Estuda.comの共同創設者兼CTOであるVitor Freitas氏は次のように述べています。「『MySQL HeatWave』はGoogle BigQueryとの比較で、当社の複雑なクエリの性能を秒あたりの応答で300倍向上させました。コード変更もなく、コストは85%になりました。現在では、300万人規模のユーザーにリアルタイム・アナリティクスを提供し、生徒たちの成績向上のためのアプリケーションを継続的に向上させることができるようになりました。」

VRGlassは、ブラジルの企業クライアント向けメタバース・アプリおよび機器のSaaSプロデューサーです。同社のCEOであるOhmar Tacla氏は次のように述べています。「『Oracle for Startup』プログラムで実現した成果がきっかけで、VRGlassはすべてのデータをAWS EC2から『MySQL HeatWave』に移行しました。訪問者数100万人以上、セッション数170万以上の仮想イベントのデータベース性能を3時間以内で5倍に引き上げることができました。また、セキュリティは強化され、コストは半減されました。」

Neoveraは、20年以上にわたってマネージド・サイバーセキュリティ・ソリューションを提供している信頼できるプロバイダーです。同社のシニア・オラクル・データベース・アーキテクトであるArman Rawls氏は次のように述べています。「OCIの『MySQL HeatWave』により、オンプレミスのMySQLデータベース環境との比較でクエリ性能は300倍向上し、TCOは80%削減されました。リアルタイムの分析レポートが当社のOLTPデータベース内で得られるようになり、セキュリティ・アプリケーションの強化を加速させることができます。」

IDCのデータ管理ソフトウェア担当リサーチ・バイスプレジデントであるCarl Olofson氏は次のように述べています。「オラクルは、昨年8月に『MySQL HeatWave』のAutopilotを発表しました。これはその時点で、オープンソース・クラウド・データベースの過去20年で最大のイノベーションであると考えられました。オラクルは、『MySQL HeatWave ML』によって最初のHeatWaveへのOLTPとOLAPの統合以上のことを成し遂げました。機械学習のすべての処理とモデルをデータベース内に取り込むことで、顧客企業はコア・データベースとは別にMLデータベースを管理する必要がなくなり、ETL、速度、精度、コスト効率などの追求で苦労する必要もなくなります。」

参考リンク
・Oracle MySQL HeatWave https://www.oracle.com/mysql/heatwave/
・ベンチマークの詳細 https://www.oracle.com/mysql/heatwave/performance/
・MySQL HeatWave ML テクニカル・ホワイトペーパー https://www.oracle.com/a/ocom/docs/mysql/mysql-heatwave-ml-technical-brief.pdf
・ジニアス・ソノリティ株式会社Oracle MySQL HeatWave事例発表プレスリリース https://www.oracle.com/jp/news/announcement/genius-sonority-oracle-mysql-heatwave-database-2022-03-30/

*ベンチマーククエリはTPC-DSベンチマークから派生したものですが、TPC-DSの仕様に準拠していないため、公開されているTPC-DSベンチマークの結果とは比較はできません。

オラクルについて
オラクルは、広範かつ統合されたアプリケーション群に加え、セキュリティを備えた自律型のインフラストラクチャをOracle Cloudとして提供しています。オラクル(NYSE:ORCL)に関するより詳細な情報については、https://www.oracle.com/index.html をご覧ください。

商標
Oracle、Java及びMySQLは、Oracle Corporation、その子会社及び関連会社の米国及びその他の国における登録商標です。文中の社名、商品名等は各社の商標または登録商標である場合があります。本文書は情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。

 

 

注目記事:MVNOとは?初心者にもわかりやすく解説 「本当に安くなるの?」

  • このエントリーをはてなブックマークに追加

SNSでもご購読できます。