By Mufajjul Ali, Edwin Cheung, and Lindsey Alan
(この記事はAnnouncing Availability of Feathr 1.0の参考訳です。)
LFAI & Data Foundation Sandbox-Stage プロジェクトであるFeathrがOSS Feathr 1.0をリリースしました。Feathrは、エンタープライズ規模の特徴量ストアであり、本番環境での機械学習の特徴量の作成や特徴量エンジニアリング、利用を簡単に行うことができます。Feathrは多くの企業で特徴量のオンライン ストア、オフライン ストア、リアルタイム ストリーミングなどに使用されています。
このリリースは、Feathrが1年前にOSS化されて以降、エンタープライズ規模で機械学習プロジェクトを開発及び導入を容易にするための多くの新機能や強化を含んでいます。例として、オンライン データ変換や高速なサンドボックス環境、MLOPs V2アクセアラレーターの統合などがリリースされました。
DSLによるオンライン データ変換
特徴量エンジニアリングは、多くの機械学習のシナリオにおいて学習と推論の両方に必要です。これまでは、特徴量の生成はオンライン ストアへのアップロードの前に行う必要があるため、オンライン サービスが生成したデータを利用することは困難でした。また、オンライン サービスで生成されたデータを利用する場合、特徴量の生成をほぼリアルタイムで行う必要があります。このような場合には、機械学習モデルが推論を行う前に、ユーザーが推論したいデータに対して動的に変換を実行できる仕組みが必要です。新機能「DSLによるオンライン データ変換」は、ユーザーからの変換の要求に対しオンデマンドでデータを処理し応答するカスタム変更エンジンを利用することでこの問題を解決します。
この新機能では、EBNFに基づくDSL構文を使用して、変換ロジックを宣言的に定義することが可能です。また、PythonやJavaで書かれたユーザー定義関数 (user defined function: UDF) をサポートしており、独自の複雑な変換を作成することも可能です。
この宣言的なロジックは新しい高性能なDSLエンジンで実行されます。また、FeathrはAKSなどのコンテナ ベースの技術にこのサービスをデプロイするためにHELM Charを提供しています。私たちの内部のベンチマークでは、100K+/QPS 以上のパフォーマンスを発揮しました。
この変換エンジンは、HTTPサーバーとして独立に実行する機能がテスト用に提供されています。
feathrfeaturestore/feathrpiper:latest
さらに、オフライン変換用に定義されたデータ変換がある場合には、DSLファイルを自動で生成することも可能です。
詳細については、online transformation guideをご覧ください。
Sandbox入門
これは、機械学習を実行するためのインフラに精通していなかったり、インフラをクラウドに展開する方法に詳しくないデータ サイエンティストにとって、最高の機能です。Sandboxを用いることで、Feathrのすべての機能を簡単に使うことができます。これにより、本格的なインフラを導入することなくFeathrの様々な機能を迅速にプロトタイプ化することが可能です。Sandboxは、ユーザーがすぐに使い始めることができ、定義した特徴量の評価や新しいアイディアの検証が簡単になるよう設計されています。
Feathrプラットフォームを利用するためのJupyter notebook環境がデフォルトで付属しています。
また、データの特徴量やその流れ、その他の機能を視覚化するためのUXを使用することも可能です。
まずは、ローカル Sandboxの quick start guide to local sandboxをご覧ください。
MLOps V2 アクセラレーター
MLOps V2アクセラレーターを用いることで、パターン アーキテクチャに基づくモジュラー単位でのエンドツーエンドのアプローチをAzure上で実行することが可能です。今回のリリースでは、Feathrのクラシカル パターンへの初めての統合が行われます。これにより、Terraformベースのインフラ構築をAMLワークスペースにおけるプロビジョニングの一部として行うことができるようになります。
この統合により、エンタープライズ カスタマーがテンプレートを使用してCI/CDワークフローをカスタマイズし、組織内でエンドツーエンドのMlOpsを実行することができるようになります。
詳細については、Feathr integration with MLOps V2 deployment guideをご覧ください。
GUIの機能向上
GUIの使い勝手を向上させるため、さまざまな機能拡張を行いました。Feathr 1.0には、特徴量の登録や削除をするためのサポートやバージョンの表示、トップ メニューからの系統へのクイック アクセスなどが含まれています。
デモサイトでUXをお試しください。
次のステップ
Feathrの進化は始まったばかりです。このリリースは最初の一歩にすぎません。これからリリースされる多くのエンタープライズ向け機能の強化、セキュリティの向上、モニタリングの進化、コンプライアンス機能の向上、より豊かなMLOps体験にご期待ください。そして、Feathrに貢献するためには、こちらのガイドラインをご確認ください。まだFeathrのSlackチャンネルに参加されていない方は、こちらからご参加いただけます。
Feathr Key Links
LF AI & Data Resources
- LF AI & Dataのメンバーになるには
- LF AI & Dataのプロジェクト ランドスケープ
- わたしたちのプロジェクト
- イベントに参加する
- 最新のブログ記事
- メーリングリストを購読する
- TwitterやLinkedInでLF AI & Dataをフォローする
- LF AI & Data のGitHub や Wikiにあるその他のリソース
- LF Research調査レポート「OpenSearchの認知と理解に関するレポート」を公開 - 2024-12-11
- OpenSearchの認知と理解に関するレポート - 2024-12-10
- FINOS & LF Research 調査レポート「金融サービスにおけるオープンソースの現状 – 2024」を公開 - 2024-12-09