ScalarDB Cluster でベクトル検索をはじめよう
このページは英語版のページが機械翻訳されたものです。英語版との間に矛盾または不一致がある場合は、英語版を正としてください。
ScalarDB Cluster は、アプリケーションがベクトルストアと統一された方法で対話できるように、ベクトルストアの抽象化を提供します。このページでは、この機能の概要と、それがユーザーにとってなぜ有益であるかについて説明します。
ベクトルストアの抽象化とは何ですか?
ScalarDB Cluster は、リレーショナルデータベース、NoSQL データベース、NewSQL データベースなど、さまざまな種類のデータベースを抽象化するのと同様に、さまざまなベクトルストアの抽象化を提供します。このベクトルストアの抽象化を使用すると、ベクトルストアと統一された方法で対話するアプリケーションを開発できるため、アプリケーションは特定のベクトルストアの実装から独立し、移植性が確保されます。さらに、ベクトルストアとの統合は ScalarDB Cluster に組み込まれているため、アプリケーションは ScalarDB Cluster のスケーラビリティを活用できます。
ベクトルストアの抽象化の現在の実装は LangChain4j を活用し、次のベクトルストアと埋め込みモデルをサポートしています。
ベクトルストア:
- In-memory
- OpenSearch
- Azure Cosmos DB NoSQL
- Azure AI Search
- pgvector
埋め込みモデル:
- In-process
- Amazon Bedrock
- Azure OpenAI
- Google Vertex AI
- OpenAI
ベクトルストアの抽象化を使用する理由
生成 AI の時代において、大規模言語モデル (LLM) を導入する際に組織が直面する課題の1つは、これらのモデルが企業データを理解できるようにすることです。検索拡張生成 (RAG) は、特定の企業知識で LLM を強化するために使用される重要な手法です。たとえば、LLM を搭載したチャットボットが正確で適切な応答を提供できるようにするために、企業は RAG を使用してユーザーマニュアルやサポートドキュメントからドメイン固有の情報を統合します。
RAG はベクトルストアに依存しています。ベクトルストアは通常、データベースからデータを抽出し、そのデータをベクトルに変換してから、それらのベクトルをロードすることによって作成されます。ScalarDB Cluster でベクトルストアとデータベースの抽象化を使用すると、プロセス全体をシームレスに実装できます。このアプローチにより、ワークフローとコードが大幅に簡素化され、特定のベクトルストアとデータベースに依存する複雑なアプリケーションを作成する必要がなくなります。
追加の詳細
ベクター検索機能は現在、プライベート プレビュー中です。詳細については、お問い合わせいただくか、この機能が将来のバージョンで一般公開されるまでお待ちください。