画像検索の突破口:BIRSE
BIRSEは、BigGo比較ウェブサイトが導入した新しいサービスであり、情報検索における重要な進展です。従来の「画像検索」方法とは異なり、BIRSEは本質的には「画像検索」であり、テキストと画像を組み合わせるためのゼロサンプル学習モデルを利用しています。
新たな進展
BIRSEは生成ツールに基づいて構築され、ゼロサンプル学習モデルを利用して画像検索システムを作成します。よく知られているVision LLMと同様に、「画像理解」の能力を持ち、画像内の情報をさらに分析して、画像内のオブジェクトの意味に基づいて検索を実行することができます。
外観や色だけでなく、BIRSEはアイテムの素材やスタイルなど、同じ意味を持つ画像を見つけることができます。これにより、言葉で表現するのが難しい結果や他の画像検索方法では分析できない結果を表現する問題を解決します。
アプリケーションシナリオ
過去には、BigGoの検索エンジンを使用するには、キーワードを入力して検索し、価格を比較する必要がありました。ただし、特定の仕様を持つ製品の場合、キーワード検索がより適しています。例えば、コンピュータの部品や家電製品などです。一方、衣類、家具、ファッションアイテムなど、スタイルや素材が異なるオブジェクトを正確に検索することはより困難であり、言葉で説明するのが難しいです。
製品の方向性
もう一つの問題は、ファッションアイテムを検索する際には、インフルエンサーの画像データベースやコーディネート写真を見つけるのは簡単ですが、ショッピングプラットフォームを見つける割合は比較的低く、直接購入することができない場合があります。BIRSEの登場前には、他の画像検索方法も同様の機能を提案していましたが、その検索スケールと精度は特に優れていませんでした。BigGoのより大きなパラメータモデルと5億点のローカル製品情報を活用することで、BIRSEは関連アプリケーションの制約を打破し、ユーザーが理想の製品をより迅速に見つけるのを支援します。