AIに「温故知新」ができないとき – ビジネスの現場における、コールドスタート問題の解決策
紀元前6世紀に孔子が語った「温故知新」という言葉は、2,500年の時を経て、現代に新たな意味を持つようになりました。過去の事柄を振り返り(=温)新しい知識や見解を得るというこの言葉は、人々の生き方を示すだけでなく、今では多くのAI(人工知能)や機械学習アプリケーションの基本原理をも説明しています。つまり、過去のデータから学習し、新しい状況にも柔軟に対応するという考え方です。
しかし、AIアプリケーションは人間とは異なり、知識を世代を超えて継承するわけではありません。あくまでプログラムであり、ある日突然稼働し始め、ゼロからデータを学びます。そのため、稼働初期には十分なデータがなく、期待される成果を出せないことがあります。これを「コールドスタート」と呼びます。
コールドスタートは機械学習における技術的な課題ですが、今回はビジネスの視点から、レコメンドエンジンを例にこのコールドスタート問題とは何かを説明し、その回避策についてご紹介します。
▲コールドスタート問題を解消して、「買いたい」という気持ちを温めよう
ビジネス環境で起こるコールドスタート問題
AIを活用したアプリケーションやサービスはさまざまですが、大半は「データの学習」を通じて未知の事象に対応するよう設計されています。例えば、あらかじめ「ネコ」や「イヌ」といったラベルが付けられた画像を学習し、未知の画像を認識する画像判別システムや、ユーザーの行動データを学習し、次に求めるアイテムを推測するレコメンドエンジンなどがあります。これらはデータがなければ正確な結果を提供することはできません。
画像判別システムの場合、動物画像などのデータセットで事前に十分学習させた後にシステムをリリースし、コールドスタート問題を回避することが可能です。しかし、企業が自社のECサイトで利用するレコメンドエンジンやパーソナライゼーションシステムの場合、顧客も商品も次々に入れ替わるため、過去のデータ以上に、“いま”の顧客行動データが重要になります。結果として、以下のようなコールドスタート問題が表面化します。
1. サイトの新規ユーザー(初回訪問ユーザー)は、閲覧・購買などの行動履歴が溜まっていないため、高精度のニーズが予測できず、レコメンドの質が低下する。
2. サイトに投入されたばかりの新商品や、ほとんど閲覧されていない“ロングテール商品”は、どのような顧客に見られ、買われているのかのデータが無いため、レコメンドされにくい。
問題1に関してご注意いただきたいのは、初回訪問者にまったくレコメンドができないということではないということです。例えば、行動履歴のない初回訪問ユーザーに対しても、「この商品を見ている人は、こんなものを買っています」というレコメンドを行うことはできます。また、シルバーエッグ・テクノロジーの提供するアイジェント・レコメンダーのように、リアルタイム行動分析機能を備えたシステムであれば、ユーザーがサイト内で次々と商品を見るたびに、レコメンド精度を段階的に上げていくことが可能です。
ただ、初回訪問者が、最初の商品を見ている場面は、ECサイトのカスタマージャーニーにおいてクリティカルなポイントです。最初に見た商品が気に入らないと、ユーザーは容易に離脱してしまいます。これを防ぐことができるのがレコメンドによる別商品の提案ですが、単に「この商品を見ている人には、こんなものを」というレコメンドにとどまらず、ユーザーの関心に沿ったバリエーション豊かな「別の商品」を提示することで、購入モチベーションを持ち続けてもらうことが、離脱率の低減、CVRの向上、そして顧客との長期的なエンゲージメントの創出につながります。
コールドスタートを緩和する方法
機械学習技術を用いたレコメンドエンジンを提供する企業は、初回訪問顧客の購買意欲を増価させたり、新商品のレコメンドをスムーズに行えるようにするために、様々なアプローチでコールドスタート問題の緩和に取り組んできました。精度の高い行動情報ベースのレコメンドと、ディープラーニングなどを使った別の手法を組み合わせることで、その取り組みは成果を上げつつあります。その例を紹介しましょう。
商品の特徴分析
商品の説明文や画像を解析し、似たものをレコメンドする手法です。解析にはディープラーニングなどの技術が使われます。精度の良いエンジンであれれば、たとえば「違うカテゴリーなのに、説明文などの傾向の似た商品」をレコメンドすることができます。一方で、画像解析のような技術はサイトの商品ごとに適切なチューニングしないと、精度が出ないことがあります。商品の入れ替えが起こると精度が下がる場合もあり、注意が必要です。シルバーエッグ・テクノロジーでは、大規模言語モデルを援用した画像解析技術で、精度の高いレコメンドを行うツールを開発し、提供しています。
行動と他の情報などの統合分析
ユーザー行動情報と、「現在の天気」「ユーザーの住んでいる地域」といった情報を統合して予測することで、ユーザー行動が少なくても、状況に即したレコメンドが可能になります。エンベディング、ディープラーニングなどの様々なテクニックを用い、異なるデータを統合分析することで実現します。この技術は商品の季節変動がある物販ECサイトなど、様々なビジネスモデルに応じてカスタマイズできることが強みですが、自社ビジネスモデルにおいてどんなデータが有効なのかを慎重に定め、適切なテストを繰り返して実効性を確認する必要があります。レコメンドエンジンの提供事業者とは、事前にニーズのすり合わせなどをよく行っておきましょう。
検索ワードやカテゴリーに基づくレコメンド
行動情報ベースのレコメンドエンジンに、「検索した語句」や「選択した商品カテゴリー」などのデータを分析させることで、初回訪問ユーザーの行動をいち早く認識させ、適切なレコメンドができるようになります。例えば、アパレルサイトで「シャツ」と検索入力をした時点で、そのキーワードを入力した他のユーザーが実際何を買っているかを分析し、検索結果画面などで目立たせることができます。
売上ランキングに基づくレコメンド
その時点で最も売れているものをレコメンドしようという手法です。AIの弱点をカバーする施策としては、拍子抜けするかたもいるかもしれませんが、実はかなり有効な手法です。リアルタイムでユーザー行動分析を行うレコメンドエンジンは、売上ランキングもリアルタイムで出すことができるため、「SNSでバズって購入が殺到している商品」などを捉えて、レコメンドに出すことができます。カテゴリーごとにランキングを出すことでも、精度は高まります。
以上、レコメンドエンジンのコールドスタート問題に対する、主要な対策方法を紹介しました。高度なAIを用いたものもあれば、機械学習ですらないフィルター機能を使うものもありますが、重要なのは「どのような状況で、どの技術を用いるか」です。闇雲に技術を使えば効果が出るというものではありません。
また、高度なAI技術を持つ海外の大手プラットフォーマーが口をそろえて語ることですが、最も精度の出るレコメンドは、ユーザーの行動情報ベースのアルゴリズムのほかにありません。どれだけ商品を解析して類似性を発見しても、またユーザーのデモグラフィック情報から厳密なターゲティングをしても、個人の「いま、これがほしい」というニーズを捉えるためには、行動情報のリアルタイム分析が必要です。行動情報ベースのレコメンドエンジンと、ここで紹介した補完的なレコメンド技術を組み合わせ、新規顧客や新製品にも対応したスキのないレコメンドを実現していきましょう。
▼AI搭載レコメンドエンジンの機能について詳しく知るにはこちら!▼