LLMにおける広告プラットフォームの未来!新たなビジネスモデルとパーソナライズ広告の可能性
3つの要点
✔️ 大規模言語モデルを活用した広告システムの提案:大規模言語モデルを活用した広告システムに向けた複数のフレームワークを提案し、それぞれのアプローチのメリットとデメリットを比較検討。今後のオンライン広告を議論するきっかけを提供。
✔️ 広告システムの基本要件の検討:プライバシーの保護、信頼性の確保、遅延の最小化、ユーザーおよび広告主満足度の最大化、そして大規模言語モデルのプロバイダーの広告による収益化など、実用的な大規模言語モデルを活用した広告システムが満たすべき基本要件を提示。
✔️ 動的クリエイティブオプティマイゼーション(DCO)の検証:大規模言語モデルを用いることによる、従来のDCO技術を超えたパーソナライズ広告の可能性を議論。
Online Advertisements with LLMs: Opportunities and Challenges
written by Soheil Feizi, MohammadTaghi Hajiaghayi, Keivan Rezaei, Suho Shin
(Submitted on 11 Nov 2023 (v1), last revised 14 Feb 2024 (this version, v2))
Subjects: Computers and Society (cs.CY); Artificial Intelligence (cs.AI)
code:
本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。
概要
オンライン検索エンジンの世界では、広告がデジタル体験を形作る上で不可欠な役割を担っています。この市場は兆ドル規模に達し、現在も拡大を続けています。広告の経済的な重要性はより大きくなっています。様々な情報やサービスを無料で利用できる現在において、広告はそれらを支える重要な柱になっています。広告による収益モデルは、教育や情報へのアクセスを民主化し、人々がコンテンツを無料で享受し、デジタルエコシステムの発展に大きく貢献しています。広告とコンテンツ制作の相乗効果は、経済成長を促進し、Netflixのような企業が広告サポートプランを導入するなど、広告市場の重要性は増すばかりです。
近年、ChatGPTをはじめとする大規模言語モデルの提供が広まり、質問応答やコンテンツ生成など、多様な機能でユーザーを支援しています。これらの技術の普及は、情報検索の手段として、従来の検索エンジンに代わる技術になりうるとも言われており、大規模言語モデルのプロバイダーによる広告収益化の可能性も検討されています。こうした背景から、大規模言語モデルに、オンライン広告をどのように実装し、利益を生み出すかという検討が議論され始めています。
この論文では、オンライン広告とオークション形式を大規模言語モデルに適用する際の課題と可能性を検証しています。特に、広告が大規模言語モデルの非構造化出力に組み込まれる場合の利点と課題に焦点を当て、広告主とユーザーのニーズを満たす方法を検討しています。また、広告主がシステムとどのように連携し、入札するかという問題も検討しています。大規模言語モデルがどのようにして個々のユーザーに適した広告コンテンツを提供することができるのか、より魅力的な広告を生成するのか、いわゆる「ダイナミッククリエイティブオプティマイゼーション(DCO)」や「レスポンシブ広告」についても議論しています。
この研究は、今後の広告とデジタルコンテンツのスポットを当て、広告主とユーザー双方にメリットをもたらす新しいアプローチを提示しています。
大規模言語モデルの広告システムに求められる要件
この論文では、大規模言語モデルの広告システムに求められる要件についても触れています。要件として、次のものを挙げています。
プライバシーの保護:ユーザーと広告主の相互作用において最も重要なのは、プライバシーの機密性を守ることです。これは、ユーザーの情報とデータを安全に保ち、偶発的な漏洩が引き起こすリスクを避けるために不可欠です。
信頼性の確保:オンライン広告全般に言えることですが、広告主との信頼関係を築く必要があります。この信頼関係を保持するために、システムは広告主の行動を細かく監視し、システムの一貫性と信頼性を保証する必要があります。
遅延の最小化:ユーザーは迅速なサービスを期待しており、広告の表示は少なからず遅延が発生してますが、この遅延は可能な限り最小限に抑え、ユーザー体験を損なわないようにするべきです。
ユーザー満足度の維持:広告が大規模言語モデルの出力に組み込まれる場合でも、コンテンツの品質は高く保たれるべきです。過度な広告はユーザー体験を損ない、特にユーザーの検索や興味に合致しない場合は、ユーザーの満足度を大きく下げる可能性があります。
広告主満足度の確保:広告主は、自らの広告が適切に露出されることを期待しています。広告は魅力的で、ユーザーの関心を引く方法で提示されるべきです。これにより、広告主にとっての収益性が高まります。
大規模言語モデルのプロバイダーの収益性の確保:広告サービスの提供は、収益の獲得を目的としています。広告の追加がユーザー数の減少を引き起こし、大規模言語モデルのプロバイダーに逆効果となる可能性があることに注意する必要があります。広告のコストは広告主からの収益によって十分に補われように設計されるべきです。
これらの要件を満たすことで、広告システムはユーザーと広告主の双方にとって価値あるサービスを提供し、プロバイダー自身の収益性も確保することができます。
大規模言語モデルの広告システムの概要
ここでは、大規模言語モデルを活用した広告システム(以下、LAS)の概要を紹介します。LASは、様々なアーキテクチャを採用することができ、この論文では、各々のメリットとデメリットを併せて考察しています。LASの概要は下図のようになっています。ユーザーが大規模言語モデルにプロンプトを入力し、その出力に対して、どのように広告と結びつけられるかを処理する流れになっています。ユーザーの過去の検索履歴など、様々なコンテキストを考慮し、広告をレコメンドします。
LASは、出力の変更(Modification)、入札(Bidding)、予測(Prediction)、オークション(Auction)の4つのモジュールで構成されています。各モジュールは、ユーザーの大規模言語モデルへの入力と、それに対する最適な広告の組み合わせを見つけ出すために連携して機能します。
変更(Modification)モジュールは、ユーザーの入力に応じたカスタマイズされた広告を出力します。広告主自身が出力をカスタマイズする「広告主修正モデル」と、LASが直接出力を修正する「LAS修正モデル」の2つのアプローチが検討されています。
入札(Bidding)モジュールは、修正された出力に基づいて、広告主が入札額を決定します。動的入札モデルでは、各入力に対して修正された出力と関連情報を提供し、広告主が入札額を決定します。一方、静的入札モデルでは、あらかじめ定められたキーワードに基づいて入札が行われます。
予測(Prediction)モジュールは、ユーザーの満足度と広告のCTRを計算し、これらの指標に基づいて最終的な広告出力の品質を評価します。これにより、ユーザー体験の向上とLASの収益の最大化を調整します。
オークション(Auction)モジュールは、最終的に、どの広告がユーザーに表示されるか、広告主に対する請求額を決定します。このモジュールでは、入札額、満足度、CTRを基に、最適な広告配信と適正価格の決定を行います。
LASの目標は、短期収益と長期的なユーザー維持のバランスを取りながら、広告収益を最大化することです。このために、各モジュールは精密に設計されており、広告主が自身の戦略に応じて柔軟に対応できるようになっています。最終的には、第一価格オークションや第二価格オークションなど、適切なオークション形式が選択されます。
大規模言語モデルを活用した動的クリエイティブオプティマイゼーション(DCO)
ここでは大規模言語モデルを活用した動的クリエイティブオプティマイゼーション(DCO)の可能性について紹介します。DCOは、広告アセットの組み合わせを動的に調整し、顧客の好みに最適な広告を構築する技術で、従来の検索広告、ディスプレイ広告市場でよく用いられています。この技術により、広告の内容を個人に合わせて調整することで、ユーザーにとっての広告の質と、関連性が著しく向上します。多くのオンライン広告プラットフォームがDCOベースの広告、いわゆるレスポンシブ広告を採用しています。
典型的なDCOのフレームワークでは、静的広告は特定の広告チャネルでのみ表示される単一の画像ファイルから成り、対照的に動的に最適化される広告は、単一の広告テンプレートと、そのテンプレートを埋めるための複数アセットから構成されています。これは、広告主が広告テンプレートに対して、複数アセットのオプションを登録し、システムが最適な組み合わせを選択することによって行われます。CTRとSRを増加させ、オンライン広告のエコシステムの効率と広告プラットフォームの収益を向上させることを目的としています。
しかし、画像出力をサポートするChatGPT-4のような大規模言語モデルの登場により、従来のDCO技術と異なり、広告の動的な作成プロセスを導入することができるようになり、オンライン広告プラットフォームにおける従来のDCOの役割を置き換える可能性があります。例えば、ユーザーの入力とコンテキストに基づき、プラットフォームは大規模言語モデルにクエリを送信し、ユーザーの好みを捉えることでユーザーを引きつける広告画像をカスタマイズできます。下図では、パーソナライズされた広告の2つのシナリオが示されています。
レスポンシブ広告を組み込むためには、より高度な変更モジュールが必要です。このモジュールは、元の応答を広告を含むように変更するだけでなく、ユーザーの好みを考慮して広告を組み込む機能も実現するべきです。これには、性別、場所、クエリに使用されるデバイスなど、ユーザーのコンテキストを広告生成プロセスに活用することが含まれます。これにより、ユーザーの好みを考慮することで、広告をより魅力的にします。言語モデルを活用し、修正された出力の生成中にユーザーコンテキストに関連するさまざまな要素を考慮するよう促すことができます。先ほどの図に示すように、ユーザーのコンテキストに関する情報を活用して、より魅力的な広告を作成することができます。さらに、予測モジュールはユーザー体験を最大限に高める修正された出力にコミットするために、変更モジュールと連携する可能性があります。
コスト共有モデルに関して、従来のDCO技術が広告アセットの効率的な組み合わせを単に決定するのとは異なり、大規模言語モデルベースのレスポンシブ広告は真に新しいコンテンツを作成することが可能です。しかし、このプロセスは計算資源の使用増加を伴い、特に広告をカスタマイズするために大規模言語モデルへのクエリが増えるためです。ここでは、LASが採用可能なコスト共有モデルについて議論します。
最も単純なモデルは、コンテンツが動的に修正されるたびに広告主に請求することです。例えば、広告主とLASがレスポンシブ広告ごとに支払う金額について契約を結び、LASが広告コンテンツをレスポンシブに修正するたびに広告主に請求します。契約には、広告主の広告がいつレスポンシブに変更されるかを指定することができます。また、LASは広告主がどのくらい頻繁に、どの程度大きく広告をレスポンシブに修正すべきかを決定するためのオプションを提供するかもしれません。
これらのプロセスは追加の計算資源を要求し、動的広告を組み込む際に遅延に影響を与える可能性があります。オンライン広告では、リアルタイム入札プロセスの全体的な遅延が100ミリ秒以内であることが通常要求されますが、画像出力を修正するのに数秒の遅延が発生することがあります。広告の品質と遅延のバランスを取ることは技術的に興味深く、キャッシュを使用するなど簡単な方法で、また広告主に金銭的な負担を一部負担させることも可能です。
まとめ
この論文では、大規模言語モデルを活用したオンライン広告システムの展望と直面する課題に取り組んでいます。実用的な広告システムが満たすべき基本的な要件を挙げ、それに応えるためのフレームワークを提示しています。また、その有効性を検証しています。この論文で提案されているフレームワークのメリットとデメリットを比較検討し、効果的なオンライン広告システムの設計に伴う技術的な挑戦と実践的な難題についても触れています。さらに、大規模言語モデルを活用することで実現可能な高度な動的クリエイティブオプティマイゼーション(DCO)の有用性について議論しています。今後の大規模言語モデルにおけるオンライン広告の役割と可能性を探るきっかけとなる論文です。
この記事に関するカテゴリー