6000 個の映画脚本を機械学習で分析、娯楽産業におけるビジネスモデルの革新を推進

米国コーネル大学は 6000 個のハリウッド映画脚本に自然言語処理を行い、感情がエンターテインメントコンテンツにおける消費者の嗜好をどう形成するかどうかを調査しました。感情起伏を時系列情報に変換し、6つにクラスタリングし比較を行なったところ、興行収入・レビューが高いものを特定することができました。

論文: The Data Science of Hollywood: Using Emotional Arcs of Movies to Drive Business Model Innovation in Entertainment Industries 

映画生産流通業界は数十億ドル規模の市場があります。しかし、映画の中には、世界中で成功している作品がある一方で、ヒットせずにすぐに忘れ去られてしまう作品があります。

例えば、ハリウッドでは、6つのメジャースタジオが年間に20本の映画を製作していますが、一本の映画製作コストは広告費を除いて平均6000万ドルかかっており、そして、ある程度見込みのある脚本が現実味を帯びるまでにも1400万ドルのコストがかかると言われています。もちろん、興行収入が期待どおりになるかどうか、映画の成功は全く保証されていません。映画を作成するということはハイリスクなのです。

また現在、ビジネスに関する文献の多くは、消費者の好みを正確に反映したカスタマイズされたサービスや製品を企業がどのようにデザインできるかという問題に取り組んでおり、エンターテイメントの領域もその波が推しよせています。

そこで本稿では、自然言語処理を使用して、感情がエンターテインメントコンテンツにおける消費者の嗜好をどう形成するかどうかを調査しています

すべての長編映画は6の主要なの感情起伏に分類される。

まず、映画タイトルに、映画の全体的な成功のパラメータを(興業収入、満足度足、賞、視聴者や評論家のレビューなど)足しフィルタリングした6,174本の映画の脚本データを用意します。そして用意した脚本データに自然言語処理を行い、各動画の感情の軌跡を捉えるためのスクリーンコンテンツのマッピングを生成します。次に、得られたマッピングを、消費者の感情の動きのグループを表すクラスタに結合します。

すると、すべての長編映画の台本は、同じ6つの主要な感情の範囲内に入ることがわかりました。

・『不思議の国のアリス』など、感情値の「一定して継続的な上昇」型 

・『ロミオとジュリエット』など、悲劇に見られる、感情値の「一定して継続的な下降」型 

・『穴の中の男』の物語のような感情値の「下降から上昇」型 

・『イカロス』(ギリシャ神話)など、感情値の「上昇から下降」型 

・『シンデレラ』(グリム童話等)など、感情値の「上昇→下降→上昇」型 

・『オイディプス』(ギリシャ神話)など、感情値の「下降→上昇→下降」型

これら6つにクラスタリングし、比較を行なったところ、興行収入・レビューが高いものは、感情の落ち込みからの上昇を特徴とする《下降→上昇型》と強く関連していたとのこと。この型の映画は、ジャンルや制作費に関係なく、経済的に成功しています。

論文によると、この《下降→上昇型》は、「気に入られる」映画としてよりも、視聴者の関心を引き、議論を刺激し、最も「話題にされる」映画になることで成功しているとのことです。

他にも、シンデレラ型(上昇→下降→上昇)は、コメディや家族映画として高い収益を達成する傾向がある一方、犯罪や戦争をテーマにした場合は低収入の傾向があることが分かりました。また、イカロス型(上昇→下降)は、ジャンルに関係なく、財政的に失敗する傾向があるとのことで、特に『アニメ』、『ファンタジー』、『コメディ』、『ファミリー』などのジャンルは最悪だとのこと。

エンターテイメントでもより効果的なROI を

分析した全ての感情の弧は何千もの映画の台本から、6つの主要な感情に分割できることがわかり、脚本とジャンルの組み合わせを選択することで、経済的に成功する映画を予測することが可能になりました。

データ科学の最近の進歩は、感情をよりよく理解し、それを利用することを可能にしていますが、メディアやエンターテインメントの分野においても、望ましいコンテンツについて視聴者の感情分析をするなど、制作に大きな影響を与えるのではないでしょうか?  

今後、機械学習により、より多くの感動的なエンターテイメントを、より効率的なROIで提供することが期待されます。