NetflixはAI、データサイエンス、機械学習をどう使うか – プロダクトの視点から

author
1 minute, 48 seconds Read
2月27日。 2019 – 18 min read

Netflix の機械学習アルゴリズムはビジネスニーズで駆動しています。

現代社会における AIの存在は、ますますユビキタスになっています – 特に、Netflix、Amazon、Facebook、Spotify などの大企業が、毎日消費者と直接 (多くの場合は裏で) 対話する AI 関連ソリューションを継続的に展開しています。

ビジネスの問題に適切に適用すると、これらの AI 関連ソリューションによって、時間とともに拡張および向上する本当に独自のソリューションが得られ、ビジネスとユーザーの両方に大きなインパクトが生まれます。 しかし、AIソリューションを「適切に適用する」とはどういうことでしょうか。 間違ったやり方があるということでしょうか? 製品の観点からは、短い答えは「イエス」です。その理由については、この記事の後半でさらに掘り下げていきます。 最初に、Netflix におけるデータ サイエンスまたは機械学習の 5 つの使用例の概要を説明します。 次に、プロダクト マネージャーが見るであろう、ビジネス ニーズと技術的な考慮事項について説明します。 そして、これらの 5 つの使用例のうち、おそらく最も興味深いものについて、それが解決しようとしているビジネス上の問題を特定しながら、もう少し深く掘り下げていきます。 簡単なニューラルネットを構築しよう!

2. 機械学習における決定木

3. 機械学習の直感的な導入

4. パッシブ A.I. vs. アクティブ A.I. のバランス

5.

5 NetflixにおけるAI/データ/機械学習の活用事例

  1. 映画推薦のパーソナライズ – Aを見ているユーザーはBを見る可能性が高い これはおそらくNetflixの最も有名な機能であろう。 また、「Netflix」は、同じような嗜好を持つ他のユーザーの視聴履歴を利用して、あなたが次に観たいと思うものを推薦するため、あなたが興味を持ち続け、毎月の購読を継続できるようにします。
  2. サムネイル/アートワークの自動生成とカスタマイズ – サムネイル作成の出発点として既存の映画や番組から数千のビデオフレームを用いて、これらの画像を注釈した上で各画像を格付けし、あなたのクリックにつながる可能性が最も高いサムネイルを識別する努力を行っています。 この計算は、あなたと同じような他の人が何をクリックしたかに基づいています。
  3. 映画制作のためのロケハン(プリプロダクション) – スケジュール(俳優やクルーの都合)、予算(会場、フライト/ホテルのコスト)、制作現場の要件(昼夜撮影、場所での天候リスクの可能性)などの制約がある中で、いつどこで撮影するのがベストかを決めるためにデータを使用する方法です。
  4. Movie Editing (Post-Production) -品質管理チェックが過去に失敗したときの履歴データ(過去に音や動きに対する字幕の同期が外れたとき)を使用して、手動チェックが最も有益であるタイミングを予測し、さもなければ非常に時間がかかり手間がかかるプロセスになることがあります。
  5. ストリーミング品質 – 過去の視聴データを使用して帯域幅の使用量を予測し、ピーク時(予想)の需要に対してより速いロード時間のために地域サーバーをキャッシュするタイミングを Netflix が決定するのに役立つ。

Netflix だけにおけるデータ科学または機械学習のこれらの 5 つの使用例/アプリケーションは拡張可能で、テクノロジーの展望とユーザー エクスペリエンスを永遠に変え、今後さらに多くの人々に影響を与えている。 これらの AI 関連ソリューションの採用は、時間とともに強くなる一方です。

しかし、これらの使用例が今日のように一般的になり、あなたや私のようなユーザーが使用するようになる前に、Netflix の誰か、または一部のグループがこれらの AI ソリューションとビジネス ニーズを適切に結びつけていました。 このビジネス・リンクがなければ、これらのユースケースは、他の多くの素晴らしいアイデアと同様に、バックログの底に眠っている単なる絵空事のアイデアになっていたことでしょう。 ネットフリックスの中核的なビジネス問題と適切に関連付けることで、これらのアイデアは今日のような現実となったのです。

Netflix は機械学習を使用して、クリック率の高いイメージ サムネイルの多くのバリエーションを生成し、ユーザー ベース全体において、各ユーザーと各映画について、執拗かつ継続的に A/B テストを行って、ユーザーがクリックし視聴する確率をすべて向上させるようにしています。

ビジネス ニーズ/問題点は何か?

上記で特定した各使用例では、それぞれが特定のビジネス ニーズ、目標、または仮説と関連付けられていることに注目してください。

AIソリューションが直結できる問題があることを確認する

機械学習 (ML) は潜在的なAIソリューションですが、そのソリューションを処方する前に、まず問題を定義する必要があります

ML で達成しようとしているビジネス結果は何なのか。 なぜなら、この核となるビジネスニーズが、使用する ML モデルのパラメータ、どのようなデータを収集し、処理するかなどを決定するものだからです。 面白い技術だからといってパーソナライゼーションを提供するためにMLを行うのではなく、ビジネス上の問題と結びつける必要があるのです。 データサイエンティストはデータから洞察を引き出す専門家ですが、それをビジネスニーズや問題に適切に結びつけ、競合する優先順位と比較するのはプロダクトマネジャーの役割です。

たとえば、技術愛好家が次のように言うとします。

Netflix で音声を使ってエピソードを分析/討論できたら、クールだと思いませんか。

そうですね、自然言語処理 (NLP) を活用して、エピソード後のコメントを文脈で理解する、非常に素晴らしいユースケースとなるでしょう。 NLP に加えて、このユースケースは、テキストから音声へのパーソナリティと、そのエピソードで起こったことについて何千人もの他の人がどう感じたか、あるいは、特定のキャラクターについてどう感じているかというセンチメント分析を使用します。 実際、これは 1 つのユースケースで複数の最先端技術を見事に融合しています。

このパイロット MVP バージョンで、この新しい機能に関与したユーザーがより長く滞在したり、より頻繁に戻ってきたり、Netflix についての口コミを促進することを示した場合、さらなるリソースを確保できるかもしれません。 そのMVPを構築する最初の決定は、必ずしも指標によって優先順位が決まるわけではなく、利害関係者によってなされる戦略的決定によります。

しかし、上記のような美しいユーザーシナリオは、どのような問題を解決するのでしょうか?

ユーザーを毎月購読させるという Netflix の主要な問題にどのように関連するのでしょうか? 関連性がある場合、その関係をサポートする証拠 (質的または量的) はありますか。

また、これがその問題に対する正当なソリューションである場合、その問題を同様に達成でき、技術的にそれほど複雑ではない、このソリューションの簡易版はありますか。 たとえば、音声入力と音声出力の代わりに、テキスト入力とテキスト出力だけの複雑さは、労力のレベルやユーザー関与への影響にどのように影響するでしょうか。

音声部分のない(テキストだけの)会話型 AI インターフェースが、意図したユーザー関与の 80% を達成しながら、開発労力の 40% で済むとしたらどうでしょうか。 そのような代替ルートを検討する価値はあるでしょうか。

そのようなソリューションは、労力のレベルと比較して、どのようなビジネス インパクトをもたらすでしょうか。

これらはすべて、技術ソリューションをビジネス ニーズに合わせるために PM が尋ねるべき、製品に焦点を当てた質問です。 なぜなら、最終的に、ML モデルのパラメーターを動かすのはビジネス ニーズであり、その逆ではないからです。

Because You Watched…You’ll Love… – Movie Recommendation Help Solve What Problem?

Movie Recommendations.Of the Business Goal?

ここで問題なのは、Netflix には膨大な数のコンテンツ (Netflix によれば 1 億種類以上) があり、常に変化しているので、ユーザーが消費するには圧倒される可能性があることです。 ユーザーは、自分の興味に関連するコンテンツを見つけるのに挫折したくないのです。 では、各ユーザーがそのデータを最終的に購読ロイヤリティを最大化するような方法で消費できるようにするには、どのような方法があるのでしょうか。

製品の目標は以下のとおりです。

  • 視聴時間 (分) の増加/維持、
  • 視聴したタイトル数の増加。 ログインし直す頻度
  • 成功の指標として会社が定めた最低閾値を超えること
  • 月額契約ロイヤリティの全体的な増加/契約キャンセルの減少

<仕事中のNetflix Personalized Thumbnails…: 2人の異なるユーザーが、同じ「ゴッドファーザー」映画の2つの異なる画像を見る:1つは顔の劇的なクローズアップを示し、もう1つは幸せな微笑みのカップルを示す。

パーソナライズされた画像のサムネイル/アートワーク。 問題の特定

このユースケースは、映画の推奨のサブセットです。

問題: 視聴率と月間購読者数を最大化する方法で、ユーザーに映画の推奨をどのように (そしていつ) 提示するのが最善か。 また、画像のサムネイルを調整することで、視聴率や購読者のロイヤリティに良い影響を与えると、どの程度確信していますか?

また、サムネイルはどのくらい重要ですか?

Gathering Data to Support That Hypothesis

さて、Netflix の製品に焦点を当てた個人が – 2014 年より前の時点で – これらのまったく同じ質問を社内で行っていたことは確かでしょう。 そして、その個人またはグループは、(おそらく UX および関連する利害関係者と)協力して、画像のサムネイルと視聴率の間に実際に強いリンクがあることを証明するために、ユーザー研究またはデータを別の場所にまとめました。

さて、2014 年に、Netflix は、サムネイルがどれほど重要であるかを示す研究を行いました。

Netflix のクリエイティブ サービス担当グローバル マネージャーのニック ネルソンは、同社が 2014 年の初めに行った研究により、アートワークはユーザーが何を見るかという決定に対して「最大の影響力を持つ」だけでなく、Netflix を閲覧中に彼らが集中することの 82% 以上であることがわかったと説明しました。

「また、ユーザーは Netflix で表示される各タイトルを検討するのに平均 1.8 秒を費やしていることがわかりました」と Nelson は書いています。 「私たちは、会員が素晴らしいコンテンツを見つけるのに、画像がどれほど大きな影響を与えるか、また、会員の興味を引くための時間がどれほど短いかに驚きました。

小さくて魅力的なサムネイルは、Netflix の最新のヒット作を週末ずっと見てもらうか、興味を失って Hulu などの競合サービスや ESPN / Disney / HBO Go など同様の OTT ストリーミング サービスに移ってしまうかの違いを意味するかもしれません」

したがって、研究に基づいて、上記の仮説は非常に正しいことが示されました。 しかし、正確に何を調整するのか。

また、画像のサムネイルの束のような非構造化データ セットは、どのようにしてデジタル/数学的機械学習モデルに送り込まれるのでしょうか。

最初に、サムネイルがユーザーが何かを見るという決断にどれほど重要であったかを考えると、ユーザーがビデオを見る機会を増やすために、Netflix はどのようにして各ユーザーに対してより良いサムネイルを生成することができるのでしょうか。 ビジネスでは、クリック数 (および視聴者のストリーム時間) をテーブル上に残している可能性が高いです!

クリック率を高めるために最適化された、ユーザーごとに異なるサムネイルを Netflix がカスタム作成したらどうでしょうか?

クリック率を高めるために微調整できる、Netflix のコントロール範囲内の画像サムネイルの内容とは何でしょうか。

同じ Riverdale Movie でも、ユーザーの過去のロマンス(甘い笑顔)またはスリラー(深刻で劇的な表情)映画のジャンルに対する好みに基づいて、異なる芸術作品のサムネイルを 2 つ作成します。

そのサムネイルにどの俳優(複数可)/キャラクター(複数可)を載せるべきでしょうか(もしあれば)? 何人ですか? どの自動生成フレームまたはポスターのバリエーションが、特定のユーザーにとって最も魅力的でクリックしやすいでしょうか。 どのような照明が最も効果的ですか? フィルター?

他のユーザーの過去のクリック行動に関するどのようなデータから、このサムネイルの決定をスケールで知らせるのに役立つ関連付けを行うことができますか?

  • 映画の推奨作品のクリック率 (CTR) を高める – エンゲージメントを示す
  • エンゲージメント率が高まれば、加入者の満足度とロイヤルティの向上につながるという仮説

したがって、誰かが動画をクリックして視聴する可能性に大きな影響を与える画像サムネイルの問題は、本当に興味深いものでした。

サムネイルを微調整することにより、視聴の確率を最大化することが目的である場合、考慮すべき製品決定は何でしょうか。

Product Considerations In Personalized Image Thumbnails

上記の各使用例には深入りしませんが、2番目の使用例についてもう少し掘り下げて説明します。 アートワーク/サムネイルのパーソナライズ

これは、映画推薦エンジンの上に位置するデータ駆動型のパーソナライズ機能です

製品に関する考察

アルゴリズムは素晴らしいですが、限界もあります。 プロダクト マネージャーは、アルゴリズムが最良の結果をもたらさない可能性があるエッジ ケース シナリオを常に念頭に置く必要があります。 Netflix は同様の関心を持つ他の人のクリック行動のデータを持っているので、同様の関心と視聴履歴を持つ他の人が特定のサムネイルで高いクリック率を得た場合、この画像のサムネイルは、まだこの映画/サムネイルを推奨されていない新しい人に実行する可能性が高いと推測することは妥当な仮説です。 たとえば、Netflix が 2 つの異なるスパイダーマン映画を並べてユーザーに推奨しており、どちらもスパイダーマンがカメラのマスクを外している状態だとします。 一方はTobey Maguire、もう一方はAndrew Garfieldです。 ユーザーにとって、マスクを外したスパイダーマン役のマグワイアとガーフィールドのポートレートが2つ並んでいるのは、奇妙なことではありませんか? もし、そのような事態が発生した場合のために、何か対策を考えておく必要があります。
1 つの画像のサムネイルは単独ではうまく機能しますが、何十ものサムネイルのページが表示されると、それでは十分でない場合があります。 それらがすべて同じように見えるように最適化されている場合、グループとして、それぞれが説得力のないものに見える可能性があります。

  • データは素晴らしいものですが、あまりにもうまく機能しすぎて、意図しない結果や誤検出を引き起こすアルゴリズムに気をつけましょう!
    統計学では、これをタイプ I エラーと呼びます。つまり、提案されるべきではない画像のサムネイルを誤って(または不適切に)提案してしまうことです。 クリステン・ベル主演の映画「Like Father」の下の例を見てください。 しかし、Netflix のアルゴリズムは、(間違いなく)、映画の内容を実際に表していない黒人の俳優/女優をサポートするという誤ったサムネイルを推奨しましたが、特定の民族の視聴者の間でより高いクリック率を経験しました。

    Black users are seeing the thumbnail on the right, despite it is not representative of what the movie is about.

    The excessive optimised / personalized experience could create a monotonous user experience that some cases can be misleading the user in the way.

    別の例を挙げます。

    クリックスルー率 (CTR) の高い可能性に基づいて、Netflix はユーザーの民族性に一致するサムネイルをユーザーに表示することになりました。

    黒人ユーザーの推奨では、彼女の民族性を反映したサムネイルが表示されます – そのサムネイルが必ずしも映画全般を代表していない場合でも、です。

    これはデータに裏付けられた取り組みですが、サムネイルがその映画を正確に表しているという点で、誤解を招くような不親切な感じがあることは、ユーザーにとって非常に明白です (タイプ I 誤検出エラー)。

    もちろん、このアルゴリズムは時間の経過と共に微調整されるでしょうが、ここで得られる教訓は、データを活用する際にはやり過ぎないこと – 常識を適用してバランスを保つこと、です。

    たとえば、ユーザーを不適切に誤解させたり、人種によって異なる扱いを受けていることを知らせたりしたくありません。

    最後に、アルゴリズムは、ユーザーが以前にこの映画と関連して見たサムネイル画像を考慮し、一貫した、混乱しないユーザー体験を提供するよう目指さなければなりません。 これは、ユーザーを混乱させるだけでなく、プロダクト マネージャーがクリックにアトリビューションを割り当てることを困難にします – どの画像が高いクリックスルー レート (CTR) をもたらしたのか、画像が変わり続ける場合はどうなるのか。 PM は、それぞれの新しい結果を特定の変更に適切に帰属させる必要があるので、一貫したデータ帰属を維持することが重要です。

    以上、エッジ ケース シナリオとデータ使用の極端なケースを設計する際に、製品マネージャーが考慮することをいくつか挙げました。 データといえば、Netflix は具体的に何を使っているのでしょうか。

    What Data Do We Have?

    これには 2 つの部分があります。

  • 最初の質問について、

    • Stranger Things の 1 時間のエピソードには >86,000 の静的ビデオ フレームがあり、これらのビデオ フレームにはそれぞれ特定の属性を割り当てることができ、後で Aesthetic Visual Analysis (AVA) という一連のツールとアルゴリズムを使って、最高のサムネイルの候補を絞り込むために使用されます。 これは、動画のすべての静止フレームから最適なカスタムサムネイル画像を見つけるように設計されています
    • Netflix Annotation – Netflix は、明るさ (.67)、顔の数 (3) 、肌の色 (.2)、ヌードの確率 (.03)、モーションブラーのレベル (4) 、対称 (.4)
    • Netflix Image Ranking – Netflix は、上記のメタデータを使用して、最高品質(照明が良い、モーションブラーがない、主要キャラクターの顔を適切な角度で撮影している、無許可のブランド コンテンツが含まれていない、など)で最もクリックしやすい特定の画像を選択します

    これらのカスタム生成サムネイルのターゲットユーザを特定するのに、Netflix がどのデータを使用するかという 2 つの質問については、 Netflix は以下を考慮に入れてみてください。

    • # of movies watched, # of each show watched minutes of # of the respective shows
    • % of completion for every video/series
    • # of upvotes, which movies were favorited, etc
    • % of overall watch content that is attributable any specific show (and therefore level of affinity that user has to a specific show or related cast members)
    • any seasonal or weekly trends related to a user’s level of engagement, etc.

    興味深いことに、2018年半ばに、Netflixは、それまで自社のウェブサイトでのみ募集していたユーザー レビューをデータ ポイントとして受け入れるのをやめました。 なぜか? なぜなら、この「機能」は、否定的なレビューがユーザーが動画を試してみることを思いとどまらせるため、実際に視聴者数を減らすからです。 これは、ビジネス上のニーズが人気のあるユーザー ニーズに取って代わるという、また別の例です!

    つまり、Netflix は、視聴した動画からクリックした画像まで、各顧客に関する大量のデータを持っているわけです。

    How Netflix Uses Data to Construct A Universe of User Profile Interests

    つまり、各ユーザーの 360 プロファイルを作成し、数百、数千の異なる属性に従ってすべてのユーザーに数学的インデックスを付けるためにこれを使用するのです。

    類似したユーザー プロファイルのグループ化はどのように行われ、プロダクト マネージャーはそのデータをどのように理解するのでしょうか。

    行列、ベクトル、および n 次元特徴分析に関連する複雑な数学とアルゴリズムを通して、これがどのように機能するかを理解する最も簡単な方法は、10 次元以上の 3D 空間表現によるものであることがわかりました。 これは、t-SNE プロットと呼ばれる凝ったプロットで、事実上、3 次元よりもはるかに多くの次元の 3D 表現です。 この場合、10 次元 (1 から 10 までの各桁) を 3D 球体状の座標系に表示しています。

    A t-SNE plot of 10 dimensions in a 3D view using Google’s Tensorboard.

    この空間表現における各手書きの数字の位置は、ベクトル (特徴の次元の数だけある座標のような一連の数値) によって記述できます。

    同様に、Netflix ユーザーについて、上記のチャートにおける各ユーザー プロファイルの位置は、映画のジャンル、お気に入りの俳優/女優、映画の話題など、ユーザーの関心の個々の次元を表す数値で記述できます。

    Reimagining Netflix Users in Mathematical Relation To Each Other

    上の桁の図では、次のように仮定してみましょう。

    • “6” = ラブコメ
    • “4” = スリラー

    あるユーザーが Netflix によって “6” とラベル付けされると、その人は上記の空間表現で他のすべてのターコイズ色の 6 がある場所の近くに置かれます(一番下付近)。

    同様に、ユーザーが Netflix によって「4」とラベル付けされた場合、そのユーザーは、上記の空間表現において、他のすべてのマゼンタ色の 4 がある場所の一般的な近辺に配置されます (上部付近)。 ロマンチック コメディ (6) が好きなユーザーは、数学的には、スリラー (4) が好きな人よりもパロディ (5) が好きな人に近いかもしれません。

    ターコイズの「6」地域(ロマンチック コメディ)が灰色の「5」地域と多少重なることに注意してください。 同様に、マゼンタの「4」領域 (スリラー) はピンクの「9」領域にやや近いので、このピンクの 9 領域はアクション映画が好きな人を表すかもしれません – 数学的には、ロマンチックコメディの「6」領域よりもスリラーの「4」領域に近いです。 つまり、空間的に表現すると、2つのユーザープロファイルの間の距離は、彼らの嗜好がどれだけ似ているか/異なっているかを表しているのです。 もちろん、ロマンティック コメディが好きな人がスリラーも好きな場合、これは無限に複雑になります。しかし、この例えの目的は、異なるカテゴリ間の数学的/空間的関係の一般的なアイデアを示すことなのです。

    互いに関連する趣味のグループは、より近くに表示され、ユーザーが近くの何かを好きであれば、そのユーザーが何を好きになるかの良い予測になりえます。 以下の同じ「グッド・ウィル・ハンティング」映画について、コメディファンと識別されたユーザーにはロビン・ウィリアムズ(コメディアン)のサムネールが表示され、一方、ロマンティック コメディのファンと識別されたユーザーにはマット・デイモンとミニー・ドライバーのキスのサムネールが表示されるでしょう。 完璧ではありませんが、Netflix のアルゴリズムでは、ユーザーのプロファイル特性に基づいてパーソナライズすることで、クリック率の確率が向上することを示唆しています。 Netflix のイメージ サムネイルの束は、構造化されていないデータの束です。

    しかし、Netflix が各サムネイルに注釈を付け、そのサムネイルに何があるかを説明するメタデータを割り当てると、その非構造化データの数値表現ができあがります。

    この数値表現を、上で行ったように 3D 球体上にベクトルとしてプロットすると、今度は Netflix がデータ ポイント間の関係を形成し始めます。 予測が悪くなったり良くなったりした場合は、これらの特性の数学的な位置づけを適宜調整し、時間の経過とともにモデルをより良くしていきます。

    このデータから Netflix は何を学んだのでしょうか。

    さて、Netflix が機械学習モデルで画像を数値に変換する方法はわかりましたが、長年にわたって行ってきたすべてのデータ処理と A/B テストから Netflix が見つけた知見は何でしょうか。

    さて、長期にわたってユーザーを忠実な購読者に変えた何百万もの個々のサムネイルを学習する以外に、サムネイルに関して何が有効かについて、Netflix が学んだことをいくつか追加します:

    • Show close-ups of emotionally expressive faces
    • Do not show people villain instead of heroes
    • Don’t show more than three characters

    In Conclusion: Netflix は AI を (ほとんど) 正しい方法で導入しました。 Netflix は、AI、データ サイエンス、および機械学習を「正しい方法」で適用するという、驚異的な仕事を成し遂げました – ビジネス ニーズにまず焦点を当て、その次に AI ソリューション、その逆はありません、という製品ベースのアプローチを使用しています。

    私たちは、契約という点では Netflix、全体的な満足度という点ではユーザー、両方の利益のために、体験をパーソナライズするのに AI ソリューションがどれほど効果的かを見てきました。

    また、「やりすぎ」たアルゴリズムの限界を見て、Netflix アルコールが、クリック数を最適化して、ユーザーを効果的に「騙して」餌をクリックさせるため、有色人種の人たちに誤解を招くサムネールを提示したという特定の例について説明しました。 これは、そのサムネイルがそのビデオを正確に表していない場合でも起こりました。

    人間の経験のすべてのニュアンスを考慮するうえで、完璧なアルゴリズムはありません。 実際、測定基準を悪用するために設計されたアルゴリズムは、まさにそれを行うでしょう。ですから、設計や他のチームメンバーと協力して、アルゴリズムのこうした欠点に対処する方法を見つけることがプロダクトマネージャーの役割なのです。

    今後、企業のエンタープライズ空間だけでなく、社会におけるAIの統合はますます普及していくでしょう。

    技術者は既存のAIソリューションを処方する傾向があるかもしれませんが、本当にAIを導入する最も有効な方法はNetflixが行った方法、つまりビジネス主導の観点から先に行うことです。

    掘り下げると、Netflix が戦略的な前進をする前にサポート データを生成したことがわかります。

    AI、データ サイエンス、および機械学習の世界が成長を続ける中、AI ソリューションを適切に展開することになると、我々製品マネージャーは皆、Netflix のプレイブックから 1 つ 2 つ教訓を得てよいはずです。

    Similar Posts

    コメントを残す

    メールアドレスが公開されることはありません。