Come Netflix utilizza AI, Data Science e Machine Learning – Da una prospettiva di prodotto

author
23 minutes, 31 seconds Read
Feb 27, 2019 – 18 min read

Gli algoritmi di apprendimento automatico di Netflix sono guidati dalle esigenze aziendali.

La presenza dell’IA nella società di oggi sta diventando sempre più onnipresente, in particolare perché grandi aziende come Netflix, Amazon, Facebook, Spotify e molte altre implementano continuamente soluzioni legate all’IA che interagiscono direttamente (spesso dietro le quinte) con i consumatori ogni giorno.

Se applicate correttamente ai problemi di business, queste soluzioni legate all’IA possono fornire soluzioni davvero uniche che scalano e migliorano nel tempo, creando un impatto significativo sia per il business che per gli utenti. Ma cosa significa “applicare correttamente” una soluzione AI? Significa che c’è un modo sbagliato? Dal punto di vista del prodotto, la risposta breve è sì, e arriveremo al perché questo è più avanti in questo articolo mentre scaviamo più a fondo.

Panoramica: Per prima cosa, delineeremo 5 casi d’uso della scienza dei dati o dell’apprendimento automatico a Netflix. Discuteremo poi alcune esigenze di business rispetto alle considerazioni tecniche che un Product Manager dovrebbe guardare. Poi ci immergeremo un po’ più a fondo in quello che è forse il più interessante di questi 5 casi d’uso, identificando quale problema aziendale cerca di risolvere.

1. Costruiamo una semplice rete neurale!

2. Alberi decisionali nel Machine Learning

3. Un’introduzione intuitiva al Machine Learning

4. L’equilibrio tra IA passiva e attiva.

5 casi d’uso di AI/Data/Machine Learning a Netflix

  1. Personalizzazione delle raccomandazioni di film – Gli utenti che guardano A è probabile che guardino B. Questa è forse la caratteristica più nota di Netflix. Netflix utilizza la cronologia di altri utenti con gusti simili per raccomandare ciò che potresti essere più interessato a guardare dopo, in modo che tu rimanga impegnato e continui il tuo abbonamento mensile per altro.
  2. Generazione automatica e personalizzazione delle miniature/opere d’arte – Utilizzando migliaia di fotogrammi video da un film o spettacolo esistente come punto di partenza per la generazione di miniature, Netflix annota queste immagini e poi classifica ogni immagine nel tentativo di identificare quali miniature hanno la più alta probabilità di risultare in un tuo clic. Questi calcoli si basano su ciò che altri simili a te hanno cliccato. Una scoperta potrebbe essere che gli utenti a cui piacciono certi attori / generi di film sono più propensi a cliccare sulle miniature con certi attori / attributi dell’immagine.
  3. Location Scouting for Movie Production (Pre-Produzione) – Utilizzando i dati per aiutare a decidere dove e quando meglio girare un set cinematografico – dati i vincoli di programmazione (disponibilità dell’attore / equipaggio), budget (sede, costi di volo / hotel), e requisiti della scena di produzione (giorno vs notte, probabilità di rischi di eventi atmosferici in una posizione). Si noti che questo è più un problema di ottimizzazione della scienza dei dati piuttosto che un modello di apprendimento automatico che fa previsioni basate su dati passati.
  4. Montaggio di film (post-produzione) -Utilizzando i dati storici di quando i controlli di qualità sono falliti in passato (quando la sincronizzazione dei sottotitoli con il suono/movimenti non era corretta in passato) – per prevedere quando un controllo manuale è più utile in quello che potrebbe altrimenti essere un processo molto lungo e laborioso.
  5. Qualità dello streaming – Utilizzando i dati di visualizzazione passati per prevedere l’utilizzo della larghezza di banda per aiutare Netflix a decidere quando mettere in cache i server regionali per tempi di caricamento più rapidi durante i picchi di domanda (previsti).

Questi 5 casi d’uso/applicazione della scienza dei dati o dell’apprendimento automatico solo in Netflix hanno avuto un impatto così scalabile che hanno cambiato per sempre il panorama tecnologico e l’esperienza degli utenti per milioni e più a venire. L’adozione di queste soluzioni legate all’intelligenza artificiale è destinata a rafforzarsi nel tempo.

Ma prima che questi casi d’uso fossero così comuni come lo sono oggi e utilizzati da utenti come voi e me, qualcuno o qualche gruppo all’interno di Netflix ha collegato correttamente queste soluzioni AI con un bisogno aziendale. Senza questo collegamento con il business, questi casi d’uso sarebbero semplicemente delle idee “pie-in-the-sky” sedute in fondo a un arretrato come tante altre grandi idee. Solo attraverso un corretto posizionamento e un collegamento con il problema di core business di Netflix, queste idee sono diventate la realtà che sono oggi.

Netflix usa l’apprendimento automatico per generare molte variazioni di miniature di immagini ad alta probabilità di click-thru che testa incessantemente e continuamente A/B in tutta la sua base di utenti – per ogni utente e ogni film – tutto per aumentare la probabilità che tu clicchi e guardi.

Qual è il bisogno/problema del business?

Nota che in ognuno dei casi d’uso che ho identificato sopra, ognuno è associato a una specifica necessità, obiettivo o ipotesi di business.

Questo è assolutamente importante per qualsiasi product manager – per evitare la tentazione dell’appassionato di tecnologia che si meraviglia nei dettagli della scienza dei dati / o ML per motivi intellettuali senza identificare chiaramente il problema o la necessità del business – potenzialmente utilizzando preziose risorse tecniche senza alcun impatto sul business.

Alla fine della giornata, i product manager devono collegare correttamente un problema aziendale a una soluzione di apprendimento automatico dei dati. Vogliamo evitare di avere una soluzione che è a caccia di un problema, altrimenti il progetto perderà slancio all’interno dell’azienda: gli ingegneri non avranno chiaro quale sia la loro stella polare, le parti interessate in tutta l’organizzazione non compreranno e non assegneranno le risorse necessarie per rendere il progetto un successo, ecc.

Assicurati che ci sia un problema a cui una soluzione di AI possa essere direttamente collegata

Il machine learning (ML) è una potenziale soluzione di AI – ma dobbiamo prima definire il problema prima di prescrivere quella soluzione.

Qual è il risultato aziendale che stiamo cercando di ottenere con il ML? Perché questa esigenza di core business è ciò che guida i parametri dei modelli di ML utilizzati, quali dati vengono raccolti ed elaborati, ecc. Non facciamo ML per fornire personalizzazione solo perché è una tecnologia interessante – dobbiamo collegarla a un problema di business. Gli scienziati dei dati sono specialisti nello scoprire intuizioni dai dati, ma è il ruolo del product manager di collegarli correttamente a un bisogno o a un problema aziendale e confrontarli con le priorità concorrenti.

Per esempio, un appassionato di tecnologia potrebbe dire:

Non sarebbe bello se si potesse analizzare/discutere un episodio usando la voce con Netflix – e Netflix, con i dati provenienti da migliaia di reazioni di altri utenti a quell’episodio, potesse rispondere in modo intelligente ai vostri commenti in un dialogo a due vie avanti e indietro?

Sì, questo sarebbe un caso d’uso piuttosto impressionante che sfrutta l’elaborazione del linguaggio naturale (NLP) per capire il tuo commento post-episodio nel contesto. Oltre all’NLP, questo caso d’uso utilizza le personalità del testo alla voce così come l’analisi del sentimento di come migliaia di altri si sono sentiti su ciò che è successo in quell’episodio, o come si sentono su un certo personaggio. In effetti, questa è una bella fusione di più tecnologie all’avanguardia in un solo caso d’uso.

Se una versione pilota MVP di questo ha dimostrato che gli utenti che si sono impegnati con la sua nuova funzione sono rimasti più a lungo o sono tornati più spesso o hanno contribuito a guidare più passaparola su Netflix, allora potrebbe giustificare ulteriori risorse. La decisione iniziale di costruire quell’MVP dipenderebbe da una decisione strategica presa dalle parti interessate, non necessariamente prioritaria in base alla metrica. Questo dipenderà dalla strategia aziendale.

Ma per quanto bello sia lo scenario per gli utenti di cui sopra, quale problema risolve?

Come si collega al problema principale di Netflix di mantenere gli utenti abbonati ogni mese? Se è correlato, quali prove (qualitative o quantitative) abbiamo per sostenere questa relazione?

E se questa è una soluzione legittima a quel problema, c’è una versione più semplice di questa soluzione che potrebbe ugualmente realizzare quel problema ma essere meno complessa tecnicamente? Per esempio, invece dell’input e dell’output vocale, come potrebbe la complessità del solo input e output di testo influenzare il livello di sforzo e l’impatto sul coinvolgimento dell’utente?

E se un’interfaccia AI conversazionale senza la parte vocale (solo testo) raggiungesse l’80% del coinvolgimento dell’utente previsto ma richiedesse solo il 40% dello sforzo di sviluppo? Varrebbe la pena di prendere in considerazione una tale via alternativa?

Quale impatto commerciale avrebbe una tale soluzione rispetto al livello di sforzo? Come si confronta questo rapporto con quello di altri compiti concorrenti nel backlog?

Queste sono tutte domande focalizzate sul prodotto che un PM dovrebbe fare per allineare le soluzioni tecnologiche con le esigenze del business. Perché in definitiva, è il bisogno del business che guida i parametri di un modello di ML, non il contrario.

Perciò guardiamo ancora una volta i consigli sui film e quelle miniature personalizzate – qual è il problema o l’obiettivo del business?

Because You Watched…You’ll Love… – What Problem Does Movie Recommendation Help Solve?

Movie Recommendations: Identificare il problema

Il problema è che Netflix ha un’enorme collezione di contenuti (oltre 100 milioni di prodotti diversi, secondo Netflix) che cambia costantemente e può essere schiacciante per un utente da consumare. Gli utenti non vogliono essere frustrati nel trovare contenuti rilevanti per i loro interessi. Allora, qual è il modo migliore per permettere a ogni utente di consumare quei dati in un modo che alla fine massimizzi la fedeltà all’abbonamento?

Gli obiettivi del prodotto includono:

  • Aumentare / mantenere il numero di spettatori in termini di # minuti consumati,
  • Aumentare il # di titoli esplorati, aumento della frequenza di accesso
  • superamento di qualsiasi soglia minima che l’azienda determina come metrica di successo
  • aumento complessivo della fedeltà all’abbonamento mensile / diminuzione delle cancellazioni degli abbonati

Netflix Customalized Thumbnails At Work: 2 utenti diversi che vedono 2 immagini diverse per lo stesso film del Padrino: 1 che mostra un primo piano drammatico di un volto, l’altro che mostra una coppia felice e sorridente.

Una miniatura di immagine personalizzata / opera d’arte: Identificazione del problema

Questo caso d’uso è un sottoinsieme delle raccomandazioni di film. Dato che le raccomandazioni di film sono fornite all’utente, ora abbiamo ancora un altro problema di business/utente.

Problema: Come (e quando) presentiamo al meglio quella raccomandazione di film all’utente in un modo che massimizza il numero di spettatori e la fedeltà mensile degli abbonati?

Bene, un modo per fornire quella raccomandazione è attraverso una miniatura di immagine – ma che tipo di miniatura forniamo? E quanto siamo sicuri che la modifica di una miniatura dell’immagine influenzerà positivamente il numero di spettatori o la fedeltà degli abbonati?

E quanto è importante quella miniatura? Abbiamo dei dati per questo?

Raccolta di dati per sostenere questa ipotesi

Ebbene, si può essere certi che qualche individuo focalizzato sul prodotto a Netflix – in un periodo precedente al 2014 – si stava ponendo queste stesse domande internamente. E quell’individuo o gruppo ha lavorato insieme (probabilmente con UX e stakeholder correlati) per mettere insieme studi sugli utenti o dati altrove, per dimostrare che c’era davvero un forte legame tra una miniatura di immagine e l’audience.

Questa era la loro ipotesi: che la regolazione del contenuto artistico di una miniatura di immagine potrebbe avere un forte legame con l’audience.

Ebbene, già nel 2014, Netflix ha condotto degli studi che dimostrano quanto sia importante la miniatura:

Nick Nelson, manager globale dei servizi creativi di Netflix, ha spiegato che la società ha condotto una ricerca all’inizio del 2014 che ha scoperto che l’opera d’arte non era “solo il più grande influenzatore” nella decisione di un utente su cosa guardare, ma costituiva anche oltre l’82% della loro attenzione durante la navigazione su Netflix.

“Abbiamo anche visto che gli utenti hanno trascorso una media di 1,8 secondi a considerare ogni titolo che gli veniva presentato mentre erano su Netflix”, ha scritto Nelson. “Siamo rimasti sorpresi da quanto impatto ha avuto un’immagine su un membro che trovava un grande contenuto, e quanto poco tempo abbiamo avuto per catturare il loro interesse.”

Una piccola e convincente miniatura potrebbe fare la differenza tra farvi passare l’intero fine settimana a guardare l’ultimo successo Originals di Netflix o perdere interesse e passare a un servizio concorrente come Hulu o servizi di streaming OTT simili come ESPN / Disney / HBO Go.

Quindi, sulla base degli studi, l’ipotesi di cui sopra si è dimostrata molto vera.

OK, le miniature sono importanti. Ma cosa tagliamo esattamente?

E come fa un insieme di dati non strutturati come un mucchio di miniature di immagini ad essere inserito in un modello di apprendimento automatico digitale/matematico? Risponderemo a questa seconda domanda più avanti.

In primo luogo, data l’importanza della miniatura per la decisione di un utente di guardare qualcosa, come può Netflix generare miniature migliori per ogni utente per aumentare la possibilità che un utente guardi un video?

Usare l’arte originale del film come unica miniatura usata per ogni singola persona molto probabilmente non produrrà i più alti tassi di clic. L’azienda sta probabilmente lasciando i clic (e il tempo di flusso dello spettatore) sul tavolo!

E se Netflix creasse una miniatura diversa per ogni utente che è ottimizzata per aumentare i tassi di clic?

Quali sono le cose all’interno di una miniatura di immagine che sono sotto il controllo di Netflix che possono modificare per aumentare i tassi di clic?

Stesso film Riverdale, ma due diverse miniature artistiche, basate sulla preferenza passata dell’utente per i generi di film romantici (sorrisi dolci) o thriller (sguardi seri e drammatici).

Quale attore(i)/personaggio(i) dovrebbe essere su quella miniatura, se esiste? Quanti? Quale fotogramma generato automaticamente o variazione di poster sarebbe più allettante per un particolare utente a cliccare? Quale illuminazione funziona meglio? Filtri?

Quali dati abbiamo sul comportamento di clic di altri utenti in passato possiamo trarre associazioni per aiutare a informare questa decisione sulla miniatura in scala?

  • Aumentare il click-thru-rates (CTR) delle raccomandazioni di film – che significa coinvolgimento
  • Ipotesi che tassi di coinvolgimento più alti porteranno ad una maggiore soddisfazione e fedeltà degli abbonati

Quindi questo è un problema davvero interessante con la miniatura dell’immagine che può avere un enorme impatto sulla probabilità che qualcuno clicchi su un video e lo guardi.

Se l’obiettivo è quello di massimizzare la probabilità di visione modificando la miniatura – quali sono alcune decisioni di prodotto da considerare?

Considerazioni sul prodotto nelle miniature personalizzate delle immagini

Non ci addentreremo in ciascuno dei casi d’uso di cui sopra, ma ci addentreremo un po’ di più nel secondo: Artwork / Thumbnail Personalization

Questa è una funzione di personalizzazione guidata dai dati che si trova sopra il motore di raccomandazione dei film

Considerazioni sul prodotto

Gli algoritmi sono ottimi, ma hanno dei limiti. Un product manager dovrebbe sempre pensare in anticipo a possibili scenari di edge case in cui l’algoritmo potrebbe non produrre i migliori risultati.

  1. Ogni film dovrebbe idealmente avere una miniatura personalizzata che massimizzi i clic. Dal momento che Netflix ha dati sul comportamento di clic di altre persone con interessi simili, è un’ipotesi ragionevole per indovinare che se altre persone con interessi simili e la storia di guardare ha avuto un alto tasso di clic su una certa miniatura, allora è probabile che questa miniatura dell’immagine funzionerà su una nuova persona che non è ancora stata raccomandata questo film / miniatura.
  2. La miniatura personalizzata dovrebbe prendere in considerazione altri film che vengono raccomandati allo stesso tempo – e quali sono quelle raccomandazioni di immagini. Diciamo che Netflix sta raccomandando 2 diversi film di Spiderman a un utente fianco a fianco – ed entrambi hanno Spiderman rivolto verso la maschera della telecamera. Uno è Tobey Maguire e l’altro è Andrew Garfield. Non sarebbe strano per l’utente vedere entrambi i ritratti di Maguire e Garfield nei panni dell’Uomo Ragno senza maschera, uno accanto all’altro? Qualcosa di cui tenere conto se mai dovesse accadere.
    Una miniatura di un’immagine potrebbe funzionare bene da sola, ma potrebbe non essere abbastanza buona quando viene visualizzata una pagina con una dozzina di miniature. Se sono tutte ottimizzate per apparire allo stesso modo, allora come gruppo, ognuna può sembrare meno convincente. Quindi sarà importante guardare ogni miniatura insieme a ciò che viene presentato.
  3. I dati sono grandiosi, ma attenzione agli algoritmi che fanno il loro lavoro troppo bene, con conseguenze non volute / falsi positivi!
    In statistica, lo chiamano errore di tipo I – suggerendo falsamente (o impropriamente) una miniatura dell’immagine che non dovrebbe essere suggerita.

Caso esemplare: Basta guardare l’esempio qui sotto di Like Father, un film con Kristen Bell. Eppure, l’algoritmo di Netflix (probabilmente) ha fatto false raccomandazioni di miniature di attori/attrici neri di supporto che non rappresentano realmente ciò di cui il film parlava, ma ha sperimentato un tasso di clic più elevato tra un certo pubblico etnico.

Gli utenti neri vedono la miniatura sulla destra, nonostante non sia rappresentativa di ciò che il film tratta.

Siate quindi consapevoli che un’esperienza troppo ottimizzata / personalizzata potrebbe creare un’esperienza utente monotona che in alcuni casi può essere fuorviante per l’utente. Vogliamo fornire un sano mix di familiare con l’inaspettato, ma anche ritrarre accuratamente il contenuto per l’utente in modo che non sia impropriamente fuorviato.

Ecco un altro esempio:

Basato sull’alta probabilità di click-thru-rates (CTR), Netflix ha finito per presentare agli utenti miniature che corrispondevano all’etnia di un utente – – anche quando quell’attore/attrice (di solito) di supporto aveva pochissimo tempo in quel film.

La raccomandazione di un utente nero mostra miniature che riflettono la sua etnia – anche quando quella miniatura non è necessariamente rappresentativa del film in generale.

Sebbene questa sia un’iniziativa supportata dai dati, è abbastanza ovvio per l’utente che c’è una sensazione di dis-ingenuità che può essere fuorviante in termini di una miniatura che rappresenta accuratamente quel film (errore di tipo I falso positivo).

Ovviamente, questo algoritmo sarà probabilmente messo a punto nel tempo, ma la lezione qui è di non esagerare quando si sfruttano i dati – applicare un po’ di buon senso per bilanciarlo.

Non vogliamo fuorviare impropriamente gli utenti o fargli sapere che vengono trattati diversamente a causa della loro razza, per esempio.

4. Infine, l’algoritmo dovrebbe prendere in considerazione quali miniature l’utente ha visto in precedenza in associazione con questo film e mirare a fornire un’esperienza utente coerente e non confusa.

Vogliamo evitare che l’utente veda miniature diverse ogni volta che quel film appare all’utente. Non solo questo confonderebbe l’utente, ma renderebbe anche difficile per un Product Manager assegnare l’attribuzione a un clic – quale immagine ha portato a un maggiore click-thru-rate (CTR) quando continua a cambiare? I PM devono essere in grado di attribuire correttamente ogni nuovo risultato a un cambiamento specifico – quindi mantenere un’attribuzione coerente dei dati è importante.

Quindi queste sono alcune cose che un product manager dovrebbe considerare quando progetta scenari di edge case e quali casi estremi di utilizzo dei dati può comportare. Parlando di dati, su cosa lavora nello specifico Netflix?

Quali dati abbiamo?

Ci sono due parti da considerare:

  1. Quali dati utilizza Netflix per creare queste miniature/opere d’arte personalizzate?
  2. Quali dati utilizza Netflix per indirizzare queste miniature personalizzate all’individuo appropriato?

Per la prima domanda, considera che

  • Un episodio di 1 ora di Stranger Things ha >86.000 fotogrammi video statici
  • A questi fotogrammi video possono essere assegnati individualmente alcuni attributi che vengono poi utilizzati per filtrare i migliori candidati per le miniature attraverso un insieme di strumenti e algoritmi chiamati Aesthetic Visual Analysis (AVA). Questo è progettato per trovare la migliore immagine thumbnail personalizzata da ogni fotogramma statico del video
  • Netflix Annotation – Netflix crea meta dati per ogni fotogramma tra cui luminosità (.67), # di volti (3), toni della pelle (.2), probabilità di nudità (.03), livello di sfocatura del movimento (4), simmetria (.4)
  • Netflix Image Ranking – Netflix utilizza i metadati di cui sopra per scegliere le immagini specifiche che sono di altissima qualità (buona illuminazione, nessuna sfocatura, probabilmente contiene qualche foto del volto dei personaggi principali da un’angolazione decente, non contiene contenuti di marca non autorizzati, ecc) e più cliccabili

Per la seconda domanda su quali dati Netflix utilizza per identificare a chi indirizzare queste miniature generate su misura, si consideri che Netflix tiene traccia:

  • # di film guardati, # di minuti di ogni spettacolo guardato
  • % di completamento per ogni video/serie
  • # di upvotes, quali film sono stati favoriti, ecc
  • % del contenuto complessivo che è attribuibile a qualsiasi spettacolo specifico (e quindi il livello di affinità che l’utente ha per uno spettacolo specifico o membri del cast correlati)
  • qualsiasi tendenza stagionale o settimanale relativa al livello di coinvolgimento di un utente, ecc.

Interessante notare che a metà 2018 Netflix ha smesso di accettare le recensioni degli utenti come punto dati, che in precedenza aveva sollecitato solo sul loro sito web. Perché? Perché questa “caratteristica” riduce effettivamente il numero di spettatori, poiché le recensioni negative scoraggiano gli utenti dal provare un video. Questo è solo un altro esempio di come un bisogno del business sostituisce un bisogno popolare degli utenti!

Così Netflix ha una TONNELLATA di dati su ciascuno dei suoi clienti – dai video guardati alle immagini cliccate. Cosa fanno con tutti questi dati?

Come Netflix usa i dati per costruire un universo di interessi del profilo dell’utente

Bene, li usano per mettere insieme un profilo a 360 gradi di ogni utente e indicizzare matematicamente ogni utente secondo centinaia, forse migliaia di attributi diversi.

Lo fanno per cercare di raggruppare persone con interessi simili in modo da poter usare i dati di un utente per aiutare a prevedere il probabile comportamento di altri utenti simili.

Come funziona questo raggruppamento di profili di utenti simili e come fa un product manager a dare un senso ai dati?

Avendo affrontato la complessa matematica e gli algoritmi associati a matrici, vettori e analisi di caratteristiche n-dimensionali, ho trovato il modo più semplice per capire come funziona tutto questo è attraverso una rappresentazione spaziale 3D di 10+ dimensioni.

Ecco una schermata che ho preso quando ho usato TensorBoard di Google sul database mNIST di cifre scritte a mano. Si tratta di una trama di fantasia chiamata trama t-SNE – effettivamente una rappresentazione 3D di molte più dimensioni di 3. In questo caso, stiamo mostrando 10 dimensioni (una per ogni cifra da 1 a 10) su un sistema di coordinate 3D simile a una sfera.

Una trama t-SNE di 10 dimensioni in una vista 3D utilizzando Tensorboard di Google. Sembra complesso all’inizio, ma in realtà è abbastanza semplice.

La posizione di ogni cifra scritta a mano in questa rappresentazione spaziale può essere descritta da un vettore – una serie di numeri simili a coordinate attraverso quante sono le dimensioni delle caratteristiche.

Similmente, con gli utenti di Netflix, la posizione di ogni profilo di utente nel grafico di cui sopra potrebbe essere descritta da valori numerici che rappresentano ciascuno una dimensione individuale dell’interesse di quell’utente – compreso il genere di film, gli attori/attrici preferiti, l’argomento del film, ecc.

Rimmaginare gli utenti di Netflix in relazione matematica l’uno con l’altro

Facciamo finta che nel diagramma delle cifre qui sopra:

  • “6” = commedia romantica
  • “4” = thriller

Se un utente è etichettato come “6” da Netflix, allora sarà collocato nelle vicinanze generali di dove sono tutti gli altri 6 turchesi nella rappresentazione spaziale di cui sopra (vicino al fondo).

Parimenti, se un utente è etichettato come “4” da Netflix, allora sarà collocato nelle vicinanze generali di dove sono tutti gli altri 4 magenta nella rappresentazione spaziale di cui sopra (vicino alla parte superiore).

Facciamo finta che ogni numero rappresenti un genere di film. Un utente a cui piacciono le commedie romantiche (6) potrebbe essere matematicamente più vicino a qualcuno a cui piace la parodia (5) che a qualcuno a cui piace un thriller (4).

Nota come la regione turchese “6” (commedia romantica) si sovrappone in qualche modo alla regione grigia “5”. Questo potrebbe essere analogo a come agli utenti a cui piacciono le commedie romantiche potrebbero piacere anche i film di parodia o satira perché entrambi implicano il ridere.

Similmente, poiché la regione magenta “4” (thriller) è in qualche modo vicina alla regione rosa “9” – questa regione rosa 9 potrebbe rappresentare coloro che amano i film d’azione – matematicamente più vicini alla regione thriller “4” che alla regione commedia romantica “6”.

Ha senso? Quindi, se rappresentata spazialmente, la distanza tra due profili di utenti rappresenta quanto sono simili / diversi i loro gusti. Naturalmente, questo può diventare infinitamente più complesso quando a qualcuno a cui piacciono le commedie romantiche piacciono anche i thriller – ma lo scopo di questa analogia è di mostrare l’idea generale delle relazioni matematiche / spaziali tra diverse categorie.

Gruppi di interesse che sono correlati tra loro apparirebbero più vicini e potrebbero essere buoni predittori di ciò che piacerà a un utente, dato che all’utente piace qualcos’altro nelle vicinanze.

Questo è il modo in cui Netflix, o davvero qualsiasi azienda che sfrutta i modelli ML, crea relazioni tra dati apparentemente non strutturati e trasforma quei dati in numeri. Questi numeri da soli non hanno molto senso, ma insieme, in relazione l’uno all’altro, cominciano ad avere un senso.

Per lo stesso film Good Will Hunting qui sotto, un utente identificato come fan della commedia verrebbe mostrato una miniatura di Robin Williams (comico), mentre un altro utente identificato come fan della commedia romantica verrebbe mostrato una miniatura di un bacio con Matt Damon e Minnie Driver. Sebbene non sia perfetto, gli algoritmi di Netflix suggeriscono che tale livello di personalizzazione basato sulle caratteristiche del profilo dell’utente aumenta la probabilità di tassi di click thru.

Perciò riassumiamo. Un mucchio di miniature di immagini di Netflix è un mucchio di dati non strutturati.

Ma una volta che Netflix annota ogni miniatura e assegna metadati a ciascuna per descrivere cosa c’è in quella miniatura – ora abbiamo una rappresentazione numerica di quei dati non strutturati.

Plottare quella rappresentazione numerica sotto forma di vettori su una sfera 3D come abbiamo fatto sopra – e ora Netflix inizia a formare relazioni tra i punti di dati.

Netflix trova quindi punti di dati che sono relativamente vicini tra loro e li usa per aiutare a prevedere il futuro comportamento dei click thru. Se le previsioni si rivelano cattive o buone, aggiustano di conseguenza il posizionamento matematico di queste caratteristiche fino a quando il modello diventa sempre migliore nel tempo.

Ecco come Netflix trasforma i dati non strutturati in rappresentazioni matematiche. Utilizza la distanza relazionale tra i punti di dati come base per creare e migliorare le raccomandazioni di miniature di immagini.

Cosa ha imparato Netflix da tutti questi dati?

Ora che sappiamo come Netflix trasforma le immagini in numeri in un modello di apprendimento automatico, quali sono alcune intuizioni che Netflix ha trovato da tutta l’elaborazione dei dati e dai test A/B che ha condotto per così tanti anni?

Bene, oltre a imparare i milioni di miniature individuali che hanno convertito gli utenti in abbonati fedeli nel tempo, ecco alcune cose aggiuntive che Netflix ha imparato su cosa funziona in termini di miniature:

  • Mostra primi piani di volti emotivamente espressivi
  • Mostra alla gente i cattivi invece degli eroi
  • Non mostrare più di tre personaggi

In conclusione: Netflix ha utilizzato l’IA (per lo più) nel modo giusto. Impariamo dal loro approccio.

Netflix ha fatto un lavoro fenomenale nell’applicare l’IA, la scienza dei dati e l’apprendimento automatico nel “modo giusto” – usando un approccio basato sul prodotto che si concentra prima sui bisogni del business e poi sulla soluzione IA, piuttosto che il contrario.

Quando applicata correttamente, l’IA può fare miracoli.

Abbiamo visto quanto possano essere efficaci le soluzioni AI nel personalizzare l’esperienza a vantaggio sia di Netflix in termini di abbonamenti che degli utenti in termini di soddisfazione complessiva.

Abbiamo anche visto i limiti degli algoritmi che “esagerano” e abbiamo discusso esempi specifici in cui l’algoritmo di Netflix ha presentato miniature fuorvianti per le persone di colore perché l’algoritmo ha ottimizzato i clic, “ingannando” efficacemente gli utenti a cliccare sull’esca. Questo accadeva anche quando quella miniatura non rappresentava accuratamente quel video.

Nessun algoritmo sarà perfetto nel tenere conto di tutte le sfumature di un’esperienza umana. Infatti, gli algoritmi progettati per sfruttare le metriche faranno proprio questo – quindi è il ruolo del product manager di lavorare con il design o altri membri del team per trovare modi per affrontare queste carenze negli algoritmi.

Andando avanti, l’integrazione dell’IA nella società così come nello spazio aziendale continuerà a diventare sempre più prevalente.

I tecnologi possono avere la tendenza a prescrivere soluzioni di IA esistenti, ma in realtà il modo più efficace per adottare l’IA è il modo in cui l’ha fatto Netflix – da una prospettiva guidata dal business prima.

Scavate a fondo e vedrete che Netflix ha generato dati di supporto prima di fare la mossa strategica in avanti.

Come il mondo dell’IA, della scienza dei dati e dell’apprendimento automatico continua a crescere, noi product manager possiamo tutti prendere una o due lezioni dal playbook di Netflix quando si tratta di implementare correttamente le soluzioni di IA.

Video su YouTube che mostra l’algoritmo di generazione di miniature di Netflix.

Similar Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.