Hoe Netflix AI, Data Science en Machine Learning gebruikt - vanuit een productperspectief

Zelfde Riverdale-film, maar twee verschillende artistieke beeldminiaturen, gebaseerd op de voorkeur van gebruikers in het verleden voor romantiek (lieve glimlachjes) of thriller (serieuze, dramatische blikken) filmgenres.

Zwarte gebruikers krijgen de rechter thumbnail te zien, ondanks dat deze niet representatief is voor waar de film over gaat.

De aanbeveling van een zwarte gebruiker toont miniaturen die haar etniciteit weerspiegelen – zelfs wanneer die miniaturen niet noodzakelijk representatief zijn voor de film in het algemeen.

Een t-SNE plot van 10 dimensies in een 3D-weergave met behulp van Google’s Tensorboard.

De positie van elk handgeschreven cijfer in deze ruimtelijke weergave kan worden beschreven door een vector – een coördinaatachtige reeks getallen over hoeveel kenmerkdimensies dan ook.

Ook bij Netflix-gebruikers kan de positie van elk gebruikersprofiel in de bovenstaande grafiek worden beschreven door numerieke waarden die elk een individuele dimensie van de interesse van die gebruiker vertegenwoordigen – inclusief filmgenre, favoriete acteurs/actrices, filmonderwerp, enzovoort.

Reimagining Netflix Users in Mathematical Relation To Each Other

Laten we in het bovenstaande cijferdiagram doen alsof:

“6” = romantische komedie
“4” = thriller

Als een gebruiker door Netflix wordt gelabeld als een “6”, dan wordt hij/zij geplaatst in de algemene nabijheid van waar alle andere turquoise 6’s zich in de bovenstaande ruimtelijke weergave bevinden (in de buurt van de bodem).

Ook als een gebruiker door Netflix als een “4” wordt bestempeld, wordt hij/zij in de algemene nabijheid geplaatst van waar alle andere magenta 4’s zich in de bovenstaande ruimtelijke voorstelling bevinden (dichtbij de bovenkant).

Laten we doen alsof elk nummer een filmgenre vertegenwoordigt. Een gebruiker die van romantische komedies (6) houdt, zou wiskundig gezien dichter bij iemand kunnen staan die van parodieën (5) houdt dan bij iemand die van thrillers (4) houdt.

Merk op hoe de turquoise “6”-regio (romantische komedies) enigszins overlapt met de grijze “5”-regio. Dit zou analoog kunnen zijn aan de manier waarop gebruikers die van romantische komedies houden, ook van parodie- of satirefilms kunnen houden, omdat er in beide gevallen om gelachen moet worden.

Zo ook, omdat het magenta “4”-gebied (thriller) enigszins dicht bij het roze “9”-gebied ligt – dit roze “9”-gebied zou degenen kunnen vertegenwoordigen die van actiefilms houden – wiskundig gezien dichter bij het “4”-gebied van de thriller dan bij het “6”-gebied van de romantische komedie.

Blijkt dat logisch? Dus wanneer ruimtelijk weergegeven, de afstand tussen twee gebruikers profielen geeft aan hoe gelijk / verschillend hun smaak zijn. Natuurlijk kan dit oneindig veel complexer worden als iemand die van romantische komedies houdt ook van thrillers houdt – maar het doel van deze analogie is om het algemene idee van wiskundige / ruimtelijke relaties tussen verschillende categorieën te laten zien.

Interestgroepen die aan elkaar gerelateerd zijn, zouden dichter bij elkaar verschijnen en goede voorspellers kunnen zijn van wat een gebruiker leuk zal vinden, gegeven dat de gebruiker iets anders in de buurt leuk vindt.

Dit is hoe Netflix, of echt elk bedrijf dat ML-modellen gebruikt, relaties creëert tussen schijnbaar ongestructureerde gegevens en die gegevens omzet in getallen. Deze nummers op zichzelf hebben niet veel zin, maar samen in relatie tot elkaar, beginnen ze zin te krijgen.

Voor dezelfde Good Will Hunting-film hieronder, zou een gebruiker die is geïdentificeerd als een komediefan een Robin Williams (komiek) thumbnail te zien krijgen, terwijl een andere gebruiker die is geïdentificeerd als een romantische komediefan een kussende thumbnail te zien zou krijgen met Matt Damon en Minnie Driver. Hoewel niet perfect, suggereren de algoritmes van Netflix dat een dergelijke mate van personalisering op basis van gebruikersprofielkenmerken de waarschijnlijkheid van doorklikpercentages verhoogt.

YouTube-video waarin het thumbnail-generatie-algoritme van Netflix wordt getoond.

Hoe Netflix AI, Data Science en Machine Learning gebruikt – vanuit een productperspectief

Wat is de bedrijfsbehoefte/het bedrijfsprobleem?

Filmaanbevelingen: Identifying the Problem

Personalized Image Thumbnail / Artwork: Identifying the Problem

OK, Thumbnails zijn belangrijk.

Product Considerations In Personalized Image Thumbnails

Welke gegevens hebben we?

Hoe Netflix gegevens gebruikt om een universum van interesses voor gebruikersprofielen samen te stellen

Reimagining Netflix Users in Mathematical Relation To Each Other

Wat heeft Netflix geleerd van al deze gegevens?

In Conclusion: Netflix heeft AI (meestal) op de juiste manier ingezet. Laten we leren van hun aanpak.

Similar Posts

Efficiënt, betaalbaar en aanpasbaar: De voordelen van een verplaatsbare woning – Guardian Booth

Ten Cutest Underwater Animals

Geef een antwoord Antwoord annuleren