Como a Netflix Utiliza a IA, Ciência de Dados e Aprendizagem de Máquinas – Da Perspectiva do Produto

author
27 minutes, 18 seconds Read
Fev 27, 2019 – 18 min leia-se

>

>

>>

>>

>

>

Os algoritmos de aprendizagem de máquinas da Netflix são impulsionados pelas necessidades do negócio.

A presença de IA na sociedade atual está se tornando cada vez mais ubíqua – particularmente à medida que grandes empresas como Netflix, Amazon, Facebook, Spotify, e muitas mais continuamente implantam soluções relacionadas à IA que interagem diretamente (muitas vezes nos bastidores) com os consumidores diariamente.

Quando aplicadas corretamente aos problemas de negócios, essas soluções relacionadas à IA podem fornecer soluções realmente únicas que escalam e melhoram ao longo do tempo, criando um impacto significativo tanto para as empresas quanto para os usuários. Mas o que significa “aplicar corretamente” uma solução de IA? Isso significa que existe um caminho errado? De uma perspectiva de produto, a resposta curta é sim, e vamos descobrir o porquê disso mais tarde neste artigo à medida que nos aprofundamos.

Overvisão geral: Primeiro, vamos delinear 5 casos de uso de ciência de dados ou aprendizagem de máquinas na Netflix. Em seguida, discutiremos algumas necessidades de negócios versus considerações técnicas que um Gerente de Produto analisaria. Depois vamos mergulhar um pouco mais fundo no que é talvez o mais interessante desses 5 casos de uso à medida que identificamos qual problema de negócio ele procura resolver.

1. Vamos construir uma Rede Neural simples!

2. Árvores de Decisão no Aprendizado de Máquinas

3. Uma introdução intuitiva ao Aprendizado de Máquinas

4. O Equilíbrio entre Passivo vs. I.A. Ativo.

5 Casos de Uso de IA/Dados/Aprendizagem de Máquina na Netflix

  1. Personalização de Recomendações de Filmes – Os utilizadores que vêem A são susceptíveis de ver B. Esta é talvez a característica mais conhecida de uma Netflix. A Netflix usa o histórico de outros usuários com gostos similares para recomendar o que você pode estar mais interessado em assistir a seguir, para que você continue engajado e continue sua assinatura mensal para mais.
  2. Auto-Geração e Personalização de Miniaturas / Trabalho de Arte – Usando milhares de quadros de vídeo de um filme ou show existente como ponto de partida para a geração de miniaturas, a Netflix anotará essas imagens e então classificará cada imagem num esforço para identificar quais miniaturas têm a maior probabilidade de resultar no seu clique. Estes cálculos são baseados no que outros que são semelhantes a você clicaram. Uma descoberta poderia ser que os usuários que gostam de certos atores / gêneros de filmes são mais propensos a clicar em miniaturas com certos atores / atributos de imagem.
  3. Procura de locais para produção de filmes (Pré-Produção) – Usando dados para ajudar a decidir onde e quando melhor filmar um set de filmes – dadas as restrições de programação (disponibilidade de atores / desenho), orçamento (local, custos de vôo / hotel), e requisitos de cena de produção (filmagem dia vs noite, probabilidade de riscos de eventos meteorológicos em um local). Note que isso é mais um problema de otimização da ciência dos dados do que um modelo de aprendizagem de máquina que faz previsões baseadas em dados passados.
  4. Edição de Filmes (Pós-Produção) – Usar dados históricos de quando as verificações de controle de qualidade falharam no passado (quando a sincronização das legendas com o som/movimentos estava desligada no passado) – para prever quando uma verificação manual é mais benéfica no que poderia ser um processo muito trabalhoso e demorado.
  5. Streaming Quality – Usando dados de visualização anteriores para prever o uso da largura de banda para ajudar a Netflix a decidir quando fazer cache de servidores regionais para tempos de carga mais rápidos durante o pico (esperado) da demanda.

Estes 5 casos de uso / aplicações de ciência de dados ou aprendizagem de máquinas só na Netflix tiveram um impacto tão escalável que mudaram para sempre o cenário tecnológico e a experiência do usuário para milhões e mais. A adoção dessas soluções relacionadas à IA só vai se fortalecer com o tempo.

Mas antes desses casos de uso eram tão comuns como são hoje e usados por usuários como você e eu, alguém ou algum grupo dentro da Netflix conectou corretamente essas soluções de IA com uma necessidade de negócios. Sem esse link de negócios, esses casos de uso seriam simplesmente idéias de pie-in-the-sky sentadas no fundo de um backlog, como tantas outras grandes idéias. Somente através do posicionamento e conexão adequados com o problema central do negócio da Netflix é que essas idéias se tornaram a realidade que são hoje.

>

Netflix usa a aprendizagem da máquina para gerar muitas variações de imagens em miniatura de alta-probabilidade click-thru que ela incessantemente e continuamente testa A/B ao longo de sua base de usuários – para cada usuário e cada filme – tudo para aumentar a probabilidade de você clicar e assistir.

Qual é a Necessidade/Problema do Negócio?

Notificação em cada um dos casos de uso que identifiquei acima, cada um deles está associado a uma necessidade, objetivo ou hipótese de negócio específica.

Isso é absolutamente importante para qualquer gerente de produto – para evitar a tentação do entusiasta da tecnologia que se maravilha nos detalhes da ciência de dados / ou ML por razões intelectuais sem identificar claramente o problema ou necessidade de negócio – potencialmente usando recursos técnicos valiosos sem impacto no negócio.

No final do dia, os gerentes de produto precisam conectar corretamente um problema de negócio a uma solução de aprendizagem de máquina de dados. Queremos evitar ter uma solução que esteja atrás de um problema, caso contrário o projeto perderá força dentro da empresa: os engenheiros não saberão claramente qual é a sua estrela norte, as partes interessadas em toda a organização não vão aderir e alocar os recursos necessários para tornar o projeto um sucesso, etc.

Certifique-se de que há um problema ao qual uma solução de IA pode estar diretamente ligada

A aprendizagem de máquinas (ML) é uma solução potencial de IA – mas precisamos primeiro definir o problema antes de prescrever essa solução.

Qual é o resultado comercial que estamos tentando alcançar com o ML? Porque essa necessidade central do negócio é o que impulsiona os parâmetros dos modelos ML usados, que dados são coletados e processados, etc. Nós não fazemos ML para fornecer personalização só porque é uma tecnologia interessante – nós precisamos ligá-la a um problema de negócio. Os cientistas de dados são especialistas em descobrir insights a partir dos dados, mas é o papel do gerente de produto ligá-los adequadamente a uma necessidade ou problema de negócio e compará-los com as prioridades da concorrência.

Por exemplo, um entusiasta da tecnologia poderia dizer:

Não seria legal se você pudesse analisar / debater um episódio usando voz com Netflix – e Netflix, com a entrada de dados de milhares de reações de outros usuários a esse episódio, poderia responder inteligentemente aos seus comentários em um diálogo bidirecional de ida e volta?

Sim, isso seria um caso de uso bastante impressionante alavancando o processamento de linguagem natural (PNL) para entender seu comentário pós-episódio em contexto. Além da PNL, este caso de uso usa texto para expressar personalidades, bem como análise de sentimentos de como milhares de outros se sentiram sobre o que aconteceu naquele episódio, ou como eles se sentem sobre um determinado personagem. Na verdade, esta é uma bela fusão de várias tecnologias de ponta em um caso de uso.

Se uma versão piloto do MVP mostrasse que os usuários que se envolveram com seu novo recurso ficassem mais tempo ou voltassem mais vezes ou ajudassem a fazer mais boca-a-a-boca sobre a Netflix, então poderia justificar mais recursos. A decisão inicial de construir esse MVP dependeria da decisão estratégica tomada pelas partes interessadas, não necessariamente priorizada pela métrica. Isso dependerá da estratégia da empresa.

Mas, por mais bonito que seja o cenário de um usuário, qual problema isso resolve?

Como se relaciona com o principal problema da Netflix de manter os usuários assinantes todos os meses? Se está relacionado, que evidência (qualitativa ou quantitativa temos que suportar esse relacionamento?

E se esta é uma solução legítima para esse problema, existe uma versão mais simples dessa solução que poderia igualmente realizar esse problema mas ser menos complexa do ponto de vista técnico? Por exemplo, em vez de entrada e saída de voz, como a complexidade de apenas entrada e saída de texto poderia afetar o nível de esforço e impacto no envolvimento do usuário?

E se uma interface de IA conversacional sem a parte de voz (apenas texto) alcançasse 80% do envolvimento do usuário pretendido, mas apenas exigisse 40% do esforço de desenvolvimento? Valeria a pena considerar essa rota alternativa?

Que impacto tal solução teria no negócio em comparação com o nível de esforço? Como esta relação se compara com a de outras tarefas concorrentes no backlog?

Estas são todas perguntas focadas no produto que um PM deveria estar fazendo para alinhar as soluções tecnológicas com as necessidades do negócio. Porque, em última análise, é a necessidade do negócio que conduz os parâmetros de um modelo ML e não o contrário.

Então vamos ver mais uma vez as recomendações de filmes e aquelas miniaturas personalizadas – qual é o problema ou o objectivo do negócio?

>

>

>

Porque Você Assistiu…Você Vai Adorar… – Que Problema a Recomendação de Filme Ajuda a Resolver?
>

A Recomendações de Filme: Identificando o problema

O problema é que Netflix tem uma enorme coleção de conteúdo (mais de 100 milhões de produtos diferentes, segundo Netflix) que está em constante mudança e pode ser esmagador para um usuário consumir. Os usuários não querem ficar frustrados em encontrar conteúdos relevantes aos seus interesses. Então, qual é a melhor maneira de permitir que cada usuário consuma esses dados de uma forma que, em última análise, maximize a fidelidade da assinatura?

Objetivos do produto incluem:

  • Aumentar / manter a visualização em termos de # minutos consumidos,
  • Incrementar em # títulos explorados, Frequência de login de volta em
  • Exceder o limite mínimo que a empresa determina como métrica de sucesso
  • Aumento total da fidelidade / diminuição de cancelamentos de assinaturas mensais
>

Netflix Miniaturas Personalizadas no Trabalho: 2 Usuários Diferentes Vendo 2 Imagens Diferentes para o mesmo filme do Padrinho: 1 mostrando um close-up dramático de um rosto, o outro mostrando um casal feliz sorridente.

Personalizado Miniatura de Imagem / Trabalho de Arte: Identificando o problema

Este caso de uso é um subconjunto de Recomendações do Filme. Dado que as recomendações de filmes são fornecidas ao usuário, agora temos mais um problema de negócio / usuário.

Problema: Como (e quando) é melhor apresentar essa recomendação de filme ao usuário de forma a maximizar a fidelidade do espectador e assinante mensal?

Bem, uma forma de fornecer essa recomendação é através de uma miniatura de imagem – mas que tipo de miniatura fornecemos? E quão confiantes estamos de que o ajuste de uma miniatura de imagem irá afectar a fidelidade dos espectadores ou assinantes de uma forma positiva?

E quão importante é essa miniatura? Temos dados para isso?

Reunir dados para suportar essa hipotese

Bem, pode ter a certeza que algum indivíduo focado no produto na Netflix – numa altura anterior a 2014 – estava a fazer exactamente estas mesmas perguntas internamente. E esse indivíduo ou grupo trabalhou em conjunto (provavelmente com UX e partes interessadas relacionadas) para reunir estudos de usuários ou dados em outro lugar, para provar que havia de fato uma forte ligação entre uma miniatura de imagem e o público espectador.

Essa era a hipótese deles: que ajustar o conteúdo artístico de uma miniatura de imagem poderia ter uma forte ligação com o público espectador.

Bem, afinal, em 2014, a Netflix realizou estudos mostrando o quão importante essa miniatura é:

Nick Nelson, gerente global de serviços criativos da Netflix, explicou que a empresa realizou uma pesquisa no início de 2014 que descobriu que a arte era “não só o maior influenciador” para a decisão do usuário sobre o que assistir, mas também constituía mais de 82% de seu foco enquanto navegava na Netflix.

“Vimos também que os usuários passaram uma média de 1,8 segundos considerando cada título que lhes foi apresentado enquanto navegavam na Netflix”, escreveu Nelson. “Ficamos surpresos com o impacto que uma imagem teve sobre um membro ao encontrar um grande conteúdo, e com o pouco tempo que tivemos para captar seu interesse”.”

Uma pequena e convincente miniatura poderia significar a diferença entre conseguir que você passe o fim de semana inteiro assistindo os últimos originais da Netflix serem atingidos ou perder o interesse e saltar para um serviço concorrente como o Hulu ou serviços de streaming OTT similares como ESPN / Disney / HBO Go.

Então, com base em estudos, a hipótese acima foi mostrada como muito verdadeira.

OK, Thumbnails Are Important. Mas O Que Exatamente Nós Ajustamos?

E como um conjunto de dados não estruturado como um monte de miniaturas de imagens é alimentado em um modelo de aprendizagem de máquina digital/matemática? Vamos responder a esta segunda pergunta mais abaixo.

Primeiro, dada a importância da miniatura para a decisão do usuário de assistir a algo, como a Netflix pode gerar melhores miniaturas para cada usuário para aumentar a chance de um usuário assistir a um vídeo?

Usando a arte original do filme como a única miniatura usada para cada pessoa muito provavelmente não renderá a maior taxa de cliques. É provável que o negócio deixe os cliques (e o tempo de transmissão do visualizador) na mesa!

E se a Netflix criou uma miniatura diferente para cada utilizador, que é optimizada para aumentar as taxas de cliques?

O que são as coisas dentro de uma miniatura de imagem que estão dentro do controlo da Netflix que eles podem ajustar para aumentar essas taxas de cliques?

>

Same Riverdale Movie, mas duas miniaturas de imagens artísticas diferentes, baseadas na preferência do utilizador por géneros de filmes românticos (sorrisos doces) ou de thriller (aparência séria e dramática).

Que actor(es)/carácter(es) deveria(m) estar nessa miniatura, se houver? Quantos? Qual a variação de frame ou poster gerado automaticamente que seria mais sedutor para um determinado usuário clicar? Qual iluminação funciona melhor? Filtros?

Que dados temos sobre o comportamento de outros usuários que já clicaram no passado, podemos fazer associações para ajudar a informar esta decisão em miniatura em escala?

  • Increase click-thru-rates (CTR) de recomendações de filmes – significando envolvimento
  • Hipótese de que maiores taxas de envolvimento levarão a maior satisfação e lealdade do assinante
  • Então este é um problema realmente interessante com a miniatura da imagem que pode ter um enorme impacto na probabilidade de alguém clicar em um vídeo e assistir.

    Se o objectivo é maximizar essa probabilidade de ver, afinando a miniatura – quais são algumas decisões de produto a considerar?

    Considerações de produto em miniaturas de imagens personalizadas

    Não vamos mergulhar em cada um dos casos de uso acima, mas vamos mergulhar um pouco mais no segundo: Artwork / Thumbnail Personalization

    Esta é uma funcionalidade de personalização orientada por dados que se situa em cima do motor de recomendação de filmes

    Algoritmos de produto

    Algoritmos são óptimos, mas têm limitações. Um gerente de produto deve sempre pensar à frente de possíveis cenários de casos de borda em que o algoritmo pode não produzir os melhores resultados.

  1. Cada filme deve idealmente ter um thumbnail personalizado que maximize os cliques. Como a Netflix tem dados sobre o comportamento dos cliques de outras pessoas com interesses semelhantes, é uma hipótese razoável adivinhar que se outras pessoas com interesses semelhantes e o histórico de relógios tivessem uma alta taxa de cliques numa determinada miniatura, então é provável que esta miniatura de imagem se realize numa nova pessoa que ainda não tenha sido recomendada para este filme / miniatura.
  2. A miniatura personalizada deve ter em consideração outros filmes que estejam a ser recomendados ao mesmo tempo – e quais são essas recomendações de imagem. Digamos que Netflix está recomendando 2 filmes diferentes do Homem-Aranha para um usuário lado a lado – e ambos têm o Homem-Aranha de frente para a máscara da câmera fora. Um é Tobey Maguire e o outro é Andrew Garfield. Não seria estranho para o usuário ver ambos os retratos de Maguire e Garfield como o Homem-Aranha com as máscaras fora – lado a lado? Algo para explicar se isso alguma vez acontecesse.
    Uma miniatura de imagem poderia funcionar bem isoladamente, mas isso pode não ser bom o suficiente quando uma página de uma dúzia de miniaturas aparece. Se todas elas forem optimizadas para terem o mesmo aspecto, então como um grupo, cada uma delas pode parecer menos convincente. Então olhar para cada miniatura junto com o que mais está sendo apresentado será importante.
  3. Os dados são ótimos, mas cuidado com os algoritmos que fazem seu trabalho muito bem, resultando em conseqüências não intencionais / falsos positivos!
    Em estatísticas, chamam a isto um erro do tipo I – falsamente (ou impropriamente) sugerindo uma miniatura de imagem que não deve ser sugerida.

Case in point: Basta olhar para o exemplo abaixo de Like Father, um filme estrelado por Kristen Bell. No entanto, o algoritmo da Netflix (indiscutivelmente) fez recomendações falsas de miniaturas de atores/atrizes negros que não representam realmente o que o filme era, mas experimentaram uma maior taxa de cliques entre certas audiências étnicas.

>

Usuários negros estão vendo a miniatura à direita, apesar de não ser representativa do que é o filme.

Então esteja ciente de que uma experiência excessivamente otimizada / personalizada pode criar uma experiência monótona para o usuário que, em alguns casos, pode ser enganadora para o usuário. Nós queremos fornecer uma mistura saudável do familiarizado com o inesperado, mas também retratar com precisão o conteúdo para o usuário para que ele não seja indevidamente enganado.

Aqui está outro exemplo:

Baseado na alta probabilidade de click-thru-rates (CTRs), o Netflix acabou apresentando miniaturas para usuários que combinavam com a etnia de um usuário – – mesmo quando aquele (geralmente) ator/atriz coadjuvante tinha muito pouco grito naquele filme.

>

A recomendação de um usuário negro mostra miniaturas refletindo sua etnia – mesmo quando essa miniatura não é necessariamente representativa do filme em geral.

Embora esta seja uma iniciativa apoiada por dados, é bastante óbvio para o usuário que há um sentimento de des-ingenuousness que pode ser enganoso em termos de uma miniatura representando com precisão aquele filme (erro falso positivo do Tipo I).

Obviamente, este algoritmo provavelmente será aperfeiçoado com o tempo, mas a lição aqui é não exagerar ao capitalizar nos dados – aplicar algum senso comum para equilibrá-lo.

Não queremos enganar os utilizadores ou deixá-los saber que estão a ser tratados de forma diferente devido à sua raça, por exemplo.

4. Por último, o algoritmo deve ter em consideração as imagens em miniatura que o utilizador viu anteriormente em associação com este filme e ter como objectivo proporcionar uma experiência consistente e não confusa ao utilizador.

Queremos evitar que o utilizador veja miniaturas diferentes cada vez que o filme aparece ao utilizador. Isso não só confundiria o usuário, mas também dificultaria para um Gerente de Produto atribuir atribuição a um clique – qual imagem resultou em uma taxa de cliques mais alta (CTR) quando ela continua mudando? O PM precisa ser capaz de atribuir corretamente cada novo resultado a uma mudança específica – então manter a atribuição de dados consistente é importante.

Então essas são algumas coisas que um gerente de produto consideraria ao projetar cenários de casos de borda e que casos extremos de uso de dados podem resultar. Falando em dados, de que dados a Netflix trabalha especificamente?

Que dados temos?

Existem 2 partes para isto:

  1. Que dados a Netflix usa para criar estas miniaturas / obras de arte personalizadas?
  2. Que dados a Netflix usa para direcionar estas miniaturas personalizadas para o indivíduo apropriado?

Para a primeira questão, considere que

  • Um episódio de 1 hora de Stranger Things tem >86.000 frames de vídeo estático
  • Estes frames de vídeo podem ser atribuídos individualmente a cada um deles certos atributos que são mais tarde usados para filtrar até aos melhores candidatos a thumbnails através de um conjunto de ferramentas e algoritmos chamados Aesthetic Visual Analysis (AVA). Isto é projetado para encontrar a melhor imagem em miniatura personalizada a partir de cada quadro estático do vídeo
  • Anotação Netflix – Netflix cria meta dados para cada quadro incluindo brilho (.67), # de faces (3), tons de pele (.2), probabilidade de nudez (.03), nível de borrão de movimento (4), simetria (.4)
  • Ranking de Imagens Netflix – Netflix usa os meta dados de cima para escolher imagens específicas que são da mais alta qualidade (boa iluminação, sem borrão de movimento, provavelmente contém algumas imagens de personagens principais de um ângulo decente, não contém conteúdo de marca não autorizada, etc.) e a maioria dos dados clicáveis

Para a segunda questão de quais dados Netflix usa para identificar para quem direcionar essas miniaturas geradas por encomenda, considere que as faixas de Netflix:

  • # de filmes vistos, # de minutos de cada programa visto
  • % de conclusão para cada vídeo/série
  • # de upvotes, que filmes foram preferidos, etc
  • % do conteúdo geral do programa que é atribuível a qualquer programa específico (e, portanto, nível de afinidade que o usuário tem com um programa específico ou membros do elenco relacionados)
  • qualquer tendência sazonal ou semanal relacionada com o nível de envolvimento de um usuário, etc.

Interessante notar que, em meados de 2018, a Netflix deixou de aceitar revisões de usuários como um ponto de dados, que anteriormente tinha solicitado apenas em seu site. Porquê? Porque esta “característica” na verdade reduz a audiência, pois as críticas negativas desencorajam os usuários de experimentar um vídeo. Este é apenas mais um exemplo de como uma empresa precisa de supercedes uma necessidade do usuário popular!

Então a Netflix tem um TON de dados sobre cada um de seus clientes – desde vídeos assistidos até imagens clicadas. O que eles fazem com todos esses dados?

Como Netflix usa os dados para construir um universo de interesses de perfil de usuário

Bem, eles o usam para montar um perfil 360 de cada usuário e indexam matematicamente cada usuário de acordo com centenas, possivelmente milhares de atributos diferentes.

Eles fazem isso para tentar agrupar pessoas com interesses semelhantes para que possam usar dados de um usuário para ajudar a prever o comportamento provável de outros usuários semelhantes.

Como funciona este agrupamento de perfis de usuários similares e como um gerente de produto faz sentido dos dados?

Escanhado através da matemática complexa e algoritmos associados a matrizes, vectores e análise de características n-dimensionais, encontrei a forma mais fácil de entender como isto funciona através de uma representação 3D-espacial de 10+ dimensões.

Há uma captura de ecrã que tirei quando usei o TensorBoard do Google na base de dados mNIST de dígitos escritos à mão. É um gráfico de fantasia chamado gráfico t-SNE – efetivamente uma representação 3D de muito mais dimensões do que apenas 3. Neste caso, estamos mostrando 10 dimensões (uma para cada dígito de 1 a 10) em um sistema de coordenadas 3D esféricas.

>

Um gráfico t-SNE de 10 dimensões em uma visualização 3D usando a Tensorboard do Google. Parece complexo no início, mas na verdade é bastante simples.

A posição de cada dígito escrito à mão nesta representação espacial pode ser descrita por um vetor – uma série de números em forma de coordenadas através de muitas dimensões de características.

Likewise, com usuários Netflix, a posição de cada perfil de usuário no gráfico acima poderia ser descrita por valores numéricos, cada um representando uma dimensão individual do interesse desse usuário – incluindo o gênero do filme, atores/atrizes favoritos, tópico do filme, etc.

Reimagining Netflix Users in Mathematical Relation To Each Other

Vamos fingir no diagrama de dígitos acima disso:

  • “6” = comédia romântica
  • “4” = thriller

Se um usuário for rotulado como um “6” pela Netflix, então ele será colocado na vizinhança geral de onde todos os outros 6’s turquesa estão na representação espacial acima (perto da parte inferior).

Likewise, se um utilizador for rotulado “4” pela Netflix, então ele/ela será colocado na vizinhança geral de onde todos os outros 4’s magenta estão na representação espacial acima (perto do topo).

>

>

>

>

Vamos fingir que cada número representa um género de filme. Um usuário que gosta de Romantic Comedies (6) poderia matematicamente estar mais próximo de alguém que gosta de Paródia (5) do que alguém que gosta de um Thriller (4).

Note como a região turquesa “6” (comédia romântica) se sobrepõe um pouco à região cinza “5”. Isto poderia ser análogo a como os usuários que gostam de comédias românticas também poderiam gostar de filmes de paródia ou sátira porque ambos envolvem risos.

Likewise, já que a região magenta “4” (thriller) está um pouco próxima da região rosa “9” – esta região rosa 9 poderia representar aqueles que gostam de filmes de ação – matematicamente mais próxima da região do thriller “4” do que a região da comédia romântica “6”.

>

Faz sentido? Então, quando representado espacialmente, a distância entre dois perfis de usuários representa o quão semelhantes / diferentes são seus gostos. Claro que isto pode tornar-se infinitamente mais complexo quando alguém que gosta de comédias românticas também gosta de thrillers – mas o objectivo desta analogia é mostrar a ideia geral das relações matemáticas / espaciais entre diferentes categorias.

Grupos de interesse que estão relacionados entre si apareceriam mais próximos uns dos outros e poderiam ser bons preditores do que um usuário vai gostar, dado que o usuário gosta de algo mais próximo.

É assim que a Netflix, ou realmente qualquer empresa alavancando modelos ML, cria relações entre dados aparentemente não estruturados e transformando esses dados em números. Esses números sozinhos não fazem muito sentido, mas juntos em relação um ao outro, eles começam a fazer sentido.

Para o mesmo filme Good Will Hunting abaixo, um usuário identificado como fã de comédia seria mostrado um thumbnail de Robin Williams (comediante), enquanto outro usuário identificado como fã de comédia romântica seria mostrado um thumbnail de beijo com Matt Damon e Minnie Driver. Embora não seja perfeito, os algoritmos da Netflix sugerem que tal nível de personalização com base nas características do perfil do usuário aumenta a probabilidade de taxas de cliques.

>

>

>

>>

>

>

Então vamos resumir. Um monte de miniaturas de imagens Netflix é um monte de dados não estruturados.

Mas uma vez que a Netflix anotou cada miniatura e atribuiu metadados a cada uma para descrever o que está naquela miniatura – agora temos a representação numérica desses dados não estruturados.

Plotar essa representação numérica na forma de vectores através de uma esfera 3D como fizemos acima – e agora a Netflix começa a formar relações entre pontos de dados.

Netflix então encontra pontos de dados que estão relativamente próximos uns dos outros e usa-os para ajudar a prever o comportamento futuro do clique através de. Se as previsões forem más ou boas, elas ajustam o posicionamento matemático dessas características de acordo até que o modelo se torne cada vez melhor ao longo do tempo.

Então é assim que Netflix transforma dados não estruturados em representações matemáticas. Ele usa a distância relacional entre pontos de dados como base para fazer e melhorar as recomendações de miniaturas de imagens.

O que Netflix aprendeu com todos esses dados?

Agora sabemos como Netflix transforma imagens em números em um modelo de aprendizado de máquina, quais são algumas das percepções que Netflix encontrou em todos os processamentos de dados e testes A/B que eles têm conduzido por tantos anos?

Bem, além de aprender os milhões de miniaturas individuais que converteram usuários em fiéis assinantes ao longo do tempo, aqui estão algumas coisas adicionais que a Netflix aprendeu para o que funciona em termos de miniaturas:

  • Mostrar close-ups de rostos emocionalmente expressivos
  • Mostrar pessoas vilões em vez de heróis
  • Não mostrar mais de três caracteres

Em Conclusão: Netflix Implantou IA (principalmente) da maneira certa. Vamos aprender com sua abordagem.

A Netflix fez um trabalho fenomenal de aplicação de IA, ciência de dados e aprendizagem da máquina da “maneira correta” – usando uma abordagem baseada em produtos que foca na necessidade do negócio primeiro, depois a solução de IA depois, ao invés do contrário.

Quando aplicada corretamente, a IA pode fazer maravilhas.

Vimos como as soluções de IA podem ser eficazes na personalização da experiência para o benefício tanto da Netflix em termos de assinaturas quanto dos usuários em termos de satisfação geral.

Vimos também limitações de algoritmos que “exageram” e discutimos exemplos específicos nos quais o algoritmo Netflix apresentava miniaturas enganosas para pessoas de cor porque o algoritmo otimizado para cliques, efetivamente “enganando” os usuários para que eles clicassem na isca. Isto aconteceu mesmo quando aquela miniatura não representava com precisão aquele vídeo.

Nenhum algoritmo será perfeito para contabilizar todas as nuances de uma experiência humana. Na verdade, algoritmos desenhados para explorar métricas farão exatamente isso – por isso é o papel do gerente de produto trabalhar com o design ou outros membros da equipe para encontrar maneiras de resolver essas deficiências nos algoritmos.

Anterior, a integração da IA na sociedade, bem como no espaço corporativo empresarial continuará a se tornar cada vez mais prevalente.

Tecnólogos podem ter tendência a prescrever soluções de IA existentes, mas realmente a forma mais eficaz de adotar a IA é a forma como a Netflix o fez – a partir de uma perspectiva orientada ao negócio primeiro.

>

Diga fundo e você verá que Netflix gerou dados de suporte antes de fazer o avanço estratégico.

Como o mundo da IA, ciência de dados e aprendizagem de máquinas continua a crescer, todos nós gerentes de produtos podemos tirar uma ou duas lições do livro de jogo da Netflix quando se trata de implementar corretamente soluções de IA.

Vídeo do YouTube mostrando o algoritmo de geração de miniaturas da Netflix.

Similar Posts

Deixe uma resposta

O seu endereço de email não será publicado.