recomendação de conteúdo com apache mahout

29
Recomendação de conteúdo com Apache Mahout

Upload: dextra

Post on 15-Jan-2017

360 views

Category:

Software


3 download

TRANSCRIPT

Page 1: Recomendação de conteúdo com apache mahout

Recomendação de conteúdo com Apache Mahout

Page 2: Recomendação de conteúdo com apache mahout

Quem somos nós?

Page 3: Recomendação de conteúdo com apache mahout

Estudo de Caso

Page 4: Recomendação de conteúdo com apache mahout

Configuração editorial

Exibição genérica

Coleta de feedback

Page 5: Recomendação de conteúdo com apache mahout

Estamos recomendando algo de interesse do

usuário?

Page 6: Recomendação de conteúdo com apache mahout

Por que recomendar algo para alguém?

AjudarFacilitar Induzir

Page 7: Recomendação de conteúdo com apache mahout

Com base em quais critérios?

Page 8: Recomendação de conteúdo com apache mahout

Quando há informações

Quando não há informações

Page 9: Recomendação de conteúdo com apache mahout

Feedback

Page 10: Recomendação de conteúdo com apache mahout

Impactos

Page 11: Recomendação de conteúdo com apache mahout

UX

Positivos

Fidelização

Page 12: Recomendação de conteúdo com apache mahout

Negativos

Efeito bolha

Page 13: Recomendação de conteúdo com apache mahout

How it works

Page 14: Recomendação de conteúdo com apache mahout

Processamento distribuído Open source

Apache Hadoop

Page 15: Recomendação de conteúdo com apache mahout

Objetivo de criar aplicações de ML rapidamente

Apache Mahout

Page 16: Recomendação de conteúdo com apache mahout

Benefícios do Mahout

Aplicação simples e ágil

Compatível com o hadoop para processamento distribuído

Algorítimos de ML

Page 17: Recomendação de conteúdo com apache mahout

Parece complexo…

Page 18: Recomendação de conteúdo com apache mahout

➔ Reg. Acesso

➔ Recomendação

GCE

GAE

Integração GCE / GAE

BD Storage

Run

Sync

Mahout

Hadoop

Page 19: Recomendação de conteúdo com apache mahout
Page 20: Recomendação de conteúdo com apache mahout

21

Page 21: Recomendação de conteúdo com apache mahout

1

Page 22: Recomendação de conteúdo com apache mahout

Processar a Recomendação

2

Page 23: Recomendação de conteúdo com apache mahout

695156844314820 733886336030387 1 1461380400

1857712592933254 1659840805718841 1 1457751600

459836780240009 738977595379058 1 1460084400

715051021259018 1597532753452474 1 1457665200

2129884632821879 1726026021769732 5 1458961200

2211950224976468 2049611670763120 1 1458529200

2262258856060242 127962519162750 1 1457406000

2547022900948044 1719916616890884 1 1459738800

1351232552007122 439772798224598 1 1462071600

2320345584423341 2910045585351627 1 1460689200

1336788031028127 2102694821459710 1 1458442800

USER ID CONTENT ID RATE TIMESTAMP

Page 24: Recomendação de conteúdo com apache mahout

Filtragem Colaborativa

hadoop jar /opt/mahout-distribution-0.9/mahout-core-0.9-job.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -s SIMILARITY_COOCCURRENCE --input dados.csv --output output

Page 25: Recomendação de conteúdo com apache mahout

Métricas...

3 MILHÕESde acessos

Acessos desproporcionais

Page 26: Recomendação de conteúdo com apache mahout

Acessos

1314126830928733

Page 27: Recomendação de conteúdo com apache mahout

695156844314820 733886336030387 1 1461380400

1857712592933254 1659840805718841 1 1457751600

459836780240009 738977595379058 1 1460084400

715051021259018 1597532753452474 1 1457665200

2129884632821879 1726026021769732 5 1458961200

2211950224976468 2049611670763120 1 1458529200

2262258856060242 127962519162750 1 1457406000

2547022900948044 1719916616890884 1 1459738800

1351232552007122 439772798224598 1 1462071600

2320345584423341 2910045585351627 1 1460689200

1336788031028127 2102694821459710 1 1458442800

USER ID CONTENT ID RATE TIMESTAMP

Page 28: Recomendação de conteúdo com apache mahout

Próximos passos...