zachyt ávanie charakteristík jednotlivca

14
Zachytávanie charakteristík jednotlivca Michal Barla, Mária Bieliková {barla, bielik}@fiit.stuba.sk

Upload: duman

Post on 20-Mar-2016

40 views

Category:

Documents


5 download

DESCRIPTION

Zachyt ávanie charakteristík jednotlivca. Michal Barla, M ária Bieliková. { barla, bielik }@fiit.stuba.sk. Modelovanie používateľa. Cieľ: Prispôsobovanie obsahu, odporúčanie Viacero prístupov, líšiacich sa v: spôsobe zberu dát o používateľovi Vyjadrení modelu Úrovni podrobnosti - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Zachyt ávanie charakteristík jednotlivca

Zachytávanie charakteristík

jednotlivcaMichal Barla, Mária Bieliková

{barla, bielik}@fiit.stuba.sk

Page 2: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

2

Modelovanie používateľa

• Cieľ: Prispôsobovanie obsahu, odporúčanie• Viacero prístupov, líšiacich sa v:

– spôsobe zberu dát o používateľovi– Vyjadrení modelu– Úrovni podrobnosti– Použití modelu

• Často sa zabúda na cieľ, užitočnosť, realizovateľnosť

Page 3: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

3

Príklad modelu - GUMO

gumo:FullName.800414

gumo:ContactInformation.700008

isa

gumo:FamilyName.800412

isa

gumo:AbilityToSee.801002

gumo:AbilityAndProficiency.700011

isa

gumo:AbilityToSmell.801004

isa

gumo:Motion.700018

gumo:BasicUserDimensions.700002

isa isa isa

gumo:EmotionalState.700014

isa

gumo:Person.110003

ubis:identifier = 110003

ubis:website = http://ubisworld.org/show.php?subject=11...

ubis:image = http://u2m.org/UbisWorld/img/man-small.g...

gumo:UserModelAuxiliary.600020 Any*

gumo:HasProperty.600100 Instance* gumo:BasicUserDimensions.7002

gumo:HasInterest.600110 Any*

gumo:HasKnowledge.600120 Any*

gumo:HasPlan.600130 Any*

gumo:HasProperty.600100*

Page 4: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

4

Model používateľa v NAZOU

gu:UserCharacteristic

isa JobOfferSpecificUserCharacteristic

isa

joscPropertyPreference

isa

gu:DomainSpecificUser

gu:includes*

gu:hasCharacteristic*

JobOfferSpecificUser

isa

hasCharacteristic*hasCharacteristic*

gu:User

gu:GenericUserCharacteristic

Page 5: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

5

Charakteristiky

isa

isa isa

relatesTo* gu:PropertyValuePair

gu:hasValue Instance

gu:hasProperty Instance rdf:Property

gu:UserCharacteristic

gu:hasCountOfUpdates Integergu:hasTimeStamp String

gu:hasRelevance Instance c:LevelOrdering

gu:contributesTo Instance* gu:Goal

gu:hasConfidence Instance c:LevelOrdering

gu:hasSource Instance gu:UMSource

JobOfferSpecificUserCharacteristicrelatesTo Instance* JobOfferSpecificPropertyValuePair isRelatedTo

joscPropertyPreference

Instance rdf:Property

JobOfferSpecificPropertyValuePair

Page 6: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

6

Iný príklad modelu

[P(1), P(2),…..,P(N)]

Častokrát použitelnejší model vzhľadom na dosiahnutie cieľa

Page 7: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

7

Web Usage Mining

• Zdroj dát: záznamy webového servera• Techniky:

– zhlukovanie– asociačné, sekvenčné pravidlá

• Použitie:– Zaradenie do skupiny (stereotyp)– Odporúčanie

• Nie sú charakteristiky jednotlivca, ale spĺňajú cieľ– Sociálny aspekt

• Generické algoritmy, jasne definované vstupy, výstupy

Page 8: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

8

Charakteristiky jednotlivca

• Formulárová metóda– Obťažujúce– Spoľahlivé? (nadhodnotené/podhodnotené/neznáme)

• Analýza interakcie/správania– Matematické prístupy

• Model je vektor – čo s otvoreným inf. priestorom?• Generické metódy

– Heuristiky, pravidlá• Ľubovoľná reprezentácia modelu• Ako je to so znovupoužitím metód?

Page 9: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

9

Analýza založená na pravidlách

• Stojí a padá na vstupných dátach• Záznamy web servera

– Akciám chýba význam – HTTP GET a POST• Analýza zviazaná s konkrétnym vyhotovením

– Štatistika – videl/nevidel/koľkokrát– Odvodené charakteristiky

• Pevne dané pravidlá, často implicitné• Znovupoužiteľnosť

– Meniace sa pravidlá– Jeden interpreter jednotná reprezentácia vstupných dát

Page 10: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

10

typesOfEventsid bigint unsignedname varchar(100)

typesOfEventAttributesid bigint unsignedname varchar(100)

EventAttributesid bigint unsignedvalue varchar(100)

*

** 1

*1

*

1

*

* 1

*

0..1

*

0..1

userslogin varchar(20)uri varchar(100)

1 *

1

sessionsid bigint unsignedstart datetimeend datetime

fromState

toStateevents

id bigint unsignedtimestamp timestamp

displayStatesid bigint unsigned 1 *

displayedItemsid bigint unsigned

*

*

typesOfDisplayedItemid bigint unsignedname varchar(100)

*

1

typesOfDisplayedItemAttributesid bigint unsignedname varchar(100)* *

displayedItemAttributesid bigint unsignedname varchar(100)*1

*

1

0..1

0..1

*

*

Page 11: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

11

VlastnosťVlastnosť

ZmenaZmena

UdalosťUdalosť

Pravidlo

Vzor Dôsledok

Sekvencia

Udalosť

AND/OR

Spojitosť

Kontext

Typ

Zmena Triedainštancie

Vlastnosť

PoužitáOdkazujúca Spracovávaná

Početvýskytov

Page 12: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

12

Numerické hodnoty charakteristiky

• Charakteristiky sú odhadované– Confidence – miera dôveryhodnosti

charakteristiky• Rôzne „silné“ pravidlá

– Relevance – relevancia voči cieľu• Rôzne stratégie úpravy hodnôt

– Min, max, delta pre každú vlastnosť– Úprava – rovnomerne, progresívne, „opatrne“ , ...

Page 13: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

13

Spätná väzba

• Vzory implicitnej spätnej väzby (Výber, Trvanie, Opakovanie, Kúpa)

• Ako získať dôvod rôzneho ohodnotenia obsahu?– Podobné koncepty rôzne ohodnotené

• Rozdiel bude pre používateľa podstatný– Rôzne koncepty podobne ohodnotené

• Spoločné bude pre používateľa podstatné

• Porovnávanie konceptov môže byť dostatočne generické

Page 14: Zachyt ávanie charakteristík jednotlivca

WIKT 2006 Zachytávanie charakteristík jednotlivca

14

Modelovanie používateľa

• „First-click“ správanie• Opakujúce sa procesy• Relatívne málo pravidiel je schopných dať

sľubné výsledky• Metóda je generická, doménovo závislé sú

iba pravidlá• Existujú však generické metódy na

interpretáciu výsledkov?