zachyt ávanie charakteristík jednotlivca
DESCRIPTION
Zachyt ávanie charakteristík jednotlivca. Michal Barla, M ária Bieliková. { barla, bielik }@fiit.stuba.sk. Modelovanie používateľa. Cieľ: Prispôsobovanie obsahu, odporúčanie Viacero prístupov, líšiacich sa v: spôsobe zberu dát o používateľovi Vyjadrení modelu Úrovni podrobnosti - PowerPoint PPT PresentationTRANSCRIPT
Zachytávanie charakteristík
jednotlivcaMichal Barla, Mária Bieliková
{barla, bielik}@fiit.stuba.sk
WIKT 2006 Zachytávanie charakteristík jednotlivca
2
Modelovanie používateľa
• Cieľ: Prispôsobovanie obsahu, odporúčanie• Viacero prístupov, líšiacich sa v:
– spôsobe zberu dát o používateľovi– Vyjadrení modelu– Úrovni podrobnosti– Použití modelu
• Často sa zabúda na cieľ, užitočnosť, realizovateľnosť
WIKT 2006 Zachytávanie charakteristík jednotlivca
3
Príklad modelu - GUMO
gumo:FullName.800414
gumo:ContactInformation.700008
isa
gumo:FamilyName.800412
isa
gumo:AbilityToSee.801002
gumo:AbilityAndProficiency.700011
isa
gumo:AbilityToSmell.801004
isa
gumo:Motion.700018
gumo:BasicUserDimensions.700002
isa isa isa
gumo:EmotionalState.700014
isa
gumo:Person.110003
ubis:identifier = 110003
ubis:website = http://ubisworld.org/show.php?subject=11...
ubis:image = http://u2m.org/UbisWorld/img/man-small.g...
gumo:UserModelAuxiliary.600020 Any*
gumo:HasProperty.600100 Instance* gumo:BasicUserDimensions.7002
gumo:HasInterest.600110 Any*
gumo:HasKnowledge.600120 Any*
gumo:HasPlan.600130 Any*
gumo:HasProperty.600100*
WIKT 2006 Zachytávanie charakteristík jednotlivca
4
Model používateľa v NAZOU
gu:UserCharacteristic
isa JobOfferSpecificUserCharacteristic
isa
joscPropertyPreference
isa
gu:DomainSpecificUser
gu:includes*
gu:hasCharacteristic*
JobOfferSpecificUser
isa
hasCharacteristic*hasCharacteristic*
gu:User
gu:GenericUserCharacteristic
WIKT 2006 Zachytávanie charakteristík jednotlivca
5
Charakteristiky
isa
isa isa
relatesTo* gu:PropertyValuePair
gu:hasValue Instance
gu:hasProperty Instance rdf:Property
gu:UserCharacteristic
gu:hasCountOfUpdates Integergu:hasTimeStamp String
gu:hasRelevance Instance c:LevelOrdering
gu:contributesTo Instance* gu:Goal
gu:hasConfidence Instance c:LevelOrdering
gu:hasSource Instance gu:UMSource
JobOfferSpecificUserCharacteristicrelatesTo Instance* JobOfferSpecificPropertyValuePair isRelatedTo
joscPropertyPreference
Instance rdf:Property
JobOfferSpecificPropertyValuePair
WIKT 2006 Zachytávanie charakteristík jednotlivca
6
Iný príklad modelu
[P(1), P(2),…..,P(N)]
Častokrát použitelnejší model vzhľadom na dosiahnutie cieľa
WIKT 2006 Zachytávanie charakteristík jednotlivca
7
Web Usage Mining
• Zdroj dát: záznamy webového servera• Techniky:
– zhlukovanie– asociačné, sekvenčné pravidlá
• Použitie:– Zaradenie do skupiny (stereotyp)– Odporúčanie
• Nie sú charakteristiky jednotlivca, ale spĺňajú cieľ– Sociálny aspekt
• Generické algoritmy, jasne definované vstupy, výstupy
WIKT 2006 Zachytávanie charakteristík jednotlivca
8
Charakteristiky jednotlivca
• Formulárová metóda– Obťažujúce– Spoľahlivé? (nadhodnotené/podhodnotené/neznáme)
• Analýza interakcie/správania– Matematické prístupy
• Model je vektor – čo s otvoreným inf. priestorom?• Generické metódy
– Heuristiky, pravidlá• Ľubovoľná reprezentácia modelu• Ako je to so znovupoužitím metód?
WIKT 2006 Zachytávanie charakteristík jednotlivca
9
Analýza založená na pravidlách
• Stojí a padá na vstupných dátach• Záznamy web servera
– Akciám chýba význam – HTTP GET a POST• Analýza zviazaná s konkrétnym vyhotovením
– Štatistika – videl/nevidel/koľkokrát– Odvodené charakteristiky
• Pevne dané pravidlá, často implicitné• Znovupoužiteľnosť
– Meniace sa pravidlá– Jeden interpreter jednotná reprezentácia vstupných dát
WIKT 2006 Zachytávanie charakteristík jednotlivca
10
typesOfEventsid bigint unsignedname varchar(100)
typesOfEventAttributesid bigint unsignedname varchar(100)
EventAttributesid bigint unsignedvalue varchar(100)
*
** 1
*1
*
1
*
* 1
*
0..1
*
0..1
userslogin varchar(20)uri varchar(100)
1 *
1
sessionsid bigint unsignedstart datetimeend datetime
fromState
toStateevents
id bigint unsignedtimestamp timestamp
displayStatesid bigint unsigned 1 *
displayedItemsid bigint unsigned
*
*
typesOfDisplayedItemid bigint unsignedname varchar(100)
*
1
typesOfDisplayedItemAttributesid bigint unsignedname varchar(100)* *
displayedItemAttributesid bigint unsignedname varchar(100)*1
*
1
0..1
0..1
*
*
WIKT 2006 Zachytávanie charakteristík jednotlivca
11
VlastnosťVlastnosť
ZmenaZmena
UdalosťUdalosť
Pravidlo
Vzor Dôsledok
Sekvencia
Udalosť
AND/OR
Spojitosť
Kontext
Typ
Zmena Triedainštancie
Vlastnosť
PoužitáOdkazujúca Spracovávaná
Početvýskytov
WIKT 2006 Zachytávanie charakteristík jednotlivca
12
Numerické hodnoty charakteristiky
• Charakteristiky sú odhadované– Confidence – miera dôveryhodnosti
charakteristiky• Rôzne „silné“ pravidlá
– Relevance – relevancia voči cieľu• Rôzne stratégie úpravy hodnôt
– Min, max, delta pre každú vlastnosť– Úprava – rovnomerne, progresívne, „opatrne“ , ...
WIKT 2006 Zachytávanie charakteristík jednotlivca
13
Spätná väzba
• Vzory implicitnej spätnej väzby (Výber, Trvanie, Opakovanie, Kúpa)
• Ako získať dôvod rôzneho ohodnotenia obsahu?– Podobné koncepty rôzne ohodnotené
• Rozdiel bude pre používateľa podstatný– Rôzne koncepty podobne ohodnotené
• Spoločné bude pre používateľa podstatné
• Porovnávanie konceptov môže byť dostatočne generické
WIKT 2006 Zachytávanie charakteristík jednotlivca
14
Modelovanie používateľa
• „First-click“ správanie• Opakujúce sa procesy• Relatívne málo pravidiel je schopných dať
sľubné výsledky• Metóda je generická, doménovo závislé sú
iba pravidlá• Existujú však generické metódy na
interpretáciu výsledkov?