sémantický význam wikipedie
TRANSCRIPT
Sémantický význam Wikipedie
Wikinomics Forum 2010, PrahaJosef Šlerka, ÚISK FF UK
Sunday, December 5, 2010
Wikipedia jako předmět zkoumání
Za posledních 10 let bylo podle serveru Google Scholar publikováno více než 2.000 studií, v jejichž názvu se vyskytuje slovo Wikipedia.
Slouží za typický příklad kolektivní inteligence a bezedný důl pro dataming.
Sunday, December 5, 2010
Kolektivní inteligence
"Kolektivní inteligenci je obecně možné definovat jako schopnost skupiny najít větší množství, anebo kvalitnější řešení nějakého problému, než její jednotliví členové" (wiki)
Sunday, December 5, 2010
Kolektivní inteligence
"Forma univerzálně distribuované inteligence, konstantně zdokonalované, koordinované v reálném čase a vyúsťující v efektivní využití schopností" (Piére Lévy)
Sunday, December 5, 2010
Kolektivní inteligence
"Skupina pracující v kolektivu tak, že to vypadá inteligentně" (CCI MIT)
Sunday, December 5, 2010
Nejčastější využití
extrakce znalostí
využití sítě vazeb mezi pojmy a kategoriemi
Sunday, December 5, 2010
Extrace znalostí
problém s nestrukturovaností dat
odměna v podobě obrovské znalosti
Sunday, December 5, 2010
David Beckham
Sunday, December 5, 2010
DBpedia.org
3.4 million things, 1.5 million are classified in a consistent Ontology, 312,000 persons, 413,000 places, 94,000 music albums, 49,000 films, 15,000 video games, 140,000 organizations, 146,000 species and 4,600 diseases.
Sunday, December 5, 2010
Chytré dotazy
All soccer players, who played as goalkeeper for a club that has a stadium with more than 40.000 seats and who are born in a country with more than 10 million inhabitants?
Sunday, December 5, 2010
Chytré dotazy SELECT DISTINCT ?player { ?s foaf:page ?player. ?s rdf:type <http://dbpedia.org/ontology/SoccerPlayer> . ?s dbpedia2:position ?position . ?s <http://dbpedia.org/property/clubs> ?club . ?club <http://dbpedia.org/ontology/capacity> ?cap . ?s <http://dbpedia.org/ontology/birthPlace> ?place . ?place ?population ?pop. OPTIONAL {?s <http://dbpedia.org/ontology/number> ?tricot.} Filter (?population in (<http://dbpedia.org/property/populationEstimate>, <http://dbpedia.org/property/populationCensus>, <http://dbpedia.org/property/statPop> )) Filter (xsd:int(?pop) >10000000 ) . Filter (xsd:int(?cap) <40000 ) . Filter (?position = "Goalkeeper"@en || ?position = <http://dbpedia.org/resource/Goalkeeper_%28association_football%29> || ?position = <http://dbpedia.org/resource/Goalkeeper_%28football%29>) } Limit 1000
Sunday, December 5, 2010
Chytré dotazy
Rivers that flow into the Rhine and are longer than 50 kilometers?
http://dbpedia.neofonie.de/browse/rdf-type:River/riverMouth:Rhine/length~:50000~/?fc=30
Sunday, December 5, 2010
...další servery
http://www.freebase.com/
http://www.wolframalpha.com
Sunday, December 5, 2010
Wikipedie jak síť
Pro řadu badatelů je Wikipedie především sémantickou sítí, jejímž určitým nedostatkem je neutrální prolinkování mezi pojmy a kategoriemi, které nenese další informaci o povaze zařazení, tak jako je to v případě WordNetu.
Sunday, December 5, 2010
David Beckham
Person is ... who plays ...
Sunday, December 5, 2010
Sunday, December 5, 2010
Ale je to vlastně nevýhoda?
zkrátka akademici (až na vyjimky) nevěří Wikipedii
Sunday, December 5, 2010
Ale je to vlastně nevýhoda?
Sunday, December 5, 2010
Ale je to vlastně nevýhoda? Hierarchie kategorií a pojmů ve Wikipedii odpovídá stavu diskursu v dané jazykové komunitě a je výrazem společenského common sense pojmů.
Tím ovšem vytváří ideální základ pro klasifikaci, protože v zásadě staví na hierarchii vyplývající z běžné jazykové praxe komunity, nikoli z vědeckého (nebo jiného) diskursu.
Sunday, December 5, 2010
A zase ta CI
průměrování,
dělba práce
zpětnou vazba
Sunday, December 5, 2010
... Wiki o Wiki Dělbou práce je v tomto případě fakt, že každý návštěvník wikipedie má právo a okamžitý přístup k editaci stávajících či založení nového článku. Jednotliví autoři však jsou však málokdy schopni zpracovat celý článek samostatně bez pomoci ostatních a tak i ostatní autoři doplňují, opravují a rozšiřují to, co někdo napsal před nimi. Pokud je nějaké téma kontroverzní, dochází k časté editaci až do chvíle, kdy se dosáhne mezi autory konsensu. Výsledek je tedy jakýmsi znalostním průměrem jednotlivých autorů. (Wikipedia)
Sunday, December 5, 2010
Ukázky z Nového Zélandu
Hledání podobností
Pomoc extrakci thesauru a podobně
Extrakce kategorii z text Wikify
Sunday, December 5, 2010
Hledání podobností
http://wdm.cs.waikato.ac.nz:8080/service?task=compare
Sunday, December 5, 2010
Extrakce thesauru a řízený slovník
http://wdm.cs.waikato.ac.nz:8080/service?task=search
Sunday, December 5, 2010
Extrakce kategorii z textů - Wikify
http://wdm.cs.waikato.ac.nz:8080/service?task=wikify
Sunday, December 5, 2010
Další aplikace
extrakce geodat pro Google Maps
integrace do AR jako v případě Wikitude
a řada dlaších
Sunday, December 5, 2010
Děkuji za pozornost
Sunday, December 5, 2010