doktoratura fisnik dalipi, fakulteti i shkencave i natyrore

111
REPUBLIKA E SHQIPËRISË U N I V E R S I T E T I I T I R A N Ë S F A K U L T E T I I S H K E N C A V E T Ë N A T Y R Ë S D E P A R T A M E N T I I I N F O R M A T I K Ë S FISNIK DALIPI “NXJERRJA SEMANTIKE E INFORMACIONEVE PREJ BURIMEVE TË SHPËRNDARA DHE HETEROGJENE, NGA KËNDVËSHTRIMI I INTELIGJENCËS AFARISTE, PËRMES EKSPLORIMIT INTERAKTIV DHE VIZUAL TË HAPËSIRAVE MULTIDIMENSIONALE TË INFORMACIONIT” TEZË DOKTORATURE Udhëheqësi shkencor: Prof. Dr. Ilia NINKA Tiranë 2013

Upload: hanhu

Post on 30-Jan-2017

316 views

Category:

Documents


11 download

TRANSCRIPT

Page 1: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

REPUBLIKA E SHQIPËRISË U N I V E R S I T E T I I T I R A N Ë S

F A K U L T E T I I S H K E N C A V E T Ë N A T Y R Ë S D E P A R T A M E N T I I I N F O R M A T I K Ë S

FISNIK DALIPI

“NXJERRJA SEMANTIKE E INFORMACIONEVE PREJ BURIMEVE TË

SHPËRNDARA DHE HETEROGJENE, NGA KËNDVËSHTRIMI I INTELIGJENCËS AFARISTE, PËRMES EKSPLORIMIT INTERAKTIV

DHE VIZUAL TË HAPËSIRAVE MULTIDIMENSIONALE TË INFORMACIONIT”

TEZË DOKTORATURE

Udhëheqësi shkencor: Prof. Dr. Ilia NINKA

Tiranë 2013

Page 2: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

ii

U N I V E R S I T E T I I T I R A N Ë S F A K U L T E T I I S H K E N C A V E T Ë N A T Y R Ë S

D E P A R T A M E N T I I I N F O R M A T I K Ë S

disertacion

i

paraqitur nga:

Z.___________________

për marrjen e gradës shkencore

DOKTOR

Specialiteti: informatikë

Tema:

“Nxjerrja semantike e informacioneve prej burimeve të shpërndara dhe heterogjene, nga këndvështrimi i Inteligjencës Afariste, përmes eksplorimit

interaktiv dhe vizual të hapësirave multidimensionale të informacionit”

Mbrohet në datën ____.____._____ para jurisë:

1. ______________________________ Kryetar

2. ______________________________ Anëtar ( Oponent)

3. ______________________________ Anëtar ( Oponent)

4. ______________________________ Anëtar

5. ______________________________ Anëtar

Page 3: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

iii

PASQYRA E LËNDËS

Lista e Figurave ....................................................................................................................................... vi

Lista e Tabelave .....................................................................................................................................viii

Hyrje ...................................................................................................................................................... ix

Kapitulli 1. Përshkrimi dhe qëllimi i projektit ............................................................................................ 1

1.1 Struktura e tezës ............................................................................................................................ 2

Kapitulli 2. Procesi i nxjerrjes së informacioneve ...................................................................................... 4

2.1 Strategjitë e kërkimit të informacionit ............................................................................................ 5

2.1.1 Modeli Boolean ....................................................................................................................... 6

2.1.2 Modeli probabilistik ................................................................................................................ 6

2.1.3 Modeli i hapësirave vektoriale................................................................................................. 9

2.2 Metrika e evaluimit të sistemeve IR ............................................................................................. 10

2.3 Kërkimi sipas indeksit si opsion për nxjerrjen e informacionit ....................................................... 12

2.3.1 Implementimi algoritmik ....................................................................................................... 12

Kapitulli 3. Koncepti i Ontologjive .......................................................................................................... 16

3.1 Ontologjia si nocion filozofik ........................................................................................................ 16

3.2 Ontologjitë si përshkrues të diturive ............................................................................................ 17

3.3 Llojet e Ontologjive ...................................................................................................................... 18

3.4 Gjuhët e Ontologjive .................................................................................................................... 20

3.4.1 RDF dhe RDFS........................................................................................................................ 21

3.4.2 Gjuha OWL ............................................................................................................................ 25

3.4.3 Gjuha për pyetësor – SPARQL ................................................................................................ 27

Kapitulli 4. Teknologjitë për kërkim semantik......................................................................................... 28

4.1 Modelet e sistemeve për kërkim të bazuara në ontologji ............................................................. 28

4.2 Logjika funksionale e sistemeve për kërkim semantik ................................................................... 30

4.3 Procesimi i pyetësorit .................................................................................................................. 31

4.4 Kërkimi dhe rangimi ..................................................................................................................... 32

4.5 Kërkimi semantik në Ueb-in semantik .............................................................................................. 33

Kapitulli 5. Aplikimi dhe integrimi i ontologjive në mësimin elektronik ................................................... 35

5.1 Mbi mësimin elektronik apo E-learning ........................................................................................ 35

Page 4: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

iv

5.2 Menaxhimi i diturive .................................................................................................................... 36

5.2.1 Tipet e diturive ...................................................................................................................... 38

5.2.2 Piramida e menaxhimit të diturive ........................................................................................ 39

5.2.2.1 Menaxhimi i dokumenteve ............................................................................................. 39

5.2.2.2 Krijimi i informacionit, ndarja dhe menaxhimi ................................................................ 39

5.2.2.3 Inteligjenca e ndërmarrjes .............................................................................................. 40

5.2.3.3.1 Mbështetja e performancës ..................................................................................... 40

5.3 Rëndësia e mësimit elektronik ..................................................................................................... 40

5.3.1 Domethënia e komunikimit ................................................................................................... 41

5.3.2 Plani shpërndarës.................................................................................................................. 41

5.3.3 Struktura e klasës të të mësuarit elektronik........................................................................... 41

5.3.4 Teknologjia ........................................................................................................................... 41

5.4 Përparësitë e të mësuarit elektronik ............................................................................................ 42

5.5 Mangësitë e të mësuarit elektronik .............................................................................................. 43

5.6 Nivelet e të mësuarit elektronik ................................................................................................... 43

5.6.1 Baza e të dhënave me njohuri .............................................................................................. 44

5.6.2 Mbështetja Online ................................................................................................................ 44

5.6.3 Trajnimi asinkronik ................................................................................................................ 44

5.6.4 Trajnimi sinkronik .................................................................................................................. 45

5.7 Standardet e të mësuarit elektronik ............................................................................................. 45

5.7.1 Standardet metadata ............................................................................................................ 46

5.7.2 Standardet e paketimit të përmbajtjes .................................................................................. 46

5.7.3 Profilet e studentit ................................................................................................................ 46

5.8 Arkitektura e sistemit për e-learning SMEUS ................................................................................ 47

5.9 Integrimi i ontologjive në SMEUS ................................................................................................. 52

Kapitulli 6. Metodologjitë e aplikimit të kërkimit semantik në sistemet e Inteligjencës Afariste ............. 57

6.1 Kubi OLAP për analiza shumëdimensionale .................................................................................. 57

6.1 Mbi aspektet e integrimit të teknologjisë semantike në data warehouse ..................................... 60

6.1.1 Modeli i domenit dhe koncepteve afariste ............................................................................ 61

6.2 Integrimi i burimeve heterogjene të informacionit ....................................................................... 63

6.3 Rëndësia e aspektit semantik gjatë dizajnimit të proceseve ETL ................................................... 64

6.4 Ndërlidhja e modeleve multidimensionale me SMEUS ................................................................. 66

Page 5: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

v

Kapitulli 7. Rezultatet e testimit ............................................................................................................. 71

7.1 Diskutim mbi testimin me SMEUS .................................................................................................... 78

Kapitulli 8. Teknologjia e SMEUS ............................................................................................................ 79

8.1 Sqarimi i databazës ...................................................................................................................... 79

8.2 Ndërfaqja e sistemit SMEUS ......................................................................................................... 83

8.2.1 Logimi .................................................................................................................................. 83

8.2.2 Ndërfaqja e administratorit ................................................................................................... 85

8.2.3 Insertimi i pyetjeve................................................................................................................ 85

8.2.4 Përditësimi (update) i pyetjeve .............................................................................................. 87

8.2.5 Krijimi i testit ......................................................................................................................... 89

8.2.6 Kodi për rezultatet e testimit .................................................................................................. 91

8.2.7 Vlerësimi i studentëve ........................................................................................................... 92

8.2.8 Vendosja e materialeve në aplikacion .................................................................................... 93

8.3 Ndërfaqja e testimit ..................................................................................................................... 93

8.4 Ndërfaqja eKonsultime ................................................................................................................ 94

9. REFERENCAT ...................................................................................................................................... 98

Abstrakti.............................................................................................................................................. 101

Abstract .............................................................................................................................................. 101

Page 6: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

vi

Lista e Figurave

Figurë 1. Procesi i sistemit për nxjerrjen e informacionit .......................................................................... 5 Figurë 2. Këndi ndërmjet pyetësorit dhe dokumenteve......................................................................... 10 Figurë 3. Pema e Brentanos për kategoritë e Aristotelit ......................................................................... 16 Figurë 4. Llojet e ontologjive sipas Guarino-s ......................................................................................... 19 Figurë 5. Gjuhët përshkruese të ontologjive .......................................................................................... 20 Figurë 6. Paraqitje grafike e treshes: objekt, atribut, vlerë ..................................................................... 22 Figurë 7. Shtresat RDF dhe RDFS ............................................................................................................ 24 Figurë 8. Kategorizimi i sistemeve semantike për kërkim ....................................................................... 29 Figurë 9. Procesi i sistemit për kërkim semantik..................................................................................... 30 Figurë 10. Korniza e sistemit për kërkim semantik në mjedis heterogjen ............................................... 33 Figurë 11. Strategjitë e E-learning për ndarjen e diturive në epokën digjitale [32] .................................. 38 Figurë 12. Tre nivelet e menaxhimit të njohurive [32] ............................................................................ 39 Figurë 13. Baza e të dhënave me dituri .................................................................................................. 44 Figurë 14. Trajnimi asinkronik ................................................................................................................ 45 Figurë 15. Modulet e sistemit për testim elektronik ekstern .................................................................. 48 Figurë 16. Arkitektura e sistemit SMEUS ................................................................................................ 50 Figurë 17. Logjika funksionale e sistemit SMEUS .................................................................................... 51 Figurë 18. Procesi i komunikimit në sistemin SMEUS ............................................................................. 52 Figurë 19. Ontologjia për karakterin semantik të mësuarit/objektin e mësimit në Protégé .................... 54 Figurë 20. Ontologjia për karakterin semantik të mësuarit/objektin e mësimit në UML ......................... 55 Figurë 21. Ontologjia për Materialet Mësimore në Protégé ................................................................... 56 Figurë 22. Ontologjia për Materialet Mësimore në UML ........................................................................ 56 Figurë 23. Hapat e nevojshme deri te formimi i kubit OLAP ................................................................... 58 Figurë 24. Faktet dhe dimensionet sipas skemës yll në SMEUS .............................................................. 59 Figurë 25. Kubi OLAP në SMEUS............................................................................................................. 59 Figurë 26. Arkitektura me shtresa për kërkim në sistemet BI [39] .......................................................... 62 Figurë 27. Ilustrimi i kornizës semantike për mbështetje të BI [40] ........................................................ 62 Figurë 28. Analiza e data warehouse semantik me ontologji multidimensionale [44] ............................. 64 Figurë 29. Aspekti multidimensional dhe semantik i SMEUS .................................................................. 66 Figurë 30. RDF skema për OLAP dimensionet Studenti dhe Testi ............................................................ 68 Figurë 31. RDF skema për OLAP dimensionet Lënda dhe Mësimdhënësi ................................................ 69 Figurë 32. Rezultatet e testimit në përqindje në E-biznes – grupi A ........................................................ 71 Figurë 33. Rezultatet e testimit në përqindje në E-biznes – grupi B ........................................................ 72 Figurë 34. Rezultatet e testimit në përqindje në E-biznes – grupi C ........................................................ 73 Figurë 35. Rezultatet e testimit në përqindje në E-biznes – grupi D ........................................................ 73 Figurë 36. Rezultatet e testimit në përqindje në Teknologji Informative – grupi A .................................. 74 Figurë 37. Rezultatet e testimit në përqindje në Teknologji Informative – grupi B .................................. 75 Figurë 38. Rezultatet e testimit në përqindje në Teknologji Informative – grupi C .................................. 75 Figurë 39. Rezultatet e testimit në përqindje në Teknologji Informative – grupi D .................................. 76

Page 7: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

vii

Figurë 40. Rezultatet e testimit në përqindje në Softuer Sistemor – grupi A ........................................... 77 Figurë 41. Rezultatet e testimit në përqindje në Softuer Sistemor – grupi B ........................................... 77 Figurë 42. Tabela për ruajtjen e të dhënave të përdoruesit. ................................................................... 79 Figurë 43. Tabela për ruajtjen e pyetjeve të krijuara. ............................................................................. 79 Figurë 44. Tabela për ruajtjen e opcioneve të pyetjeve. ......................................................................... 80 Figurë 45. Tabela për ruajtjen e testeve. ................................................................................................ 80 Figurë 46. Tabela për ruajtjen e pyetjeve për testet. .............................................................................. 80 Figurë 47. Tabela për ruajtjen e rezultateve të testeve. ......................................................................... 81 Figurë 48. Tabela për ruajtjen e përgjigjeve të dhëna nga përdoruesi. ................................................... 81 Figurë 49. Diagrami i bazës për testimin elektronik ................................................................................ 82 Figurë 50. Kontrolli për logim ................................................................................................................ 83 Figurë 51. Menyja e Administratorit ...................................................................................................... 84 Figurë 52. Menyja e studentit ................................................................................................................ 84 Figurë 53. Insertimi i pyetjeve................................................................................................................ 85 Figurë 54. Krijimi i testit ......................................................................................................................... 89 Figurë 55. Vendosja e materialeve elektronike ...................................................................................... 93 Figurë 56. Forma e testit ........................................................................................................................ 94 Figurë 57. Kontrolli i logimit për student ................................................................................................ 95 Figurë 58. Kontrolli i logimit për mësimdhënës ...................................................................................... 95 Figurë 59. Faqja e studentit ................................................................................................................... 96 Figurë 60. Faqja e mësimdhënësit.......................................................................................................... 96 Figurë 61. Faqja e krijimit të porosisë për studentin............................................................................... 97 Figurë 62. Faqja e leximit të porosisë për mësimdhënësin ..................................................................... 97

Page 8: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

viii

Lista e Tabelave

Tabelë 1. Shembull i modelit probabilistik ............................................................................................... 8 Tabelë 2. Kategoritë e Kantit ................................................................................................................. 17 Tabelë 3. Modele të mësuarit ................................................................................................................ 36 Tabelë 4. Shpërndarja e studentëve për testim elektronik ..................................................................... 71

Page 9: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

ix

Hyrje Sfida e nxjerrjes apo ruajtjes së informacionit e ka zanafillën qysh në kohët e lashta të njerëzimit. Sumerët ishin të parët që përcaktuan hapësira speciale për ruajtje të tabelave prej argjile me shënime në trajtë pyke. Edhe Sumerët në atë kohë e kuptuan se organizimi adekuat dhe qasja te arkivat ishte kritike për përdorim efikas të informacionit. Ata zhvilluan klasifikime speciale për identifikimin e secilës tabelë dhe përmbajtjen e saj. Nevoja për ruajtje dhe nxjerrje të informacionit të shkruar u bë shumë e nevojshme përgjatë shekujve, veçanërisht me shpikjen e letrës dhe shtypit. Menjëherë pas shpikjes së kompjuterit dhe pas përfundimit të Lufës së Dytë Botërore dhe shpikjes së kompjuterit, njerëzit kuptuan se ato mund të shfrytëzoheshin për ruajtje dhe nxjerrje mekanike të sasive të mëdha të informacionit [1]. Përgjatë viteve, vëllimi i informacioneve, sidomos me shpikjen e ueb-it, rritej vazhdimisht. Kjo bëri që të rritet nevoja e shpërndarjes së informacioneve ndërmjet përdoruesve. Në përgjigje të kësaj, u paraqit nevoja e ndërtimit të sistemeve të nxjerrjes së informacioneve. Roli i sistemeve të kërkimit ndryshoi rrënjësisht, nga sisteme të projektuara për qëllime speciale në sisteme të përgjithshme për secilin përdorues. Por, natyra e pastrukturuar dhe vëllimi i madh i informacioneve që ndodhen nëpër rrjete të ndryshme e ka vështirësuar mënyrën e gjetjes së informacioneve relevante. Për këtë qëllim, hulumtuesit ndërtuan sisteme të shumta kërkimi për ta zgjedhur këtë problem. Në fillimet e tyre, projektimi i këtyre sistemeve ishte i orientuar kryesisht drejt teknikave të bazuara në indekse apo fjalë kyçe. Në bazë të këtyre teknikave, kërkimi bëhet sipas fjalës së caktuar për kërkim nga ana e përdoruesit. Edhe në studimin tonë në kuadër të kësaj teze, ne kemi realizuar një teknikë të këtillë dhe kemi bërë analiza në këtë drejtim. Nga analiza jonë del se te disa kompani në Maqedoni, në kuadër të sistemeve të tyre për qëllim individual, të dhënat e tyre janë shumë të pastrukturuara dhe mundësia e gjetjes së tyre për nevojat ditore afariste është tepër e vështirë. Si studim rasti kemi marrë një kompani regjionale, me filial edhe në vendin tonë, ku aplikojmë teknikën e kërkimit në bazë të indeksit. Megjithatë, një problem i dukshëm i kërkimit indeksues është se ai nuk nxjerr si rezultat edhe fjalët tjera që kanë relacione apo lidhje semantike me fjalën e kërkuar. Kjo mangësi e vështirëson jashtë mase kërkimin më të zgjeruar duke formuluar pyetësor edhe më të komplikuar dhe për këtë qëllim nuk preferohet apo nuk mund ti përmbush nevojat afariste të kompanive për gjetjen e informacioneve të nevojshme. Reduktimi i kostos për gjetjen e informatave si dhe arritja deri tek rezultatet relevante kërkon ndërtimin e pyetësorëve (query) shumë komplekse, gjë që paraqet një sfidë të vërtetë. Në kohën bashkëkohore, përdorimi i ontologjive në sistemet e nxjerrjes së informacioneve është rritur ndjeshëm. Arsyeja kryesore për këtë ka të bëjë me mundësinë që na japin ontologjitë për zgjerimin e pyetësorit, duke lejuar kërkimin e termeve në ontologji ngjashëm si termet e pyetësorit dhe duke i përdorur ato si pjesë të pyetësorit. Sistemet aktuale për nxjerrjen e informacioneve kthejnë në përgjithësi si përgjigje dokumentet në tërësi kurse sistemet për përgjigje të pyetësorëve (Query Answer systems apo vetëm QA) orvaten të gjejnë një përgjigje të saktë, dhe japin rezultate relevante për pyetjet më të thjeshta. Megjithatë, ato nuk u përgjigjen pyetësorëve kompleks atëherë kur duhet të nxirret përgjigja. Për sistemet e nxjerrjes (Information Retrevial systems apo vetëm IR), ontologjitë sipas [2] luajnë

Page 10: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

x

një rol vendimtar për të shtuar një dimension semantik ndërmjet pyetësorëve të formuluar nga shfrytëzuesi dhe burimeve të dhënave. Disa orvatje për përdorimin e ontologjive në motorët e kërkimit mund të gjinden në literaturë . Një vështirësi është gjetja e ontologjive me domen relevant, dhe kombinimi i tyre [3]. Ontologjitë mund po ashtu të eksplorohen në QA sistemet gjatë analizës së pyetësorëve dhe përkthimit [4]. Si përfundim, sistemi duhet të jetë fleksibël [5] sa i përket informacionit të nxjerrë nga dokumentet në përgjigje të saktë . Resurset/burimet janë po ashtu të shpërndara dhe heterogjene, dhe rezultatet duhet të integrohen. Përdorimi i informacionit semantik, siç janë ontologjitë, duket se është çështje shpresëdhënëse dhe implikon një numër të caktuar të problemeve të pazgjidhura. Kërkimi apo hulumtimi i nxjerrjes së informacioneve mund të paraqes një klasë më të zgjeruar të veprimeve ku informacioni i ri kërkohet një një domen konceptual të definuar [6]. Kohëve të fundit ka pasur po ashtu një interesim të theksuar në mbështetjen e formave hulumtuese të kërkimit të informacionit kur përdoruesit nuk janë të njohur me domenin që e hulumtojnë, terminologjinë e informacionit, burimet e informacionit, ose madje edhe kur përdoruesit nuk janë të sigurt për qëllimet e tyre të kërkimit. Për këtë qëllim, ky aspekt hulumtues është trajtuar në thellësi me rastin e Ueb-it Semantik. Kjo temë paraqet interes edhe në komunitetin e Inteligjencës Afariste, e cila mbështetet në eksplorimin interaktiv të hapësirave multidimensionale të informacionit.

Page 11: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

1

Kapitulli 1. Përshkrimi dhe qëllimi i projektit Me qëllim të menaxhimit dhe nxjerrjes së informacioneve apo diturive semantike nga databazat e mëdha ose nga burimet heterogjene të informacioneve, kemi bërë paraqitjen e disa teknologjive të bazuara në ontologji. Ekzistojnë kryesisht dy drejtime gjatë evaluimit të sistemeve me kërkim semantik. Drejtimi i parë është të konfirmohet përhapja e tyre ndaj motorëve aktual të kërkimit; dhe e dyta – të evaluohet përdorimi i tyre potencial. Duke iu referuar drejtimit të parë, koleksioni i dokumenteve TREC 1 do të ishte një zgjedhje e natyrshme. Megjithatë, kjo është akoma problematike meqë ontologjitë onlajn mbulojnë vetëm një pjesë të vogël të pyetjeve testuese në koleksion. Rrjedhimisht, shumë nga evaluimet për IR semantik janë koncentruar në bashkësinë e tyrë të dhënave. Evaluimi i drejtimit të dytë akoma nuk e ka gjetur rrugën drejt komunitetit. Eshtë vërtetuar se nxjerrja e informacionit ndikon dhe varet nga konteksti i tij: qëllimet, sistemi informativ, informacioni i përdorur, informacioni i fituar dhe vetitë e procesit të punës. Një faktor me rëndësi në kërkim është edhe eksperienca e përdoruesve. Ekspertiza në këtë fushë shpesh konsiderohet së bashku me dy dimensione, të njohura si ekspertiza e domenit dhe ekspertiza e kërkimit. Subjektet e para janë në dijeni për domenin e posaçëm kurse të fundit kanë eksperiencë në përdorimin e makinave të kërkimit dhe veglave të tyre. Ekspertët e domenit evaluojnë rezultatet e kërkimit prej së afërmi si dhe ekspertët e kërkimit në web i hulumtojnë në thellësi rezultatet, kurse fillestarët e kërkimit përdorin strategji më të gjerë të kërkimit. Në ditët tona, hasim çështje sfiduese që kanë të bëjnë me burime të shpërndara dhe heterogjene të dhënash që përmbajnë sasi të mëdha të dhënash në shumëllojshmëri të strukturave semantike. Zhvillimi i një sistemi për integrimin e të dhënave është kompleks dhe përbëhet nga aspekte të mëdha që mund të përfshijnë ndryshueshmërinë (heterogjenizimin) e burimeve të dhënave, ndryshime në mekanizmin e qasjes, dhe mbështetjen e gjuhëve për pyetësore dhe qasjen e ndryshueshmërisë semantike në relacion me modelet e tyre të dhënave. Kohës së fundit, ontologjitë përdoren jashtëzakonisht shumë për eliminimin e problemit të heterogjenizimit semantik. Ekzistojnë disa arkitektura që përdorin ontologji për integrimin e të dhënave për të mundësuar qasje deri te burimet e shpërndara dhe heterogjene të dhënave. Ndër këto arkitektura, si më të theksuara në literaturë janë: HeC2, TAMBIS3, SEMEDA4 etj. Secila nga këto qasje përdor pjesërisht një model të njëjtë që përfshin magazinimin e të dhënave (data warehouse) me 1 Text REtrieval Conference – Një konferencë vjetore për nxjerrje të informacionit qëllimi i së cilës është mbështetja e hulumtimeve në fushën e nxjerrjes së informacionit.

2 Health-e-Child (HeC) projekti ka për qëllim të zhvillojë një platform të integruar shëndetësore për pediatrinë Europiane, duke ofruar integrim të vazhdueshëm të burimeve tradicionale dhe burimeve në shfaqje të informacioneve biomjekësore.

3 Projekti TAMBIS u zhvillua për të ofruar qasje transparente përgjatë databazave të ndryshme biologjike me koncepte të specifikuara që përdorin logjikë përshkruesr të bazuar në gjuhën Ontologjike, DAML+OIL.

4 SEMEDA mund të përdoret për modifikimin dhe mbështetjen e ontologjive dhe parashtrimin e pyetësorëve për databazën e integruar në kohë reale.

Page 12: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

2

pyetësor i cili bazohet në ontologji. Skema në magazinimin e të dhënave e mban skemën kolektive të gjithë burimeve të dhënave (e njohur edhe si skema globale), dhe ontologjia që është ndërtuar mbi skemën globale quhet ontologjia globale. Këtu skema e definon databazën në nivelin logjik kurse ontologjia e definon databazën në nivelin konceptual; pasqyrimet (mappings) janë dhënë ndërmjet skemës dhe ontologjisë për ti lidhur të dyja. Pyetësorët e shfrytëzuesve formulohen në ontologjinë globale dhe të gjitha kërkesat përgjigjen drejpërdrejt nga magazina. Kjo mund të rezultojë në përgjigje të shpejta dhe jep rezultate të shumëfishta nga depoja e centralizuar me të dhëna. Menaxhimi i magazinës po ashtu nuk është punë e lehtë. Kurdo qoftë që të futen të dhëna të reja apo edhe të fshihen nga ndonjëri sistem i burimit, ndryshimi duhet të reflektohet në magazinë dhe kjo mund të kërkojë pezullimin e ekzekutimit të kërkesave të shfrytëzuesit. Kjo arkitekturë shpesh quhet model i shtytjes së informacionit, ku të dhënat “shtyhen” në magazinë për një kohë të fundme.

Zbatimi i kërkimit semantik nga mjediset e shpërndara dhe heterogjene paraqet një koncept të ri dhe teknologjitë e kërkimit apo nxjerrjes së informacionit të bazuara në ontologji janë shumë hipotetike, duke mos pasur të definuar një kornizë të qëndrueshme për zbatimin e kërkimit sipas ontologjive në ueb-in si tërësi, i cili përbëhet nga një numër i pakufizuar i domeneve. Për të ilustruar këtë teknikë të aplikimit të kërkimit semantik për sistemet e Inteligjencës Afariste, në këtë punim, kemi ndërtuar një sistem informativ nga fusha E-learning. Në sistemin tonë kemi përfshirë aplikimin e testimit elektronik apo E-testing, mbi bazën e të cilit do të analizojmë dhe propozojmë mundësinë e zgjerimit të funksionalitetit të tij për të mbështetur teknikat e nxjerrjes së informacioneve të bazuara në ontologji.

Evaluimi i ndërfaqeve për kërkimet hulumtuese do të jetë po ashtu pjesë e kontributit për këtë tezë, që aktualisht akoma mbetet një punë e vështirë dhe jo shumë e hulumtuar.

1.1 Struktura e tezës Teza është ndarë në tetë kapituj. Në kapitullin e parë kemi paraqitur disa të dhëna themelore mbi definicionin e problematikës së tezës, duke i parashtruar nevojat aktuale të ndërtimit të sistemeve për kërkim semantik të bazuar në ontologji. Kjo qartë është theksuar në pjesën e motivacionit dhe qëllimit të tezës. Në kapitullin e dytë kemi dhënë një pasqyrë mbi nxjerrjen e informacioneve si proces. Këtu kemi sqaruar dhe elaboruar disa nga strategjitë ekzistuese për kërkim, siç janë modelet Boolean, probabilistik dhe modeli i hapësirave vektoriale. Në fund të kapitullit kemi bërë edhe vlerësimin e metrikës për këto sisteme. Në kapitullin e tretë kemi bërë eksplorimin e ontologjive, duke hedhur një vështrim edhe mbi llojet e dhe gjuhët ontologjive. Në kapitullin e katërt kemi analizuar teknologjitë për kërkim semantik të bazuar në ontologji, duke e përfshirë edhe rangimin e rezultateve. Kapitulli i pestë i përfshin aplikimin dhe integrimin e ontologjive në mjedisin E-learning. Në kuadër të këtij kapitulli, ilustrojmë praktikisht mundësinë për zbatimin e ontologjive me aplikacionin prototip SMEUS (Sistemi për Mësim Elektronik në

Page 13: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

3

Ueb-in Semantik), i zhvilluar për të dhënë opsione të reja të integrimit të ontologjive edhe në mjedise me të dhëna multidimensionale. Në kapitullin e gjashtë janë definuar konceptet e kërkimit semantik për sistemet e Inteligjencës afariste. Në mënyrë përshkruese jepen karakteristikat e aplikimit të kërkimit semantik në këto sisteme, si dhe mundësinë e zbatimit të këtij kërkimi në SMEUS. Kapitulli i shtatë përmban disa analiza mbi testimet e realizuara elektronike me ndihmën e SMEUS me student në mjedis universitar dhe kapitulli i tetë e përfshin përshkrimin e disa ndërfaqeve dhe kodeve të SMEUS. Pjesa e fundit i përfshin referencat e marra nga literatura të tjera.

Page 14: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

4

Kapitulli 2. Procesi i nxjerrjes së informacioneve

Nxjerrja e informacioneve paraqet një komponent të rëndësishëm të sistemit informativ. Duke u bazuar në faktin se burimet e informacionit gjithnjë e më shumë rriten, është e domosdoshme që një kompani të realizoj grumbullimin, procedimin, raportimin dhe përdorimin e të dhënave, në mënyrë që të zmadhojë efikasitetin e aktiviteteve afariste. Meqenëse libraritë apo të dhënat që duhen filtruar po bëhen vazhdimisht të mëdha, është thelbësore që të përdoret një sistem i besueshëm i cili do të ishte në gjendje që ti gjejë informacionet relevante për përdoruesit. Ky është edhe qëllimi kryesor i sistemeve për nxjerrje të informacionit.

Sistemi informativ nevojitet që të sigurojë nëse të gjithë shfrytëzuesit e planifikuar do të shërbehen dhe do ta kenë informacionin e nevojshëm për ti realizuar detyrat e tyre, që ti zgjidhin problemet, dhe të marrin vendime, pavarësisht se ku ndodhen informacionet. Sistemi informativ duhet që (1) në mënyrë aktive të gjejë se cilat janë kërkesat apo nevojat e shfrytëzuesit, (2) të gjejë dhe t’ju qaset dokumenteve, dhe (3) t’i përshtat ose bashkoj me ato kërkesa apo nevoja. Për një nxjerrje të suksesshme është i rëndësishëm kuptimi i tipit të informacionit me ndihmën e të cilit shfrytëzuesi do të zgjedh ndonjë problem.

Ekzistojnë dy projekte fillestare që e shënojnë krijimin e fushës së nxjerrjes së informacionit. I pari është projekti Cranfield që filloi në vitin 1957 dhe zgjati deri në vitin 1966. Projekti i dytë ishte SMART, që filloi në fillimin e viteve 60 të shekullit të kaluar duke zgjatur deri nga fundi i atij shekulli. SMART ishte një sistem për nxjerrje automatike të tekstit – duke filluar nga një pjesë e një teksti në një gjuhe natyrale që jepej nga përdoruesi dhe testohej nëse ky tekst i përgjigjet një dokumenti të indeksuar [7]. Një nga metodat më me ndikim është përshkruar nga H.P. Luhn në vitin 1957, ai propozoi përdorimin e disa fjalëve si njësi indeksuese për dokumentet dhe matjen e përkimit të fjalëve si kriter për nxjerrje [8]. Algoritmet e parë të zhvilluar për IR ishin ato që u përdorën për kërkim nga viti 1996 deri në 1998.

Sipas definicionit të dhënë nga [8], një model i nxjerrjes së informacionit apo (IR=Informaition Retrieval) është katërshja [D,Q,F, sim], ku:

• D është bashkësia me dokumente (paraqitje logjike e dokumenteve),

• Q është bashkësia me pyetësor (paraqitje logjike e pyetësorëve),

• F është korniza e modelimit të dokumenteve, pyetësorëve dhe relacioneve të tyre,

• sim: Q × D → U paraqet funksionin e rangimit që definon një ndërlidhje ndërmjet pyetësorëve dhe dokumenteve, ku U është bashkësi plotësisht e renditur (zakonisht [0,1]). Ky rangim dhe renditja e plotë në U definon një rregull në bashkësinë e dokumenteve, për një pyetësor të fiksuar.

Page 15: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

5

2.1 Strategjitë e kërkimit të informacionit

Qëllimi final i një sistemi të kërkimit apo nxjerrjes së informacionit mund të përshkruhet si përfaqësimi, deponimi, organizimi dhe qasja deri te informacionet [9]. Një paraqitje të përgjithshme të bazuar në përcaktimin e sipërshënuar po japim në Figurën 1.

Figurë 1. Procesi i sistemit për nxjerrjen e informacionit

Në bazë të këtij procesi, përdoruesi e formulon pyetësorin në motorin e kërkimit. Formati i pyetësorit mund të jetë tekst, fotografi, zë, etj. Në vijim, motori i kërkimit i nxjerr dokumentet nga korpusi i të dhënave, por vetëm ato që kanë një relacion me pyetësorin. Elementet e jashtme përfshijnë ndërfaqen e përdoruesit, operacione të ndryshme për procedimin e pyetësorit dhe resurse për indeksimin. Hapi tjetër është rangimi i dokumenteve duke e zvogëluar probabilitetin apo shkallën e rëndësisë së dokumentit dhe në fund këtë ia kthen përdoruesit. Ky proces mund të përsëritet.

Sipas [10], dallojmë katër procese në një sistem për nxjerrjen e informacionit: indeksimin, procedimin e pyetësorit, kërkimin dhe rangimin. Hapi i rangimit ka për qëllim të paracaktojë sa janë të krahasueshëm dokumentet relevante me njëri tjetrin dhe kështu si dalje të kthejë dokumente sipas rëndësisë por në formë rënëse.

Page 16: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

6

2.1.1 Modeli Boolean

Ky model ka pasur përdorim dominues për nxjerrjen e informacioneve deri nga mesi i viteve 90 të shekullit të kaluar. Një arsye për këtë është se ky model është i thjeshtë dhe intuitiv. Një tjetër arsye është se në mesin e hulumtuesve ka mbizotëruar ideja se ky model tregon rezultate më të mira në raport me modelet tjera jo-Boolean [11].

Strategjia e kërkimit e këtij modeli bazohet në teorinë e bashkësive dhe algjebrën e Bulit. Pyetësorët e formuluar si shprehje të Bulit kanë një semantikë të saktë, ndërsa dokumentet përfaqësohen si terme të indeksit të nxjerra prej dokumenteve. Sipas definicionit nga [9] në këtë model kemi:

D: elementet e D përfaqësohen si bashkësi të termeve të indeksit që paraqiten në secilin dokument. Termet trajtohen si parafjalë logjike, duke simbolizuar nëse termi është prezent (1) ose mungon (0) në dokument.

Q: pyetësorët përfaqësohen si shprehje të Bulit të përbëra nga termet e indeksit dhe operatorët logjik (AND∧, OR∨, NOT¬) të cilët mund të normalizohen në disjunksion të vektorëve konjuktiv (p.sh. DNF2, forma formale disjunktive). Për shembull: për pyetësorin “veturë sportive” do të kemi: q=(“veturë” ∨ “auto” ∨ “automobil”) ∧ (“sport” ∨ “sportive”)

F: paraqet algjebrën e Bulit mbi bashkësinë e termeve dhe bashkësinë e dokumenteve. sim: definohet duke konsideruar se dokumenti parashihet që të jetë relevant për

pyetësorin nëse termi i indeksit të tij e plotëson apo e kënaq shprehjen e pyetësorit.

Edhe pse ky model hasi në përdorim të gjerë te sistemet e hershme komerciale bibliografike, ai vuan nga dy mangësi kryesore. Së pari, strategjia kërkimore e tij bazohet në kriterin binar (d.m.th. dokumenti parashihet të jetë ose relevant ose jo relevant) dhe për këtë arsye nuk ofron një bazë të shëndoshë për rangimin e rezultateve të nxjerra e që do të rezulton në nivel të ulët të saktësisë (precesion) atëherë kur hapësira e nxjerrjes së informacionit është tepër e madhe. Së dyti, nuk është çdoherë e lehtë për përdoruesit që ti transformojnë informacionet e tyre që iu nevojiten për kërkim në shprehje të Bulit me operator logjik.

2.1.2 Modeli probabilistik

Ideja që qëndron pas këtij modeli është në probabilitetin apo gjasën që një dokument i dhënë dk do të jetë relevant ndaj një pyetësori të caktuar q, shënojmë P(R|q,dk), ku R paraqet relevancën. Në bazë të definicionit për sistemet e nxjerrjes së informacionit sipas [9], në këtë model kemi:

D: dokumentet paraqiten si vektor apo fjalë ose terme indeksi të dokumentit. Secili term në dokument ka një peshë binare 1 ose 0, që simbolizon prezencën apo mungesën e termit në dokument.

Page 17: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

7

Q: pyetësorët paraqiten si vektor fjalësh ose terme indeksi që janë pjesë e pyetësorit. Secili term në pyetësor ka peshën binare 1 ose 0, që simbolizon prezencën apo mungesën e termit në pyetësor.

F: është modeli probabilistik që i rangon dokumentet sipas probabilitetit të relevancës të pyetësorit.

sim: bën matjen e shkallës së ngjashmërisë së dokumentit dk në pyetësorin q. Kjo njehsohet sipas formulës:

sim(q, dk) = ( | , )( | , )

Nëse 푃(푅|푞, 푑 ) është probabiliteti që dk është relevant për pyetësorin q, dhe le të jetë 푃(푅|푞,푑 ) probabiliteti që dk nuk është relevant për pyetësorin q, duke aplikuar teoremën e Bajesit [12] do të kemi:

sim(q, dk) = ( | )( | ) =

( | )× ( )( | )× ( )

(2.1)

ku P(R) dhe P(푅) do të jenë probabilitete të relevancës dhe jo relevancës, ndërsa 푃(푑 |푅)dhe 푃(푑 |푅) paraqesin probabilitetin e dk që testohet.

Si hap tjetër i rëndësishëm i procesit të nxjerrjes ës informacionit është edhe rangimi i dokumenteve në formë rënëse sipas probabilitetit që dokumenti është relevant apo jo relevant për pyetësorin. Ky proces quhet principi i rangimit të probabilitetit [13]. Sipas këtij principi, i rëndësishëm është rangimi i dokumenteve e jo vlera aktuale e probabilitetit. Duke supozuar që P(R) dhe P(푅) për një pyetësor të dhënë janë të njëjtë për të gjitha dokumentet, barazimi (2.1) mund të reduktohet në:

sim(q, dk) ~ ( | )( | )

(2.2).

Sipas supozimit të pavarësisë së termeve të propozuar nga [14], do të kemi: P(dk|R)=∏ P(푑 , |R), ku t është numri i elementeve në dk. Nëse e aplikojmë këtë në formulën (2.2), atëherë do te kemi:

sim(q, dk) ~ ( | )( | )

~ ∏ ,

( , (2.3)

Formula (2.3) tregon se raporti apo proporcioni ndërmjet probabiliteteve të dk që janë në dokumentet relevante dhe jo relevante është i barabartë me prodhimin e raporteve përkatëse të një elementi të vetëm.

Sipas [15], prodhimi në ekuacionin (2.3) mund të thjeshtohet duke u bazuar në paraqitjen e termeve në dokumentin dk:

Page 18: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

8

( | )( | )

= ∏ ,

( ,∏ ,

( , (2.4)

Duke e ditur se 푃 푑 , 푅 + 푃( 푑 , 푅 =1 dhe duke përdor transformime logaritmike për të fituar funksion linear të sim, shprehja për rangim në modelin probabilistik, sipas [9], duke i injoruar faktorët që janë konstant për të gjitha dokumentet kur kemi pyetësor të njëjtë, do të jetë:

sim(q, dk) ~ ∑ 푤 , × 푤 , × (푙표푔 푃 푑푘,푖 푅푃 푑푘,푖 푅

+ 푙표푔 푃( 푑푘,푖 푅푃( 푑푘,푖 푅

)

ku 푤 , ={0,1} e paraqet prezencën/mungesën e termit ti në pyetësorin q dhe 푤 , e paraqet prezencën/mungesën e termit ti në dokumentin dk.

Meqenëse R paraprakisht nuk dihet, përpara se të nxirren dokumentet mund të merret një supozim si vijon:

푃 푑 , 푅 = 0.5 ose konstante për të gjitha termet e indeksit ti 푃 푑 , 푅 = , ku ni paraqet numrin e dokumenteve që e përmbajnë ti dhe N është

numri i përgjithshëm i dokumenteve

Nëse marrim që V të jetë nënbashkësi e dokumenteve të nxjerra dhe ranguara nga modeli probabilistik, probabilitetit mund të paraqiten edhe si:

푃 푑 , 푅 = | || | , ku Vi është bashkësia e dokumenteve të nxjerrë e ku përfshihet ti.

푃 푑 , 푅 = | || |

, këtu konsiderojmë se dokumentet e pa nxjerra janë jo relevante.

Nëse procesi përsëritet në mënyrë rekursive, do të fitojmë:

푃 푑 , 푅 = | | 푛푖

푁| |

푃 푑 , 푅 = | |

| |

Shembull ilustrues për modelin probabilistik

Tabelë 1. Shembull i modelit probabilistik

Dokumente Bashkësia e termeve të indeksit Fakultet Qyteti Informatika

d1 1 0 1 d2 0 1 1 d3 0 0 0

Page 19: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

9

Supozojmë që bashkësia e dokumenteve të jetë e përbërë prej tre dokumenteve. Vlera 1 nënkupton se termi i indeksit ndodhet në dokument, ndërsa vlera 0 nënkupton se ai nuk ndodhet në dokument. Nëse kemi që V={d1,d2}, e njehsojmë relevancën për d1.

푃(퐹푎푘푢푙푡푒푡|푅) = | |

| | =1+1

32+1 = 0.44; 푃(퐹푎푘푢푙푡푒푡|푅) =

| |

| | = = 0.16

푃(퐼푛푓표푟푚푎푡푖푘푎|푅) = | |

| | = = 1 푃(퐼푛푓표푟푚푎푡푖푘푎|푅) = | |

| | = = 1

sim(d1,q) ~ log( . ) + log(.

) + log(.

) + log( . ) = 0.87

Në nivelin konceptual, përparësia e modelit probabilistik është se dokumentet rangohen në formë rënëse sipas probabilitetit të relevancës. Megjithatë, mangësi e këtij modeli është se gjithmonë nevojitet një ndarje fillestare e dokumenteve në relevante dhe jo relevante. Fakti që modeli nuk e përfill frekuencën e termeve të indeksit brenda dokumenteve, paraqet një tjetër mangësi plotësuese duke e ditur se në këtë model të gjitha peshat e termeve janë binare.

2.1.3 Modeli i hapësirave vektoriale Për arsye se në modelet paraprake si kufizim paraqitej përdorimi i peshave binare, modeli i hapësirave vektoriale propozon një kornizë ku bëhet e mundur një përshtatje e pjesshme. Kjo arrihet duke i shtuar pesha jo binare termeve të indeksit në pyetësor dhe dokumente.

Në modelin e hapësirës vektoriale teksti paraqitet si vektor termesh. Definicioni i termit nuk trashëgohet në këtë model, por termet janë zakonisht fjalë apo fraza. Nëse fjalët zgjidhen si terme, atëherë çdo fjalë në fjalor bëhet një dimension i pavarur në një hapësirë vektoriale me dimension shumë të lartë. Çfarë do lloji teksti mund të paraqitet me vektor në këtë hapësirë me dimension të lartë. Nëse termi i përket tekstit, atëherë merr një vlerë jo-zero në tekst-vektorin gjatë dimensionit që i përgjigjet termit. Meqë çfarëdo teksti përmban një tërësi të kufizuar të termeve (fjalori përmban miliona terme), shumë tekst vektorë janë të rrallë. Shumica e sistemeve të bazuar në vektor funksionojnë në kuadrantin pozitiv të hapësirës dimensionale, d.m.th., asnjë term nuk përcaktohet me vlerë negative. Duke i renditur dokumentet e nxjerra në formë rënëse sipas shkallës së ngjashmërisë, modeli i merr në konsideratë pjesërisht dokumentet që përkojnë me termin e pyetësorit.

Sipas definicionit të mëparshëm, këtu kemi:

D: dokumentet paraqiten si vektor fjalësh apo terme indeksi që ndodhen në dokument. Secili term në dokument, ose secili çift (ti,dj), ka peshë pozitive përkatëse jo binare wi,j.

Page 20: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

10

Q: pyetësorët paraqiten si vektor fjalësh apo terme indeksi që ndodhen në pyetësor. Secili term në pyetësor, ose secili çift (ti,q), ka peshë pozitive përkatëse jo binare wi,j.

F: është një model algjebrik mbi vektor në hapësirën dimensionale t. sim: e njehson shkallën e ngjashmërisë ndërmjet vektorit të dokumentit dj dhe vektorit të

pyetësorit (meqë pyetësori është edhe tekst dhe mund të shndërrohet në vektor) q. Ky korrelacion ndërmjet vektorëve dj dhe q paraqitet me kosinusin e këndit ndërmjet dy vektorëve:

Pasi që wi,j>0 dhe wi,q>0, atëherë sim(q,dj) do të ndryshojë nga vlera 0 deri në 1. Grafikisht mund ta paraqesim si më poshtë:

Figurë 2. Këndi ndërmjet pyetësorit dhe dokumenteve

Përparësia kryesore e modelit të hapësirave vektoriale janë skema e dhënies së peshës për termet, përkimi i pjesshëm dhe rangimi i dokumenteve sipas shkallës së ngjashmërisë. Por ekzistojnë edhe disa mangësi që mund ti atribuohen këtij modeli. Termet e indeksit janë reciprokisht të pavarura, me çka pamundësohet përfshirja e varshmërisë së termeve në kuadër të modelit. Nga këndvështrimi konceptual, rangimi i dokumenteve është jo shumë intuitiv dhe i pamundur të verifikohet nga ana e përdoruesve.

2.2 Metrika e evaluimit të sistemeve IR Shumica e IR sistemeve funksionale bazohen në strukturat e të dhënave të njohura si lista të përmbysura. Kjo na lejon qasje të shpejtë te lista e dokumenteve që përmbajnë term bashkë me informacionin tjetër (për shembull, pesha e termit në secilin dokument, pozitat relative të termit në secilin dokument, etj.). Lista tipike e përmbysur mund të ruhet si:

ti → < da ,… >, < db ,… >, … , < dn ,… >,

Page 21: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

11

që tregon se termi i i-të përmbahet në da , db, . . . , dn , dhe ruan edhe ndonjë informacion tjetër. Të gjithë modelet e sqaruara më lartë mund të implementohen duke i përdorur listat e përmbysura. Listat e përmbysura shfrytëzojnë faktin se me një pyetësor të dhënë nga shfrytëzuesi, shumica e IR sistemeve janë të interesuara vetëm në vlerëdhënien e një numri të vogël të dokumenteve që përmbajnë ndonjë term pyetësor. Kjo lejon që sistemi ti shënoj vetëm dokumentet që kanë vlerë numerike jo-zero. Shumica e sistemeve e ruajnë vlerën për dokumentet në stivë (ose ndonjë strukturë tjetër të dhënash) dhe në fund të procedimit e kthejnë dokumentin me vlerën më të lartë për pyetësorin. Meqenëse të gjitha dokumentet janë të indeksuara me terme që ato i përmbajnë, procesi i gjenerimit, ndërtimit, dhe ruajtjes së përfaqësimeve të dokumentit quhet indeksim dhe si rezultat fajllat e përmbysur quhen indekse të përmbysur [16].

Evaluimi objektiv i efikasitetit të kërkimit ka qenë një element kryesor i IR. Ekzistojnë matje standarde për performansën e IR sistemeve.

Saktësia: Raporti i dokumenteve të nxjerrë nga sistemi e që janë relevante për pyetësorin pjesëtuar me numrin total të dokumenteve të nxjerra.

_ _ _ __ _ _ _ _

Numri i dokumenteve të nxjerraPNumri total i dokumenteve të nxjerra

Për shembull, nëse sistemi ka nxjerrë 6 dokumente për një pyetësor, ku 3 nga ato kanë qenë relevante, performansa e saktësisë për atë sistem me atë pyetësor është 0.5 ose 50%. Fjalët me më shumë kuptime mund të prodhojnë vlera të ulëta të saktësisë, sepse mund të nxirren dokumentet jo relevante.

Kthimi: Mund të jenë disa dokumente në databazë që shfrytëzuesi i konsideron relevante, por vetëm disa nga ato do të nxirren nga sistemi. Performansa e kthimit të një pyetësori është numri i nxjerrë i dokumenteve relevante nga sistemi pjesëtuar me numrin total të dokumenteve relevante në databazë.

_ _ _ _ __ _ _

Numri i dokumenteve relevante të nxjerraRTotali i dokumenteve relevante

Koha e reagimit: Koha e kaluar ndërmjet parashtrimit të pyetësorit dhe paraqitjes së dokumenteve të nxjerrë nga sistemi. Saktësia mundet që lehtësisht të zmadhohet duke nxjerrë një dokument të vetëm që është me të vërtet relevant, dhe të kthej duke nxjerrë të gjitha dokumentet nga databaza. Pra, preferohet përmasa që i kombinon të dyja këto, për shembull përmasa F:

2 RPFR P

ku përmasa F është mesatare harmonike e saktësisë dhe kthimit. Përparësia e përdorimit të përmasës F është se zmadhimi i saj nënkupton zmadhimin e kombinimit të kthimit dhe saktësisë.

Page 22: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

12

2.3 Kërkimi sipas indeksit si opsion për nxjerrjen e informacionit Sistemet e informacionit janë bërë shumë komplekse si rezultat i rritjes së pandalshme të vëllimit të dhënave, strukturave të ndryshme, teknologjive të ndryshme dhe kërkesave të përdoruesve. Rrjedhimisht, nxjerrja e të dhënave nga këto sisteme paraqitet si një proces sfidues. Me qëllim të ilustrimit të këtij procesi në praktik, do të sqarojmë disa atribute te modelit të hapësirave vektoriale për ta paraqitur idenë e aplikimit të teknologjive për nxjerrje të dhënave. Aplikojmë teknikën kërkuese sipas indeksit duke krijuar indeks të bazuar në fajllat tekstuale nëpër skedar, më tutje realizojmë disa kërkime indeksore për terme të ndryshme. Për të testuar konceptet tona, përdorim dokumente afariste nga kompania Knauf Radika, lider regjional për prodhimin e produkteve të gipsit. Në rastin tonë të studimit, sasia e dokumenteve të kompanisë ishte e madhe dhe ato dokumente ishin të shpërndara në shumë lokacione apo skedare të ndryshme duke qenë njëkohësisht edhe jo të strukturuara. Si rezultat, performansa e pyetësorit reduktohej me rritjen e numrit të dokumenteve në indeks, si pasojë faktori rritës bëhet shumë i vogël. Edhe pse si kufizim kryesor në lidhje me madhësinë e indeksit në praktikë paraqitet kapaciteti i diskut, për shkak të instalimit të disqeve masive në kompani, ne hasëm vetëm disa vonesa I/O të diskut.

2.3.1 Implementimi algoritmik Studimin tonë të aplikimit të teknologjisë së nxjerrjes së tekstit do ta aplikojmë me anë të dokumenteve të kompanisë së lartpërmendur. Për të realizuar këtë qëllim, implementojmë një kornizë testimi të bazuar në Lucene1, që paraqet një librari për kërkim tekstual me performansë të lartë e koduar tërësisht në Java. Ky është një API me kod të hapur e krijuar nga Apache Software Foundation. Sipas [9], modeli i hapësirave vektoriale bazohet në supozimin se termet e njëjta paraqiten edhe në pyetësor edhe në dokumentet relevante, e që ilustrohet qartë edhe nga Lucene duke ofruar një mënyrë të thjeshtë të nxjerrjes së matricave me frekuencën e termeve dhe dokumenteve. Para se të përshkruajmë procesin në fjalë, bëjmë një sqarim të shkurtër për kuptimin e indeksit. Indeksi është identik me indeksin në fund të librave, ku mund ti gjejmë termet për kërkim dhe faqet përkatëse në libër. Ngjashëm, kur krijojmë një indeks bazuar në dokumente, mund të formojmë pyetësor sipas indeksit për të zbuluar se çfarë dokumentesh e plotësojnë termin që kërkohet. Krijojmë njëkohësisht indeksin dhe bëjmë kërkim kundër atij indeksi. Megjithatë, këto janë aktivitete konceptualisht të ndryshme. Struktura e projektit të demonstruar përbëhet nga skedari "fajlla_ne_Index" i cili përbëhet nga fajlla tekstual të cilat kemi për qëllim ti indeksojmë dhe skedarin “Skedari_Index”. Ky i fundit do të përmbaj indeksin që e krijojmë. Projekti jonë përdorë fajllin lucene-core.jar me klasën LuceneKnauf.

Indeksojmë dy fajlla tekstual në skedarin “fajlla_në_Index”. Në brendi të fajllit të parë, gypsum1.txt, kemi informacion për materialet e gipsit. Ky fajll i përmban fjalët: gur, gips. miniera, qymyr, kristal. Fajlli tjetër, gypsum2.txt, i përmban disa materiale tjera të gipsit: suva, sediment, shkemb, miniera, renaturim.

Page 23: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

13

Së pari, duhet të krijojmë indeksin me anë të metodës createIndex(). Përdorim edhe objektin IndexWriter për të krijuar dhe përditësuar indeksin, përmes së cilit emri i skedarit mund të zhvendoset në konstruktorin IndexWriter. Përdorim konstruktor që merr tre argumente. Argumenti i parë është lokacioni i skedarit ku duhet të shfaqet indeksi i fajllit. Argumenti i dytë është objekti AnalizuesiStandard. Analizuesi i simbolizon principet e teknikës së nxjerrjes së termeve të indeksit nga teksti. Argumenti i tretë, rikrijoIndexNeseEkziston, është parametër logjik (boolean) që para definohet të jetë i saktë, që i tregon konstruktorit IndexWritet për ta rindërtuar indeksin nga fillimi, nëse ai tashmë ekziston.

public class LuceneKnauf { public static final String FILES_TO_INDEX_DIRECTORY = "fajlla_ne_Index"; public static final String INDEX_DIRECTORY = "Skedari_Index"; public static final String FIELD_PATH = "path"; public static final String FIELD_CONTENTS = "contents"; public static void main(String[] args) throws Exception { createIndex(); searchIndex("qymyr"); searchIndex("miniera"); searchIndex("miniera AND renaturim"); searchIndex("miniera and renaturim"); searchIndex("kalcium OR renaturim"); } public static void createIndex() throws CorruptIndexException, LockObtainFailedException, IOException { Analyzer analyzer = new AnalizuesiStandard(); boolean rikrijoIndexNeseEkziston = true; IndexWriter indexWriter = new IndexWriter(INDEX_DIRECTORY, analyzer, rikrijoIndexNeseEkziston); File dir = new File(FILES_TO_INDEX_DIRECTORY); File[] files = dir.listFiles(); for (File file : files) { Document document = new Document(); String path = file.getCanonicalPath(); document.add(new Field(FIELD_PATH, path, Field.Store.YES, Field.Index.UN_TOKENIZED)); Reader reader = new FileReader(file); document.add(new Field(FIELD_CONTENTS, reader)); indexWriter.addDocument(document); } indexWriter.optimize(); indexWriter.close(); } public static void searchIndex(String kerkoString) throws IOException, ParseException { System.out.println("Kerkimi per '" + kerkoString + "'"); Directory directory = FSDirectory.getDirectory(INDEX_DIRECTORY); IndexReader indexReader = IndexReader.open(directory);

Page 24: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

14

IndexSearcher indexSearcher = new IndexSearcher(indexReader); Analyzer analyzer = new AnalizuesiStandard(); QueryParser queryParser = new QueryParser(FIELD_CONTENTS, analyzer); Query query = queryParser.parse(kerkoString); Hits hits = indexSearcher.search(query); System.out.println("Eshte gjetur: " + hits.length() + "here"); Iterator<Hit> it = hits.iterator(); while (it.hasNext()) { Hit hit = it.next(); Document document = hit.getDocument(); String path = document.get(FIELD_PATH); System.out.println("Lokacioni: " + path); } }

Më tej, për të gjithë fajllat në “fajlla_ne_Index” krijojmë objekt dokumenti në Lucene, që përbëhet nga një tërësi me fusha që mund të jenë të dhëna, meta të dhëna të dokumentit aktual. Krijojmë më tutje dy fusha dhe ia bashkëngjisim ato dokumentit. Fusha e parë përdoret për të ruajtur dhe kopjuar shtegun kanonik për secilin fajll tekstual në indeks. E specifikojmë që të kopjohet në indeks nëpërmjet argumentit Field.Store.YES. Më pas sigurohemi që Analizuesi të mos e shënjestroj (tokenize) shtegun me ndihmën e fushës Field.Index.UN_TOKENIZED.

Kjo bënë që shtegu të jetë i plotë dhe integral duke mos u fragmentarizuar nga Analizuesi. Fusha e dytë paraqet përmbajtjen e fajllit. Përmbajtjet shënjestrohen dhe indeksohen, por nuk do të ruhen/zhvendosen në indeks. Kjo për arsye se si argument kemi përdorur lexues (Reader) në konstruktorin e fushës (Field). Nëse do të dëshironim që ti ruajmë të gjitha përmbajtjet në indeks, na duhet të përdorim string (String) e jo lexues. Procesi i shtimit të gjithë dokumenteve në indeks realizohet përmes metodës addDocument(). Pastaj, indeksi optimizohet dhe mbyllet. Tani, indeksi jonë u krijua dhe mund të bëjmë kërkimin. Për të nisur kërkimi, nevojitet kerkoString dhe të krijojmë objekt për kërkim. Për të krijuar pyetësorin. E krijojmë QueryParser, i cili do të specifikojë se pikësynimi i kërkimit do të jetë brenda fushës së përmbajtjes. E përdorim AnalizuesiStandard për të analizuar tekstin në kerkoString për termat e kërkimit. E nxjerrim objektin e pyetësorit duke e thirrur metodën parse() në objektin QueryParser, ku si argument është kerkoString. Për të kompletuar të gjitha operacionet e duhura për kërkim, na nevojitet edhe metoda search() e IndexSearch. Pamë që në IndexSearch si argument ishte objekti i pyetësorit. Rezultatet e kërkimit ndërlidhen me objektet e zbuluara (Hits). Pas realizimit të disa përsëritjeve mbi Hits, si dalje fitojmë individualisht secilin objekt të Hits. Përveç numrit të paraqitjes së tekstit, e fitojmë edhe fushën e shtegut duke treguar lokacionin e fajllit. Ne realizuar disa kërkime testuese duke përdorur pyetësorët vijues: qymyr", "miniera", "miniera AND renaturim", "miniera and renaturim", dhe"kalcium OR renaturim". Dalja në konzolë nga ekzekutimi i LuceneKnauf duket kështu:

Kerkimi per 'qymyr' Eshte gjetur: 2 Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum1.txt

Page 25: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

15

Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum2.txt Kerkimi per 'miniera' Eshte gjetur: 1 Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum2.txt Kerkimi per 'miniera AND renaturim' Eshte gjetur: 0 Kerkimi per 'miniera and renaturim' Eshte gjetur: 2 Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum1.txt Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum2.txt\ Kerkimi per 'kalcium OR renaturim' Eshte gjetur: 1 Hit: C:\projekte\workspace\demo\fajlla_ne_Index\gypsum1.txt

Sipas rezultateve të kërkimit, fjalën “qymyr” e kemi të listuar 2 herë ndërsa “miniera” vetëm një herë. Siç mund të vërejmë, përdorimi i fjalës AND dhe and nuk janë identike. Fjala AND rezulton me pyetësor logjik (boolean), duke kërkuar që të dy termat “miniera” dhe “renaturim” të jenë në dokument, që është kushti për Hit. Ndërsa fjala and trajtohet si një fjalë jo relevante dhe rezlutati “miniera” and “renaturim” është i barasvlershëm me kërkimin “miniera renaturim”, duke kthyer dy Hits pasi që “miniera” gjendet në një fajll tekstual dhe “renaturim” gjendet në një tjetër fajll tekstual. Një ekzaminim i STOP_WORDS që është pjesë e AnalizuesiStandard tregon se përdoret klasa ENGLISH_STOP_WORDS që përdoret për injorimin e fjalës and, siç u ilustrua edhe me pyetësorin "miniera and renaturim"

public static final String[] ENGLISH_STOP_WORDS = { "a", "an", "and", "are", "as", "at", "be", "but", "by", "for", "if", "in", "into", "is", "it", "no", "not", "of", "on", "or", "such", "that", "the", "their", "then", "there", "these", "they", "this", "to", "was", "will", "with" };

Pas ekzekutimit dhe testimit të projektit tonë LuceneKnauf, shohim se fajllat e indeksit janë të krijuara në skedarin "Skedari_Index".

Page 26: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

16

Kapitulli 3. Koncepti i Ontologjive

Shumë autorë në punimet e tyre propozojnë definicione të ndryshme për ontologjitë. Termi ontologji fillimisht është përdorur në filozofi për të sqaruar natyrën dhe organizimin e realitetit. Megjithatë, në fushën e nxjerrjes së informacionit, qëllimi fundamental i përdorimit të ontologjive ka të bëjë me definicionin formal të koncepteve dhe termeve për të përshkruar dhe paraqitur fushën e diturive.

3.1 Ontologjia si nocion filozofik

Në filozofi, ontologjia është një fushë e rëndësishme që ka origjinën që para 2000 viteve. Definicionet dhe opinionet e shumta që kanë mbisunduar përgjatë këtyre viteve e kanë vështirësuar përpilimin e definicionit të saktë mbi këtë term. Aristoteli e ka definuar ontologjinë si shkenca e qenies. Ai paraqiti dhjetë kategori bazike për klasifikimin e gjërave: substancën, kualitetin, kuantitetin, relacionin, aktivitetin, pasivitetin, posedimin, ndodhjen, hapësinoren dhe të përkohshmen. Më vonë, filozofi Brentano i organizoi këto kategori si gjethe të një peme, siç është treguar në Figurën 3, ku gjethet emërtohen si terme të marra nga disa punime tjera të Aristotelit [17].

Figurë 3. Pema e Brentanos për kategoritë e Aristotelit

Ky klasifikim u pranua dhe mbeti si i tillë deri në kohën kur filozofi tjetër Imanuel Kant e sfidoi idenë e Aristotelit duke potencuar se esenca e gjërave përcaktohet vetëm nga vetë gjërat. Kanti mendon se pyetja e esencës nuk mund të ndahet nga kushdo që i percepton dhe kupton ato gjëra. Ai i organizoi kategoritë në katër klasa, ku secila përmban në vetë nga tre modele, siç paraqitet në Tabelën 2.

Page 27: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

17

Tabelë 2. Kategoritë e Kantit

Kuantiteti Kualiteti Relacioni Modaliteti Uniteti Realiteti Qenësorja Mundësia Shumica (Pluraliteti) Negacioni Kauzaliteti Ekzistenca Totali Kufizimet Komuniteti Nevoja

Për këtë kategorizim ai bazohet në klasifikimin logjik të gjykimeve. Sipas tij, për shembull, uniteti përkon me gjykimin singular, shumica përkon me gjykime të posaçme dhe totali përkon me gjykimet universale. Ndjenjat që përfshihen kur personi e percepton realiteti radhiten në formë të duhur, së parim në hapësirë dhe kohë, duke vazhduar më tutje sipas kategorive [18].

Gjatë shekullit XX janë bërë edhe studime tjera në këtë lëmi nga shumë filozof tjerë, përfshirë këtu Charles Pierce, Alfred Whitehead, John Sowa etj. Shikuar nga këndvështrimi filozofik, aspektet përshkruese të ontologjive deri më tani mund të definojnë një ontologji të përgjithshme, për dallim nga nevoja e definicioneve të ontologjive të veçanta apo sipas një domeni të veçantë.

3.2 Ontologjitë si përshkrues të diturive Në terminologjinë e informatikës, ontologjia definohet si sistem konceptesh. Edhe në informatikë janë dhënë shumë definicione dhe interpretime mbi ontologjitë. Sipas [2], ontologjia paraqet specifikim formal dhe eksplicit i konceptualizimit të ndarë. Konceptualizimi i referohet një modeli abstrakt të një fenomeni duke i pasur të identifikuara konceptet relevante të këtij fenomeni. Termi eksplicit nënkupton se tipi i koncepteve të përdorura dhe kufizimet gjatë përdorimit të tyre janë të definuar në mënyrë eksplicite. Ndërsa termi formal i referohet faktit se ontologjia duhet të jetë e lexueshme nga makina. Termi ndarë reflekton se ontologjia duhet ti përfshijë dituritë konsensuale të pranuara nga komunitetet e ndryshme.

Edhe konzorciumi W3C jep një definicion të ontologjisë si vijon: Ontologjitë i definojnë termet e përdorura për të përshkruar dhe paraqitur një fushë diturish. Këtu përshihen definicione me koncepte bazike që mund të përdoren nga kompjuteri në një domen dhe relacioni ndërmjet tyre. Në këtë definicion ontologjitë përshkruajnë artefakte me shkallë të ndryshme të strukturës që specifikon përshkrimet për këto koncepte: klasat (gjëra të përgjithshme) në shumë domene të interesit; b) relacionet që mund të ekzistojnë ndërmjet tyre; c) tiparet (ose atributet) që mund ti kenë ato gjëra dhe d) restrikcionet ose kufizimet e koncepteve.

Rëndësinë për ontologjitë si përshkrues të diturive e kategorizojnë mjaft qartë edhe autorët [19] duke dhënë shtatë interpretime të ndryshme:

1. Ontologjia si disiplinë filozofike 2. Ontologjia si një sistem konceptuar jo formal 3. Ontologjitë si vlerësim semantik formal

Page 28: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

18

4. Ontologjia si specifikim i konceptualizimit 5. Ontologjia si paraqitje e sistemit konceptual nëpërmjet teorisë logjike

a. karakterizuar nga tipare formale specifike b. karakterizuar vetëm nga qëllimi i tij specifik

6. Ontologjia si fjalor që përdoret nga teoria logjike 7. Ontologjia si specifikim (meta-nivel) i teorisë logjike

Përveç interpretimit të parë, gjashtë të tjerët e përshkruajnë domethënien e ontologjisë për përshkrimin e diturive. Këto më tutje ndahen në dy nën grupe:

1. Kornizë e veçantë në nivelin semantik (interpretimet 2-3), dhe 2. Ontologjia paramendohet si artefakt konkret në nivelin sintaksor (interpretimet 4-7).

Nën grupi i parë definohet si konceptualizim kurse i dyti si teori ontologjike, që paraqet strukturën semantike që reflekton një sistem i veçantë konceptual si dhe teoria logjike që nevojitet për të shprehur dituritë ontologjike.

3.3 Llojet e Ontologjive Në praktikë, ontologjitë trajtohen si hierarki konceptesh me atribute dhe relacione, që formojnë terminologjinë e duhur për definimin e rrjetave semantike me koncepte dhe instanca të ndërlidhura mes veti, duke përshkruar dituritë e domeneve të veçanta që janë te regjistruara apo ruajtura në bazat e diturive (Knowlede Base). Kjo bazë diturish është e orientuar drejt ruajtjes së sasive të mëdha të diturive.

Ontologjitë mund ti klasifikojmë sipas dy aspekteve, sipas informacionit që përfshijnë, dhe sipas pasurimit të strukturës së brendshme. Sipas informacionit të përfshirë, ontologjitë i ndajmë në gjashtë grupe [18]:

Ontologjitë e nivelit më të lartë – përshkruajnë nivelet më të larta në ontologji me të cilat ndërlidhen të gjitha ontologjitë tjera, qoftë në mënyrë të drejtpërdrejta apo të tërthortë. Në teori, këto ontologji mund të ndahen meqë ato shprehin dituri më bazike, por në praktikë kjo nuk mund të realizohet pasi që nevojitet pajtueshmëri mbi konceptualizimin e qenies.

Ontologjitë e domeneve – që përshkruajnë një domen të caktuar, për shembull: informatike, medicinë, astronomi etj. Natyrisht që sipas nevojës, këto ndërlidhen me ontologjitë e nivelit më të lartë. Edhe pse këto domene mund të përkojnë me njëra tjetrën, përsëri ato mund të mbeten të përdorshme përsëri në një domen të caktuar. Problemi i përkimit të domeneve zgjidhet me anë të ashtuquajturës ontologji me nivel të ndërmjetëm.

Page 29: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

19

Ontologjitë e veprimeve – definojnë ontologjitë e nivelit më të lartë për veprimet ose aktivitetet e përgjithshme.

Ontologjitë e domeneve-veprimeve – definojnë ontologjitë në nivel të domenit sipas veprimeve dhe aktiviteteve në një domen të caktuar.

Ontologjitë e metodave – u japin definicione koncepteve dhe relacioneve relevante të zbatuara për të specifikuar një proces të arsyeshëm për të arritur ose realizuar një veprim të veçantë.

Ontologjitë e aplikimeve – definojnë diturinë mbi nivelim e aplikimit; në parim këto ontologji përpilohen për të përmbushur nevojën për dituri në një aplikim të caktuar.

Edhe [20] ofron një definicion të ngjashëm për ndarjen apo klasifikimin e ontologjive, por në formulimin e tij kemi një definicion më mirë të rregulluar. Siç e kemi paraqitur në Figurën 4, ontologjitë e ndryshme në këtë model janë të ndërlidhura, duke u përdorur si një ontologji e vetme, ose duke u ndërlidhur në një numër të caktuar kombinimesh. Ajo që është e përbashkët me definicionin e parë për ndarjen e ontologjive, është radhitja e njëjtë e tyre.

Figurë 4. Llojet e ontologjive sipas Guarino-s

Në ndarjen e parë të ontologjive, sipas informacionit të përfshirë, ekzistojnë edhe ontologji linguistike, të cilat burimin e kanë në gjuhët natyrore duke përshkruar konstruksionet semantike dhe jo të modelojnë një domen të caktuar. Këto ontologji janë shumë heterogjene dhe zbatim të gjerë gjejnë në gjenerimin dhe procedimin e gjuhëve natyrore

Sa i përket llojit të dytë të ontologjive, pasurimit të strukturës së brendshme, [21] e definojnë kategorizimin si spektër linear, duke nisur nga ontologjitë më të thjeshta deri në ato më komplekse apo më të fuqishme. Ngjashëm, për pasurimin e strukturës interne, [22] bëjnë ndarjen e ontologjive në të lehta dhe të rënda. Ontologjitë e lehta i përfshijnë konceptet, taksonomitë, relacionet ndërmjet koncepteve dhe vetitë që i përshkruajnë konceptet. Ndërsa si ontologji të rënda janë ontologjitë e lehta që i kanë të bashkëngjitura edhe aksiomat dhe kufizimet.

Page 30: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

20

3.4 Gjuhët e Ontologjive Kur kemi të bëjmë me dituri semantike, nevojitet edhe një gjuhë për të paraqitur, koduar dhe menaxhuar ato dituri. Që në vitet e 90-ta të shekullit të kaluar, janë bërë disa orvatje për të krijuar gjuhë të tilla, kryesisht në fushën e Inteligjencës Artificiale. Shumë nga këto gjuhë janë bazuar në logjikë. Ontolingua [2], ka qenë gjuha më e njohur për të paraqitur apo pasqyruar ontologjitë duke mundësuar paraqitjen e koncepteve, taksonomive të koncepteve, relacioneve n-are, funksioneve, aksiomave, instancave dhe procedurave. E njohur është edhe gjuha LOOM [23], e cila u zhvillua në kohën e njëjtë me gjuhën Ontolingua, e që është një gjuhë për paraqitje të përgjithshme të diturive e bazuar kryesisht në logjikën përshkruese dhe rregullave të prodhimit dhe klasifikimit automatik të koncepteve. Për të përshkruar ontologjitë apo dituritë semantike, konzorciumi W3C ka propozuar një model me disa shtresa për teknologjitë e bazuara në ontologji, i paraqitur në Figurën 5. Këtu secila shtresë i shfrytëzon vetitë e shtresës që është më poshtë.

Figurë 5. Gjuhët përshkruese të ontologjive

Shtresat e poshtme iu referohen gjuhëve standarde hipertekstuale të Ueb-it. Madje, ato përfaqësojnë shtyllat e gjuhëve përshkruese ontologjike apo shtyllat për paraqitjen e diturive të bazuara në ontologji. Këto janë:

IRI (Internationalized Resource Identifier), që është një përgjithësim i URI (Uniform Resourc identifier). IRI shërben për identifikim të njësuar të resurseve ontologjike.

Standardet për shkëmbimin e dokumenteve: o XML – bën krijimin e dokumenteve me të dhëna të strukturuara, por duke mos

vendosur kufizime semantike për kuptueshmërinë e këtyre dokumenteve. o XML Namespaces – mënyrë për të referuar në burime të ndryshme në një

dokument.

Page 31: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

21

o XML Schema – gjuhë për kufizimin e strukturës së dokumentit XML.

Shtresat e mesme i përshkruajnë gjuhët standarde për ndërtimin e pyetësorëve: Këto gjuhë nevojiten për të parashtruar pyetësor ndaj diturive semantike të bazuara në ontologji.

RDF (Resource Description Framework) – gjuhë për krijimin e modelit të dhënave për objektet apo resurset si dhe për relacionet ndërmjet tyre. Mundëson paraqitjen e informacionit në formë të grafit.

RDFS (Resource Description Framework Schema) – posedon një vokabular themelor për përshkrimin e vetive dhe klasave të RDF resurseve. Mundëson edhe krijimin e hierarkive me klasa dhe veti.

Web Ontology Language (OWL) – shtojcë e RDFS me më shumë konstrukte për të përshkruar semantikën e formulimeve të RDF. Bazohet në logjikën deskriptive dhe formalisht e përshkruan kuptimin e terminologjisë së përdorur nëpër Ueb dokumente.

SPARQL – gjuhë për formulimin e pyetësorëve. Përdoren për nxjerrjen e informacioneve të veçanta nga grafi i RDF.

Shtresat e mësipërme i përmbajnë teknologjitë semantike të bazuara në ontologji që nuk janë akoma të standardizuara ose idetë e ardhshme që duhet të implementohen, ato janë:

RIF – mbështetje plotësuese për rregullat. Si shembull mund të jetë lejimi i përshkrimit të relacioneve që nuk mund të përshkruhen në mënyrë të drejtpërdrejtë me gjuhën OWL.

Cryptography – nevojitet për sigurimin dhe vërtetimin se formulimet RDF vijnë nga burime të besueshme. Mund të aplikohen nënshkrime digjitale të formulimeve të RDF.

Trust – besimi se formulimi i nxjerrë mund të mbështetet duke u vërtetuar që vjen nga burim i besueshëm.

User Interface – shtresa e fundit që iu lejon përdoruesve ti përdorin aplikacionet semantike të bazuara në ontologji me qëllim të shfrytëzimit të diturive semantike.

3.4.1 RDF dhe RDFS Konceptet bazike të RDF janë:

Resurset: mund ti paramendojmë resurset si objekte; gjëra për të cilat mund të flasim. Resurse mund të jenë autorët, librat, botuesit, vendet, njerëzit, pyetësorët etj. Çdo resurs ka një URI ose një ueb adresë.

Vetitë/Tiparet: këto janë lloje të veçanta të resurseve dhe përshkruajnë relacionin ndërmjet resurseve, për shembull: ”mosha”, ”titulli”, etj. Edhe tiparet në RDF identifikohen nga URI.

Formulimet: i pohojnë tiparet e resurseve. Një formulim përbëhet nga treshja: objekti, atributi (vetia) dhe vlera. Vlera mund të jenë edhe resurset. Një shembull i formulimit do të ishte:

Page 32: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

22

o Fisnik Dalipi është pronar i ueb sajtit http://fisnikd.com

Mënyra më e thjeshtë për ta interpretuar formulimin është duke përdorur definicionin dhe duke pasur në konsideratë treshen:

(“Fisnik Dalipi”, “http://domenijone.org/pronar_sajti”, “http://fisnikd.com”) Treshen (x, P, y) mund ta marrim edhe si formulë logjike P(x, y), ku predikati binar P tregon për relacionin e objektit x në objektin y. Ashtu siç mund të shohim nga treshja, tipari “pronar_sajti” dhe objekti tjetër “http://fisnikd.com” janë të identifikuara nga URL, kurse objekti tjetër “Fisnik Dalipi” identifikohet vetëm si string.

Mënyrë tjetër për interpretim është edhe ajo grafike. Grafikisht formulimin e sipërm e paraqesim kështu:

Figurë 6. Paraqitje grafike e treshes: objekt, atribut, vlerë

Ky paraqet një lloj grafi i quajtur rrjetë semantik në fushën e inteligjencës artificiale. Duke u nisur nga definicioni i sipërm ku thamë se vlera e formulimit mund të jetë një resurs, ky mund të ndërlidhet edhe me resurse tjera. Le ti konsiderojmë treshet e formulimeve vijuese:

( “www.fisnikd.com”, “http://www.domenijone.org/pronar_sajti”, “Fisnik Dalipi”)

( “Fisnik Dalipi”, http://www.domenijone.org/telefoni, “1234 567”)

( “Fisnik Dalipi”, http://www.domenijone/user, “http://fisnikd.com/Erdi/programim”)

( “http://fisnikd.com/Erdi/programim”, http://www.domenijone.org/pronar_sajti, “Erdi Dalipi”)

Grafikisht formulimet e mësipërme do të dukeshin:

Page 33: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

23

Figurë 6a. Rrjeti semantik

Nga këndvështrimi i gjuhës XML, një dokument RDF paraqitet me elementin apo tagun rdf:RDF. Ky element përmban disa përshkrime (descriptions), të cilat e përdorin tagun rdf:Description. Çdo përshkrim prodhon një formulim për resursin i cili identifikohet me njërën nga këtro tre mënyra:

atributin about, që referon në një resurs ekzistencial atributin ID, për të krijuar një resurs të ri pa emër, për të krijuar një resurs anonim.

Sintaksa e RDF e bazuar në RDF për formulimin e parë do të ishte si vijon:

<?xml version="1.0" encoding="UTF-16"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:mydomain="http://www.domenijone.org/my-rdf-ns"> <rdf:Description rdf:about="http://fisnikd.com"> <domenijone:pronar_sajti> Fisnik Dalipi </domenijone:pronar_sajti> </rdf:Description> </rdf:RDF>

Për dallim nga RDF, RDFS apo Resourse Description Framework Schema përdoret për të definuar hierarkitë e klasave dhe për të specifikuar tiparet apo vetitë e tyre si dhe relacionet ndërmjet tyre. Po japim një shembull ku i kemi të integruara të dyja shtresat, RDF dhe RDFS.

Page 34: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

24

Figurë 7. Shtresat RDF dhe RDFS

Kodi i gjeneruar sipas modelit në Figurën 3.5 do të jetë si vijon:

<?xml version=’1.0’ encoding=’UTF-16’?> <!DOCTYPE rdf:RDF [ <!ENTITY rdf ‘http://w3.org/1999/22/02-rdf-syntax-ns#’> <!ENTITY a ‘http://protege.stanford.edu/system#’> <!ENTITY kb ‘http://protege.stanford.edu/kb#’> <!ENTITY rdfs ‘http://w3.org/2000/01/rdf-schema#’> ]> <rdf: RDF xmlns:rdf=”&rdf;” xmlns:a=”&a;” xmlns:a=”&kb;” xmlns:a=”&rdfs;” > <rdfs: Class rdf: about=”&kb;StafAkademik” rdfs:label=”StafAkadmik “> <rdfs:SubClassOf rdf: resource=”&rdfs;Resource”/> </rdfs: Class> <rdfs: Class rdf: about=”&kb;WebSajt” rdfs:label=”WebSajt“> <rdfs:SubClassOf rdf: resource=”&rdfs;Resource”/> </rdfs: Class> <rdfs: Class rdf: about=”&kb;AsistentProfesor” rdfs:label=”AsistentProfesor“> <rdfs:SubClassOf rdf: resource=”&kb;StafAkademik”/> </rdfs: Class> <rdfs: Class rdf: about=”&kb;Elearning” rdfs:label=”Elearning“>

Page 35: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

25

<rdfs:SubClassOf rdf: resource=”&kb;WebSajt”/> </rdfs: Class> <rdf: Property rdf: about=”&kb;ka_autor” a:minCardinality=”1” rdfs:label=”ka_autor”> <rdfs:range rdf:resource=”&kb;StafAkademik”/> < rdfs:domain rdf:resource=”&kb;WebSajt”/> </rdf: Property> </rdf: RDF>

3.4.2 Gjuha OWL Gjuhët e ontologjive iu mundësojnë përdoruesve që të shkruajnë konceptualizime eksplicite dhe formale në domene të caktuara. Por, për tu arritur kjo nevojitet të kemi: sintaksë të definuar, semantikë të definuar, fuqi të mjaftueshme për tu shprehur dhe përshtatje të shprehurit. Gjuha OWL e lehtëson më shumë aspektin e interpretimit nga ana e makinës të përmbajtjeve të ueb-it në krahasim me RDF dhe RDFS, duke ofruar vokabular shtesë me semantikën formale: relacione ndërmjet klasave, lloje të ndryshme të vetive (ObjectProperty dhe DatatypeProperty), karakteristika të vetive, numërim të klasave, etj.

Gjuha OWL ndahet në tre nën-gjuhë të ndryshme, ku secila ka për qëllim ti plotësojë aspektet e ndryshme të kërkesave të lartpërmendura. Ato janë: OWL Lite, OWL DL dhe OWL Full.

OWL Lite – është e lehtë për të përdorur dhe implementuar. Mbështet hierarkinë e klasifikimit dhe ka kufizime sa i përket kardinalitetit, duke lejuar vetëm vlerat 0 ose 1.

OWL DL – është nën-grup i OWL Full dhe i kufizon aspektet e shfrytëzimit të konstruktorëve nga OWL dhe RDF. Përparësi ka sepse e mbështet në maksimum teknikën e të shprehurit duke garantuar se të gjitha veprimet do të llogariten në një kohë të fundme. Si mangësi, kjo gjuhë e ka humbjen e kompatibilitetit me RDF, duke bërë që në disa raste dokumentet RDF të mbindërtohen kurse në raste tjera të kufizohen. Në OWL DL klasa nuk mund të jetë individuale ose veti dhe vetia nuk mund të jetë individuale apo klasë.

OWL Full – është krejtësisht në pajtueshmëri me RDF, edhe nga aspekti sintaksor edhe nga ai semantik. Kjo gjuhë e mbështet maksimalisht të shprehurit dhe lirinë sintaksore të RDF por duke mos garantuar se të gjitha veprimet do të përfundojnë në kohë fundme.

Për shembullin tonë të paraqitur në Figurën 3.5, me ndihmën e aplikacionit Protege5e gjenerojmë sintaksën përkatëse të OWL.

5 http://protege.stanford.edu/download/registered.html

Page 36: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

26

<?xml version=”1.0”> <rdf:RDF xmlns:owl ="http://www.w3.org/2002/07/owl#"

xmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"

xmlns:xsd ="http://www.w3.org/2001/XLMSchema#">

<rdfs:comment>Shembulli me gjuhën OWL</rdfs:comment>

<owl:Ontology rdf:about=""/>

<owl:Class rdf:ID="StafAkademik"/>

<owl:Class rdf:ID="Websajt"/>

<owl:Class>

<owl:unionOf rdf:parseType="Collection">

<owl:Class rdf:about="Websajt"/>

<owl:Class rdf:abort="StafAkademik"/>

</owl:unionOf>

</owl:Class>

<owl:Class rdf:ID="Elearning"/>

<rdfs:subClassof rdf:resource=”WebSajt”/>

</owl:Class>

<owl:Class rdf:ID="AsistentProfesor"/>

<rdfs:subClassof rdf:resource=”StafAkademik”/>

</owl:Class>

<owl:ObjectProperty rdf:ID=”ka_autor”>

<rdfs:range rdf:resource=”#StafAkademik”/>

<rdf:type rdf:resource=”http://www.w3.org/2002/07/owl#FunctionalProperty”/>

<rdf:domain rdf:resource=”#WebSajt”/>

Page 37: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

27

</owl:ObjectProperty>

<AsistentProfesor rdf:ID=”Fisnik_Dalipi”/>

<Elearning rdf:ID=”fisnikd.com”/>

</rdf:RDF>

3.4.3 Gjuha për pyetësor – SPARQL Gjuhët ontologjike për pyetësor përdoren për të shprehur kërkime komplekse në grafin ontologjik nëpërmjet formulimeve sintaksore të thjeshta. Para se të standardizohej gjuha ontologjike SPARQL për formulimin e pyetësorëve, kanë ekzistuar disa gjuhë tjera, ndër ato ka qenë edhe gjuha RDQL(RDF Query Language) e zhvilluar nga Hewlett-Packard. Si mangësi e kësaj gjuhe ishte se nëpërmjet saj mund të nxirreshin informacione që përmbahen në ontologji por duke mos pasur mundësi për të nxjerrë një numër arbitrar të vlerave nga pyetësori. Si rrjedhim, W3C e zhvilloi gjuhën SPARQL si gjuhë standarde ontologjike për pyetësor. Tashmë me këtë gjuhë bëhet e mundur edhe mundësia e krijimit të modeleve RDF nga pyetësori. Për ta ilustruar një kërkim me pyetësorin SPARQL nga shembulli jonë, kemi:

PREFIX kb: <http://protege.stanford.edu/kb#> SELECT ?elearning ?asistentprofesor WHERE { ?elearning kb:ka_autor ?asistentprofesor}

Pyetësori e pyet ontologjinë për të gjitha sajtet për mësim elektronik dhe autorët e tyre përkatës, ku ?elearning i paraqet të gjitha instancat e elearning në ontologji, ndërsa ?asistentprofesor i paraqet të gjithë autorët e mundshëm.

Page 38: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

28

Kapitulli 4. Teknologjitë për kërkim semantik Si sfidë kryesore e sistemeve informative të sotme mbetet që përdoruesi ta pranojë nga sistemi informacionin e duhur në kohën e duhur. Me rritjen e numrit të burimeve të dhënave, nevojiten teknika për kërkim që janë më inteligjente, duke u fokusuar në përmbajtjen dhe semantikën e informacionit. Përdorimi i ontologjive në sistemet për nxjerrje të informacionit gjithnjë e më shumë nga hulumtuesit e fushës shihet si mundësi lehtësuese dhe praktike për të sfiduar problemet me burimet e shpërndara dhe heterogjene të dhënave. Këto burime përmbajnë sasi të mëdha të dhënash të organizuara në struktura të ndryshme semantike. Si sfida më serioze mund ti përmendim disa: dizajnimi i një sistemi për integrimin e të dhënave, ndryshimet në mekanizmin e qasjes, zgjerimi semantik i pyetësorit, rangimi semantik, aspektet e natyrës heterogjene të semantikës në raport me modelet e të dhënave etj.

Gjatë procesit të ndërtimit të sistemeve për kërkim të informacionit të bazuara në ontologji, krahasuar me sistemet tradicionale, nevojitet një rritje e përfaqësimit të kuptimeve apo semantikës duke aplikuar abstraksion konceptual më eksplicit.

4.1 Modelet e sistemeve për kërkim të bazuara në ontologji

Si karakteristika të përbashkëta të modeleve për kërkim të bazuara në ontologji paraqiten kërkimi për ontologjitë online, nxjerrja e fakteve nga ontologjitë, përgjigje për pyetësorin, filtrimi dhe rangimi i informacioneve të nxjerra etj. Të gjitha këto procese mundësohen nga veglat e këtyre sistemeve: shfletimi semantik me shënime (ang. annotations) që gjenerohen automatikisht, zgjerimi semantik i pyetësorit, rangimi semantik, puna me një apo me disa ontologji. Varësisht nga këto atribute të përmendura, disa autorë kanë tentuar që ti klasifikojnë këto sisteme [4] duke i dalluar sipas katër vetive kyçe të meta të dhënave në këto sisteme: mjedisi i kërkimit, tipi i pyetësorit, problemet e brendshme të sistemit, dimensionet e kërkimit dhe të iteracionit. Duke u bazuar në analizat e shumta të literaturës, po japim një ndarje nëpër kategori të sistemeve semantike.

Page 39: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

29

Figurë 8. Kategorizimi i sistemeve semantike për kërkim

Ky kategorizim e merr për bazë edhe përdorimin e teknologjisë semantike të përdorur si dhe sasinë e elementeve të përdorura të ontologjive (hierarkia ontologjike, vetitë, instancat etj.).

Kërkimi – i përfshin të gjitha fazat paraprake si dhe mënyrën e organizimit të dhënave. Këtu bëjnë pjesë indeksimi, procedimi i pyetësorit, rangimi. Dokumentet trajtohen si instanca ose janë të ngarkuara duke përdorur instanca të ontologjive.

Arkitektura – mund të jetë e ndryshme, varësisht nëse sistemi është i pavarur nga ueb-i ose implementohet në një domen të veçantë, siç mund të jetë intraneti, ose shfrytëzon resurse të ueb-it.

Inputi – ka të bëjë me ndërfaqen që e shfrytëzon përdoruesi për të specifikuar pyetësorin. Pyetësori mund të jetë i natyrave të ndyshme: fjalë kyçe, formulime të gjuhëve natyrore, ontologji e paraqitur grafikisht etj.

Struktura e diturive – e gjithë baza e diturive që mund të jetë e organizuar në forma të ndryshme. Si resurse të kësaj baze mund të përfshihen taksonomitë, fjalorët, aksiomat ontologjike etj.

Kodimi i ontologjive – për këtë qëllim mund të përdoren gjuhët standarde OWL, RDFS ose gjuhë të pa standardizuara për hulumtime akademike.

Mjedisi i veprimit – mund të jetë i lokalizuar (kërkim në sisteme të pavarura nga ueb-i, domene të veçanta) ose i fokusuar në ueb.

Qëllimi i kërkimit – varësisht nga nevoja e përdoruesit mund të jetë për nxjerrje të dhënave, informacioneve, ontologjive. Këtu përfshihet edhe spektri i sasisë së dëshiruar së të dhënave për ti nxjerrë nga sistemi.

Kërkimi semantik

Kërkimi

Arkitektura

Inputi

Struktura e diturive

Kodimi i ontologjive

Mjedisi i veprimit

Qëllimi i kërkimit

Page 40: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

30

4.2 Logjika funksionale e sistemeve për kërkim semantik

Kërkimi semantik është një koncept që është në zhvillim e sipër dhe teknologjitë aktuale për kërkim të bazuar në ontologji janë shumë hipotetike dhe akoma mungon një kornizë e mirë-përshtatur apo formuluar për kërkim ontologjik. Disa përpjeke janë bërë nga [24], por ato nuk arrijnë ta adresojnë përdorimin potencial të kërkimit ontologjik përtej tërësisë së të dhënave në nivel organizate. Propozimet e tyre modeluese kanë vështirësi për tu përballur me natyrën heterogjene të ueb-it dhe janë të kufizuara në një bashkësi të para definuar me ontologji.

Si karakteristikë dalluese e modeleve semantike paraqitet natyra heterogjene dhe shumëdimensionale e resurseve si dhe aplikimi i mënyrave më komplekse të paraqitjes apo formulimit të pyetësorit. Në Figurën 9 kemi paraqitur një model të përgjithshëm ku janë përfshirë të gjitha fazat e nevojshme për kërkim semantik, duke u nisur nga logjika e adaptimit të sistemeve klasike për kërkim të bazuar në fjalët kyçe.

Në modelin klasik të nxjerrjes së informacionit dalluam katër procese: indeksimin, procedimin e pyetësorit, kërkimin dhe rangimin. Hapi i rangimit ka për qëllim të paracaktojë sa janë të krahasueshëm dokumentet relevante me njëri tjetrin dhe kështu si dalje të kthejë dokumente sipas rëndësisë por në formë rënëse. Këto procese janë prezente edhe në sistemet semantike. Megjithatë, këtu pyetësori parashtrohet me anë të gjuhës ontologjike SPARQL dhe ontologjitë përdoren si resurse të jashtme si dhe për indeksim dhe procedim të pyetësorit.

Figurë 9. Procesi i sistemit për kërkim semantik

Page 41: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

31

Procesi i indeksimit është identik me procesin semantik të shënimit. Në vend të krijimit të indeksit të përmbysur ku fjalët kyçe janë në korrelacion me dokumentet ku ato shfaqen, në këtë rast indeksi i përmbysur i përmban elementet semantike (kuptimet) që janë në korrelacion me dokumentet ku ato shfaqen. Relacioni ose korrelacioni ndërmjet elementeve semantike dhe dokumenteve paraqet funksionin e quajtur shënim (annotation). Si veti që përfshihen te shënimet janë instanca dhe dokumenti. Shënimet gjithashtu duhet të modifikohen që të jenë të përshtatshme për shprehjet konceptuale. Ky ndryshim i përshkrimeve është para së gjithash një kalim nga paraqitjet leksikore në paraqitje semantike. Por kjo njëkohësisht e rrit edhe shkallën e dy kuptueshmërisë së shprehjeve si dhe unionin e koncepteve në një koncept më kompleks. Si sfidë më e rëndësishme që paraqitet gjatë përdorimit të ontologjive për kërkim është edhe përmirësimi i kërkimit duke përdorur dituri mbi relacionet ndërmjet koncepteve në ontologji. Dituritë apo analizat semantike duhet ti njohin konceptet në dokument dhe ti pasqyrojnë ato në ontologji me qëllim të nxjerrjes së kuptimit të plotë dhe shmangies së dy kuptueshmërisë. Por kjo arrihet vetëm duke e avancuar sistemin ashtu që si pyetësor të përdoren edhe formulime nga gjuhët natyrore. Si analizë e thjeshtë semantike mund të përdoret ndarja e klasave të fjalëve në emra, folje, mbiemra etj, dhe pastaj ato të pasqyrohen në otologji. Një analizë semantike ideale do të ishte njohja e diturive të ndërlidhura, siç mund të jenë, frazat e fjalëve, frazat e foljeve, fjalitë, etj.

4.3 Procesimi i pyetësorit

Gjuha e standardizuar e procedimit të pyetësorit në modelet semantike është SPARQL. Modeli i si hyrje do të marrë një pyetësor formal në SPARQL i cili ekzekutohet kundër bazës së diturive (Knowlege Base, KB) duke kthyer një listë me instanca regjistrimesh (instance tuples) që e plotësojnë atë që kërkohet me pyetësorin. Pasi që përdoruesi e formulon pyetësorin, ai më tutje mund të procedohet nga sistemet e sipërpërmendura ontologjike (psh. AquaLog 6 , Querix 7 , QASYO8, Jena9, Sesame10, etj.). Pyetësori SPARQL që përmbahet nga ky model mund të shpreh gjendje që mund të jenë instanca të domenit ontologjik, vetitë e dokumentit (si psh. Autori, data, publikuesi etj.), ose vlera klasifikimi. Si algoritëm rangimi mund të përdoret modeli klasik me

6 V. Lopez, M. Pasin, and Enrico Motta, “AquaLog: An Ontology-Portable Question Answering System for the Semantic Web,” Lecture Notes in Computer Science, Vol. 3532, Springer, Berlin, pp. 546-562, 2005.

7 E. Kaufmann, A. Bernstein, and R. Zumstein., “Querix: A natural language interface to query ontologies based on clarification dialogs,” In proceeding 5th International Semantic Web Conference (ISWC 2006), pp 980–981, 2006.

8 Abdullah M. Moussa and Rehab F. Abdel-Kader. QASYO: A Question Answering System for YAGO Ontology. International Journal of Database Theory and Application Vol. 4, No. 2, June, 2011

9 http://jena.sourceforge.net

10 http://www.openrdf.org

Page 42: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

32

hapësirë vektoriale 11. Sipas këtij algoritmi, fjalët kyçe të përfshira në dokument shënohen me pesha (weights) duke lënë të kuptohet se disa fjalë janë më të mira për diferencimin e dokumenteve sesa fjalët e tjera. Në të njëjtën mënyrë, në këtë model shënimet (annotations) mund të përdoren për ndarjen e peshave duke reflektuar relevancën e instancës. Peshat (ose ngarkesat) mund të njehsohen në mënyrë automatike edhe duke e adaptuar modelin TF-IDF që bazohet në frekuencën e rastisjes të instancave në secilin dokument. Më saktësisht, pesha dx e një instance x për dokumentin d njehsohet si:

ku freqx,d është numri i rastisjeve në d i fjalëve kyçe të ndërlidhura me x, maxy. freqy,d është frekuenca e instancave që përsëriten më shpesh në d, kurse nx është numri i dokumenteve të shënuar me x, dhe D paraqet tërësinë e të gjithë dokumenteve në hapësirën e kërkimit.

4.4 Kërkimi dhe rangimi Ekzekutimi i pyetësorit kthen një tërësi regjistrimesh që e plotësojnë kushtin e pyetësorit. Të gjitha dokumentet që korrespondojnë me regjistrimin e instancës menaxhohen nga moduli i kërkimit. Nëse regjistrimet janë të përbëra vetëm nga instanca që janë pjesë e koncepteve të domenit, nxjerrësi i ndjek të gjitha lidhjet e shënimit dalës nga instanca, dhe i grumbullon të gjitha dokumentet në depo që janë të shënuara me instancat. Në rastin kur instancat e dokumenteve shfaqen si pjesë e regjistrimeve atëherë përsëritet e njëjta procedurë, por do të kufizohet vetëm me dokumentet që shfaqen në tërësinë e rezultateve.

Pasi të formohet lista e dokumenteve, makina e kërkimit do të njehsojë vlerën e ngjashmërisë semantike ndërmjet pyetësorit dhe secilit dokument, si vijon:

sim(d, q) =d ∙ q

|d| ∙ |q|

ku q ∈Θ është pyetësor në SPARQL, dhe d∈Δ paraqet secilin dokument në hapësirën e kërkimit. Simboli Θ është tërësia e të gjitha klasave dhe instancave në ontologji, dhe Δ paraqet tërësinë e të gjitha dokumenteve që shfaqen në hapësirën e kërkimit. Për shkak se është tashmë i ndërtuar, |q| është zakonisht shumë i madh, dhe vlerat e (d,q) do të jenë shumë të vogla.

11 Salton, G. (1986). Introduction to Modern Information Retrieval. New York, NY, USA: McGraw-Hill

Page 43: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

33

4.5 Kërkimi semantik në Ueb-in semantik

Zhvillimi i sistemeve për kërkim në mjediset e shpërndara dhe heterogjene , siç është ueb-i si tërësi, i cili përbëhet nga një numër i pakufizuar domenesh, akoma nuk ka arritur shkallën e pjekurisë dhe qëndrueshmërisë për të formuar një model të standardizuar për këtë qëllim. Megjithatë, sipas konsultimeve dhe analizave të literaturës, mund të paraqesim një model të gjeneralizuar të kërkimeve semantike në ueb-in semantik, duke e apostrofuar konceptin e heterogjenizimit. Në arkitekturën e propozuar kemi reflektuar konceptin e heterogjenizimit duke supozuar në sasi të mëdha të meta të dhënave semantike duke mos patur një interval të paradefinuar të domeneve. Në këto modele elementi i jashtëm nuk është vetëm një bazë diturish e vetme por përfshin edhe informacione online të ueb-it semantik.

Figurë 10. Korniza e sistemit për kërkim semantik në mjedis heterogjen

Ky model nuk kërkon që përdoruesi të dijë një gjuhë pyetësorësh me qëllim special, por sistemi pret që pyetësorët të shprehen në gjuhë natyrale. Një aspekt tjetër relevant është se tërësia e informacioneve të pastrukturuara nuk nevojitet të përshtatet në fragmente konvencionale të njohurisë ontologjike. Për t’ju përgjigjur pyetësorëve, sistemi mund të përdor të dhëna semantike që janë në dispozicion dhe informacione tjera nga ueb faqe standarde. Kur kemi të bëjmë me sasi kaq të mëdha të informacioneve semantike, na nevojitet një portë dalëse e cila do ti para-procedojë, grumbulloj, deponoj dhe t’ju qaset informacioneve të shpërndara semantike në ueb. Një nga këto porta semantike që aktualisht mund të përdoren për këtë qëllim janë Watson12 dhe Swoogle13. Pasi që përdoruesi ta formuloj pyetësorin, ai pyetësor në vijim mund do të procedohet 12 D'Aquin, M., Gridinoc, L., Sabou, M., Angeletou, S., & Motta, E. (2007). Characterizing Knowledge on the Semantic Web with Watson. 5th International EON Workshop at International Semantic Web Conference (ISWC'07). Busan, Korea

13 Ding, L., Finin, T., Joshi, A., Pan, R., & Cost, S. (2004). Swoogle: A Search and Metadata Engine for the Semantic Web. 13th Conference on Information and Knowledge Management (CIKM 2004), (pp. 625-659). Washington, DC, USA

Page 44: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

34

nga secili sistem i bazuar në ontologji që mundëson qasje në ontologjitë online, dhe që i përkthen pyetësorët nga gjuhët gjenerike në SPARQL. Pas kthimit të fragmenteve të diturive relevante ontologjike si një përgjigje, sistemi do të mund ta ekzekutojë hapin e dytë i cili ka të bëjë me nxjerrjen dhe rangimin, sipas probabilitetit, dokumentet që i përmbajnë informacionet e kërkuara. Procesi i rangimit mund të aplikojë koncepe të algoritmit të modelit me hapësirë vektoriale.

Page 45: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

35

Kapitulli 5. Aplikimi dhe integrimi i ontologjive në mësimin elektronik

Teknologjitë e Informacionit ofrojnë alternativa të shumta edhe në fushën e arsimit dhe shumë aplikacione softuerike po zhvillohen në këtë fushë. Aplikacionet e këtilla, që përfshijnë edhe mundësinë e aplikimit të ueb-it semantik, synojnë gjetjen e metodave përkatëse softuerike për përshtatjen e teknikave të mësimit me nevojat e trendeve bashkëkohore mësimore, që karakterizohen me aspekte të bashkëveprimit të mësuarit me të mësuarit elektronik. Edhe pse, sistemi arsimor në vendin tonë në përgjithësi është në faza reformuese dhe i nënshtrohet vazhdimisht aplikimit dhe përdorimit inovativ të teknologjisë së informacionit, shpesh herë përmbajtjet mësimore elektronike janë të pa strukturuara dhe në formate të ndryshme. Po ashtu, akoma nuk janë definuar qartë metodat e aplikimit të mësimit dhe testimit elektronik. Duke u nisur nga këto të dhëna, ne do të propozojmë një zgjidhje të mundshme të këtij problemi duke përfshirë aplikimin e mësimit dhe testimit elektronik (E-learning), mbi bazën e të cilit do të analizojmë dhe paraqesim mundësinë e zgjerimit të funksionalitetit të tij për të mbështetur integrimin e ontologjive në mjedisin e E-learning.

5.1 Mbi mësimin elektronik apo E-learning

Të mësuarit elektronik (E-learning) i referohet përdorimit të qëllimshëm të informacioneve në rrjet dhe të teknologjisë së komunikimit në mësimdhënie dhe të nxënit. Një numër i madh i termave të tjerë janë përdorur gjithashtu për të përshkruar këtë mënyrë të mësimdhënies dhe të nxënit. Ato përfshijnë të mësuarit online, të mësuarit virtual, mësimi i shpërndarë (distributed learning), të mësuarit në rrjet dhe të mësuarit e bazuar në ueb (web-based learning). Të gjitha i referohen procesit edukativ që të shfrytëzojë teknologjinë e informacionit dhe të komunikimit për të ndërmjetësuar të mësuarit asinkron si dhe sinkron dhe aktivitetevet e mësimdhënies. Në shqyrtim më të afërt, megjithatë, do të jetë e qartë se këto etiketa u referohen proceseve të ndryshme arsimore dhe si të tilla ato nuk mund të përdoren si sinonime me termin e-learning.

Termi e-learning përfshin shumë më tepër se të mësuarit online, të mësuarit virtual, të mësuarit e shpërndarë (distributed learning), të mësuarit në rrjet ose të bazuar në veb. Pasi shkronja "e" në e-learning qëndron për fjalën "elektronik", mësimi elektronik (e-learning) do të përfshijë të gjitha aktivitetet arsimore, të cilat janë kryer nga individë apo grupe duke punuar online apo offline, në mënyrë sinkrone ose asinkrone nëpërmjet kompjuterëve të cilët janë në rrjet ose jo, si dhe nëpërmjet pajisjeve tjera elektronike [25]. Këto llojë të ndryshme apo modalitete të veprimtarive të e-learning janë të përfaqësuara në tabelën 3.

Page 46: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

36

Tabelë 3. Modele të mësuarit

Individualized self-paced e-learning online Individualized self-paced e-learning offline Group-based e-learning synchronously Group-based e-learning asynchronously

Më poshtë po japim definicionet e secilit model të mësuarit.

Individualized self-paced e-learning online Mësimi elektronik individual i vetë-përcaktuar u referohet situatave ku një student individual i përdor burimet e të mësuarit si bazë të dhënash ose përmbajtjen e kursit online nëpërmjet Intranetit ose internetit. Një shembull tipik i këtij modeli është kur studenti studion vetëm ose kryen disa hulumtime në internet ose në rrjet lokal.

Individualized self-paced e-learning offline u referohet situatave ku një student individual i përdor burimet e të mësuarit si bazë të dhënash ose paketë të të mësuarit me ndihmën e kompjuterit offline (dmth kur nuk janë të lidhur në Intranet ose në internet). Një shembull i këtij modeli është kur studenti punon vetëm jashtë hard diskut, CD ose DVD.

Group-based e-learning synchronously u referohet situatave ku grupe të studentve janë duke punuar së bashku në kohë reale nëpërmjet Intranetit ose internetit. Kjo mund të përfshijë konferenca të bazuara në tekst, si dhe audio -video konferencat. Shembuj të këtij modeli përfshijnë studentit e angazhuar në chat në një kohë reale ose një audio-video-konferencë.

Group-based e-learning asynchronously u referohet situatave ku grupe të studentëve janë duke punuar në Intranet ose në internet ku shkëmbimet midis pjesëmarrësve ndodhin me një vonesë kohore (pra, jo në kohë reale). Shembuj tipikë për këtë lloj të aktivitetit përfshijnë on-line diskutimet nëpërmjet listave të postimeve elektronike dhe konferencave tekstuale brenda sistemit menaxhues të mësuarit [26].

5.2 Menaxhimi i diturive

Në ekonominë e sotme, njohuritë dhe informacionet janë faktorët më të rëndësishëm në suksesin afatgjatë të një individi dhe të një organizate. Njohuritë dhe menaxhimi e njohurive kanë dalë si një komponent jetike për shumë organizata. Në fakt, njohuria së shpejti mund të jetë burimi i vetëm konkurues për një organizatë.

Menaxhimi i njohurive mbështet krijimin, arkivimin, dhe shkëmbimin e informacioneve me vlerë, duke depërtuar brenda dhe ndërmjet komuniteteve të njerëzve dhe të organizatave me interesa dhe nevoja të ngjashme. Shumë sisteme të menaxhimit të njohurive janë të ndihmuara nga teknologjitë e internetit. Megjithatë, pavarësisht nga nevoja për teknologji, menaxhimi i njohurive më shumë është i lidhur me njerëzit, marrëdhëniet e punës dhe komunikimin. Puna në

Page 47: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

37

grupe, bashkëpunimi dhe format e tjera të ndërveprimit person-to-person janë thelbësore për të krijuar një ekuilibër të drejtë në mes vetë informacionit dhe veprimeve të njerëzve.

Jennex [27] e definon menaxhimin e njohurive (KM) si praktikë e zbatimit të njohurive në mënyrë selektive nga përvojat e mëparshme të vendim-marrjes në aktivitetet e tanishme dhe të ardhshme të vendim-marrjes me qëllim të përmirësimit të efikasitetit të organizatës. Gjithashtu, Jennex e shikon menaxhimin e njohurive si një sistem i krijuar për të lehtësuar kapjen, ruajtjen, korigjimin dhe ripërdorimin e njohurive. Ky përceptim i menaxhimit të njohurive dhe sistemeve të menaxhimit të njohurive është se ata kombinojnë zgjidhjet organizative dhe teknike për të arritur qëllimet e ruajtjes dhe ripërdorimit të njohurive në mënyrë që përfundimisht të përmirësojnë marrjen e vendimeve organizative dhe individuale. Sipas [28] Churchman (1979) kjo është një pikëpamje e menaxhimit të njohurive që i lejon sistemet e menaxhimit të njohurive të marrin çfarëdo forme të nevojshme për arritjen e këtyre qëllimeve. Për disa organizata, kjo do të thotë se sistemi i menaxhimit të njohurive në thelb është një dokument i sistemit të menaxhimit. Megjithatë, si një komunitet, ne nuk dëshirojmë që menaxhimi i njohurive të perceptohet kryesisht si një teknologji e menaxhimit të dokumenteve. Gjithashtu, në disa organizata, menaxhimi i njohurive mund të përdoret vetëm për të menaxhuar njohuritë e pastrukturuara. Kjo mund të përmbush nevojat e organizatës, por përsëri, komuniteti menaxhimit të njohurive nuk e pranon idenë që menaxhimi i njohurive të merret vetëm me njohuri të pastrukturuara. Së fundi, Alavi dhe Leidner [29], në punën e tyre themelore erdhën në përfundim se menaxhimi i njohurive përfshin procese të dallueshme por të ndërvarura të krijimit të njohurive, ruajtjen dhe rikthimin e njohurive, transferimin e njohurive dhe aplikimin e njohurive

Është e rëndësishme të theksohet se asnjë nga këto përkufizime të menaxhimit të njohurive nuk është tërësisht teknike në natyrë. Ata të gjithë janë përfshijnë përkrahje të sistemit informativ (IS), por ata gjithashtu përfshijnë konsideratat organizative, si dhe kanë një ndikim mbi produktivitetin dhe efektivitetin organizativ. Kjo është e rëndësishme, sepse shumë ekspertë e konsiderojnë menaxhimin e njohurive si një formë e sistemit informativ (IS). Megjithatë, përderisa sistemi informativ (IS) është komponent e rëndësishme, në mënyrë që menaxhimi i njohurive të jetë efektiv si një mjet ndryshimi apo transformimi, menaxhimi i njohurive duhet të përfshijë më shumë; kërkon mbështetje menaxhuese dhe kulturë organizative.

Një kuptim më i mirë i menaxhimit të njohurive (Knowledge Management) është fituar duke përfshirë konceptet e memories organizative (OM) dhe të mësuarit organizativ (OL). Jennex dhe Olfman [30] kanë konstatuar se të tri fushat janë të lidhura dhe kanë një ndikim në efikasitetin organizativ. Efikasiteti organizativ tregon se sa mirë organizata i kryen ato aktivitete kritike për prodhimin e asaj që organizata shet. Mësimi organizativ (OL) është procesi që organizata përdor për të mësuar si ti bëjë këto aktivitete më mirë. Mësimi organizativ rezulton, kur përdoruesit shfrytëzojë njohuritë. Se të mësuarit organizativ jo gjithmonë mund të ketë një efekt pozitiv është shqyrtuar nga monitorimi i efikasitetit organizativ. Efikasiteti mund të përmirësohet, të përkeqësohet, apo do të mbetet i njëjtë. Menaxhimi i të mësuarit (KM) dhe memoria organizative (OM) janë proceset që përdoren për të identifikuar dhe për të kapur

Page 48: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

38

njohuritë kritike. Punonjësit e njohurive dhe organizatat e tyre "bëjnë" menaxhimin e njohurive; ata identifikojnë objektet kryesore të njohurive për ruajtjen dhe krijojnë procese për kapjen e tyre. Memorja organizative (OM) është ajo që organizatat me IT mbështetje bëjnë, ata sigurojnë infrastrukturën dhe mbështetjen për ruajtjen, kërkimin, dhe nxjerrjen e objekteve të njohurive [31].

5.2.1 Tipet e diturive

Siç është përshkruar në figurën 11, njohuria është më shumë se ajo që një person e di apo më shumë se çfarë shumë njerëz e dinë. Është më shumë edhe se njohuritë e grumbulluara në organizatë nga burime të brendshme dhe të jashtme për vite apo dekada. Procesi i dokumentimit është një shembull i dijes eksplicite. Modelet e shitjes, procedurat hap pas hapi për ngarkimin e programit, sistemi i menaxhimit të performancës, si dhe kërkesat e biznesit financiar janë shembuj të tjerë.

Figurë 11. Strategjitë e E-learning për ndarjen e diturive në epokën digjitale [32]

Llojet e ndryshme të njohurive kërkojnë qasje të ndryshme për menaxhimin e njohurive. Secili lloj paraqet mundësi dhe sfida unike.

Njohuritë individuale, organizative dhe eksplicite nuk qëndrojnë të izoluara. Shumë shpesh ata ndërveprojnë me njëri-tjetrin. Performanca e biznesit është rezultat i një përzierje të njohurive të heshtur dhe të qartë, të individëve dhe organizatës që e përbëjnë firmën. Trajnimi është më i mirë kur përqendrohet në aftësi dhe njohuri të qarta të dërguara te individët. Menaxhimi i njohurive është më i përshtatshëm për grup dhe njohuri implicite [33].

Page 49: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

39

5.2.2 Piramida e menaxhimit të diturive Menaxhimi i njohurive mund të ndahet në tri nivele: menaxhimi i dokumenteve (niveli 1), krijimi i informacionit, ndarja dhe menaxhimi (niveli 2), dhe inteligjenca e ndërmarrjes (niveli 3). Këto nivele mund të organizohen në një piramidë (Figura 12).

Figurë 12. Tre nivelet e menaxhimit të njohurive [32]

Sa më lartë të shkohet në piramidë, më i integruar është sistemi i menaxhimit të njohurive me punën aktuale.

5.2.2.1 Menaxhimi i dokumenteve

Përdorimin e teknologjisë për të patur qasje te dokumentacionet paraqet një nga përpjekjet më të hershme në menaxhimit të njohurive. Sot, shumë kompani kanë vënë dokumente të mëdha, raporte, dhe forma online. Nga format përfituese tek manualet e përdoruesit dhe raporti vjetor i kompanisë, qasja tek dokumentet duke përdorur internetin kursen kohën dhe paratë duke krijuar një depo qendrore të informacionit për të cilët njerëzit kanë nevojë. Qasja dhe marrja është mjaft e lehtë, ju gjeni URL –në e dokumentit dhe pastaj shkarkoni dokumentin apo formën që ju e keni zgjedhur. Por ky nivel është mjaft i thjeshtë nga një perspektivë menaxhimit të njohurive, pasi mbështet vetëm shpërndarjen e informacionit, por jo edhe krijimin, organizimin, apo menaxhimin e përmbajtjes. Dhe, për shkak se informacioni është i shkarkuar, saktësia për të shkuar përpara nuk mund të garantohet.

5.2.2.2 Krijimi i informacionit, ndarja dhe menaxhimi Ky është niveli i menaxhimit të njohurive ku njerëzit me të vërtetë kontribuojnë me informacion për sistemin, duke krijuar përmbajtje të reja dhe duke rritur bazën e të dhënave me njohuri. Në vend që njerëzit të shtypin dokumentet, ata janë të inkurajuar për të lexuar ato online. Në vend të shkarkimit të formave, kompletimi i tyre, dhe pastaj faksimi i tyre në destinacione të përshtatshme, ato kompletohen online. Avantazhi i kësaj qasjeje është se informacioni mund të

Page 50: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

40

përditësohet vazhdimisht, duke shkuar një rrugë të gjatë drejt eliminimit të problemeve të natyrshme, kur dokumentet janë shkarkuar.

5.2.2.3 Inteligjenca e ndërmarrjes Në këtë nivel, operacioni aktual i biznesit varet nga ekspertiza e ngulitur në sistem.

Njerëzit mbështeten në atë në kryerjen e punëve të tyre, dhe përvojat që rezultojnë janë kapur dhe shtuar në sistemin në një mënyrë që rrit inteligjencën kolektive të firmës, gati (por jo fare) organike. Një qasje e rëndësishme e menaxhimit të njohurive në këtë nivel është përmes mbështetjes të performancës.

5.2.3.3.1 Mbështetja e performancës Çfarë nëse ju mund të bëni një punë ose të kryeni një detyrë më të mirë, më të shpejtë, dhe me kosto më të ulët pa pasur nevojë për të mësuar atë direkt? Po në qoftë se mjetet dhe sistemet që i keni përdorur në punën tuaj ju kanë ndihmuar që ju të bëni më mirë punën tuaj? Çfarë ndodh nëse ju jeni në gjendje të bëni diçka që ju nuk e keni bërë përpara, thjesht duke përdorur një sistem që jeni trajnuar nëpërmjet tij? Ky është koncepti pas mbështetjes të performancës. Sot, shumë sisteme të menaxhimit të njohurive të përfshijë gjithashtu një sërë mjetesh që mundësojnë përmirësimin e konsiderueshëm të produktivitetit. Ky është një kombinim shumë i fuqishëm për të mësuarit elekronik, sepse direkt integron njohuritë dhe performancën, duke rritur ndjeshëm vlerën e sistemit të përgjithshëm. Një nga qëllimet kryesore të mbështetjes të performancës është të sjellë individët në atë gjendje që sa më shpejt që të jetë e mundur dhe me përkrahje minimale nga njerëzit e tjerë të kryejnë punën e tyre [32].

5.3 Rëndësia e mësimit elektronik

E-learning ka kuptimin e edukimit që përfshin vetë-motivimin, komunikimin, efikasitetin, dhe teknologjinë. Për shkak të bashkëveprimit social të kufizuar, studentit duhet të mbajnë veten të motivuar. Izolimi i brendshëm për të mësuarit elektronik kërkon nga studentët të komunikojnë shpesh me njëri-tjetrin dhe me mësuesit për të kryer detyrat e caktuara. Të mësuarit elektronik është efikas pasi të eliminohen distancat dhe ndryshimet e mëvonshme. Largësia është eliminuar për shkak se përmbajtja e të mësuarit elektronik është projektuar me media që mund të arrihen nga terminale kompjuterike të pajisura siç duhet, dhe mjete të tjera të arritshme të teknologjisë së internetit. E-learning është një term fleksibil i përdorur për të përshkruar kuptimin e të mësuarit përmes teknologjisë. Llojët e ndryshme të të mësuarit elektronik janë bazuar në:

Domethënia e komunikimit; Plani shpërndarës;

Page 51: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

41

Struktura e klasës e të mësuarit elektronik; Teknologjia.

5.3.1 Domethënia e komunikimit

Ekzistojnë mënyra të ndryshme për individët të komunikojnë me njëri-tjetrin dhe me mësuesit e tyre. E-learning mund të bëhet vetëm përmes kërkesave on-line. Në raste të tjera, në qoftë se distanca nuk është faktor, disa komunikime ballë për ballë (face-to-face) mund të përfshihen për të krijuar të mësuarit elektronik të përzier (blended e-learning). Të mësuarit elektronik të përzier përfshin elemente të ndërveprimit në web dhe të ndërveprimit në person. Teknologjia zgjeron përkufizimin e komunikimit ballë për ballë pasi mund të ndodhë përdorimi i videos së dyanshme, dhe audios së dyanshme. Futja e këtyre elementeve të pjesëmarrjes krijon përvojën e të mësuarit elektronik të përzier (blended e-learning).

5.3.2 Plani shpërndarës E-learning mund të jetë ose Synchronous ose Asynchronous. Sinkronik do të thotë se komunikimi është zbatuar në kohë reale, si video konferenca, telekonferenca, dhe programeve për bisedë on-line. Josinkronik tregon se janë shfrytëzuar mjete të tjera të komunikimit që nuk kërkojnë përgjigje në kohë reale. Shembuj të të mësuarit elektronik josinkronik përfshijnë, diskutimet e ndërprera, e-mail, blogjet dhe forumet on-line.

5.3.3 Struktura e klasës të të mësuarit elektronik

Struktura e klasës e të mësuarit elektronik adreson se si mësimi është administruar. Të mësuarit elektronik mund të jetë me vetë-përcaktim, me udhëheqjen e mësuesit ose vetë-studim me një ekspert. Mësimi me vetë-ndikim administrohet nga studenti duke ia dhënë materialet e nevojshme për të përfunduar trajnimin / mësimin. Trajnimi me udhëheqjen e mësuesit i jep studentit një udhëzues për zbatimin e mësimit. Vetë-studim me një ekspert, është një kombinim i të mësuarit elektronik me vetë-ndikim dhe me udhëheqje të mësuesit. Edhe pse te të mësuarit elektronik me vetë-ndikim, studenti është përgjegjës për të qëndruar në detyrë dhe në orar, tek të mësuarit elektronik me udhëheqjen e mësuesit, ka ndërveprim me një figurë me autoritet që kontrollon progresin e studentit .

5.3.4 Teknologjia Teknologjia e përdorur për të zbatuar mësimin nuk është e kufizuar në materialet e bazuara në veb. Të mësuarit elektronik mund të arrihet duke shfrytëzuar çdo formë të teknologjisë që mban informacion që japin mediat. Video / Audio kasetat, përveç të qenit një teknologji e vjetëruar, janë mjete të mundshme për të zbatuar mësimin. Teknologjia aktuale ndihmon përvojën e të mësuarit, sepse ka më shumë mjete për të përcjellë informacionin. Teknologjia është elementi më i ndryshueshëm në të mësuarit elektronik. Sa më shumë

Page 52: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

42

teknologjia avancohet, aq më shumë mundësi ka për të mësuarit elektronik të mëtejshëm. Krijimi i internetit ndihmoi në krijimin e të mësuarit elektronik. Kur lidhjet dial-up u zëvendësuan me modem kabllor, u rrit shpejtësia dhe bandwidth-i i internetit; cilësia e on-line mësimit u përmirësua pasi kompjuterët ishin në gjendje të mbështesin mediat. Kur shprejtësia u rrit dhe pajisjet u bënë më të vogla dhe më të lëvizshme, trajnimi bëhet më fleksibil dhe forcon më tej rritjen e popullaritetit e të mësuarit elektronik [33].

5.4 Përparësitë e të mësuarit elektronik

Të mësuarit elektronik (E-learning) është i dobishëm për arsimin, korporatat dhe për të gjithë llojët e studentve. Është i përballueshëm, kursen kohë, dhe prodhon rezultate të matshme. E-learning ka një kosto më efektive se sa të mësuarit tradicional për shkak se kursen kohën dhe paratë dhe shpenzimet e udhëtimit. Që kur të mësuarit elektronik mund të bëhet në çdo vend gjeografik dhe nuk ka shpenzime të udhëtimit, ky lloj i mësimit është shumë më pak i kushtueshëm se sa duke bërë mësim në një institut tradicional.

Fleksibiliteti është një përfitim i madh i të mësuarit elektronik. E-learning ka avantazhin e mbajtjes së mësimit kurdoherë dhe kudo. Arsimi është në dispozicion kur dhe ku është e nevojshme. E-learning mund të bëhet në zyrë, në shtëpi, në rrugë, 24 orë në ditë, dhe shtatë ditë në javë. E-learning ka edhe vlerësime të matshme të cilat mund të krijohen në mënyrë që të dy mësuesit dhe studentët do të dinë se çfarë studentët kanë mësuar, kur ata i kanë përfunduar kurset, dhe se si i kanë kryer.

Studentët pëlqejnë të mësuarit elektronik sepse ai strehon lloje të ndryshme të stileve të mësuarit. Studentët kanë avantazhin e të mësuarit në ritmin e tyre. Studentët mund të mësojnë nëpërmjet një sërë aktivitetesh që aplikohen në shumë stile të ndryshme të të mësuarit që studentit kanë. Studentit mund të përshtatin të mësuarit elektronik në orarin e tyre të zënë. Nëse ata mbajnë një punë, ata përsëri mund të punojnë në të mësuarit elektronik. Nëse studenti ka nevojë për të bërë të mësim gjatë natës, atëherë ky opsion është në dispozicion. Studentit mund të rrinë në shtëpitë e tyre dhe të bëjnë mësim, nëse ata e dëshirojnë.

E-learning inkurajon studentit të lexojnë nëpër informacione duke përdorur hiperlinqet dhe faqet në Ueb në mbarë botën. Studentët janë të aftë për të gjetur informacionin e duhur për situatat dhe interesat e tyre personale. E-learning u lejon studentëve të zgjedhin materiale mësimore të cilat e përmbushin nivelin e tyre të dijes, interesat dhe atë që duhet të dinë për të kryer në mënyrë më efektive në një aktivitet. E-learning është fleksibil dhe mund të përshtatet për të plotësuar nevojat individuale të studentëve.

E-learning ndihmon studentit të zhvillojnë njohuri të internetit. Kjo njohuri do të ndihmojë studentit gjatë gjithë karrierës së tyre. E-learning inkurajon studentit të marrin përgjegjësi personale për mësimin e tyre. Kur studentit arrijnë suksese, ajo ndërton vetëdijesim dhe të vetëbesim tek ata.

Page 53: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

43

Edukatorët dhe korporatat me të vërtetë përfitojnë shumë nga e-learning. Studentët përfitojnë duke pasur mundësi për të mësuar në ritmin e tyre, në kohën e tyre, dhe e kanë më pak të kushtueshme [33].

5.5 Mangësitë e të mësuarit elektronik Një mangësi e të mësuarit elektronik është që studentit duhet të kenë qasje në një kompjuter, si dhe në Internet. Ata gjithashtu duhet të kenë aftësi kompjuterike me programe të tilla si përpunim teksti, shfletuesit e internetit, dhe e-mail. Pa këto aftësi dhe programe nuk është e mundur që studenti të ketë sukses në mësimin elektronik. E-studentit (E-learners) duhet të jenë shumë të rehatshëm duke përdorur një kompjuter. Lidhja e dobët e internetit apo kompjuterët e vjetër mund ta bëjnë të vështirë qasjen në materialet e kursit, gjë që mund të shkaktojë te studentit frustrim dhe të heqin dorë. Një tjetër disavantazh i mësimit elektronik është menaxhimi i dosjeve kompjuterike dhe programi i mësimit online. Për studentit me nivel fillestar të aftësive kompjuterike ndonjëherë mund të duket e ndërlikuar për të mbajtur dosjet e tyre kompjuterike të organizuara. Pa aftësi organizative kompjuterike të mira studentit mund të humbin apo të vënë gabim raporte duke shkaktuar vonesë në dorëzimin e detyrave. Disa nga studentit gjithashtu mund të kenë problem instalimin e softuerit që është i nevojshëm për klasën.

Mësimi elektronik gjithashtu kërkon po aq kohë për pjesëmarrje në klasë dhe kompletimin e detyrave si çdo kurs në klasë tradicionale. Kjo do të thotë se studentët duhet të jenë shumë të motivuar dhe të përgjegjshëm, sepse të gjithë punën që e bëjnë është e tyre. Studentit me motivim të ulët ose zakone të këqija studimi mund të mbesin prapa. Një tjetër disavantazh i të mësuarit elektronik është që pa strukturat rutinë të një klase tradicionale, studentët mund të humbin ose të hutohen për aktivitetet dhe afatet në kurs duke shkaktuar dështimin e studentit.

Një tjetër disavantazh i mësimit elektronik është që studentët mund të ndjehen të izoluar nga mësuesi. Udhëzimet nuk janë gjithmonë në dispozicion për të ndihmuar studentin kështu që studentit duhet të kenë disiplinë që të punojnë të pavarur pa ndihmën e pedagogut. E-studentit gjithashtu duhet të kenë aftësi të mira shkrimi dhe komunikimi. Kur arsimtarët dhe studentit e tjerë nuk janë në takim ballë për ballë është e mundur që të keqinterpretohet ajo që ishte menduar [33].

5.6 Nivelet e të mësuarit elektronik

Ekzistojnë katër nivele të mësuarit elektronik, nga niveli fillestar në nivelin më të avancuar. Këto nivele janë:

Baza e të dhënave me njohuri; Mbështetja online;

Page 54: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

44

Trajnimi josinkronik; Trajnimi sinkronik.

5.6.1 Baza e të dhënave me njohuri

Baza e të dhënave me njohuri është niveli bazë i të mësuarit elektronik që ne kemi parë në faqet e programeve që ofrojnë shpjegim të indeksuar dhe udhëzime, për pyetjet e programit gjithashtu jep udhëzime hap pas hapi për të kryer detyra specifike. Ne mund të gjejmë bazën e të dhënave me shtypjen e fjalës kyçe apo frazës [34].

Figurë 13. Baza e të dhënave me dituri

5.6.2 Mbështetja Online

Mbështetja Online është në nivelin e dytë të mësuarit elektronik. Funksioni i mbështetjes online është pothuajse i ngjashëm me bazën e të dhënave me njohuri. Ajo vjen në formën e tabele shpalljesh online, dhoma bisede, e-mail, ose mbështet mesazhet e çastit në kohë reale. Më së shumti në shënjestër janë pyetur pyetjet në të cilin ka më shumë përgjigje të menjëhershme [34].

5.6.3 Trajnimi asinkronik

Niveli i tretë i të mësuarit elektronik është trajnimi asinkron. Të mësuarit vetëm është thelbësore në këtë nivel; ose të mësuarit është i bazuar në CD ROM, në rrjet, në internet ose intranet. Është e njohur si mënyra më tradicionale e të mësuarit elektronik. Ju mund të kontaktoni mësuesit përmes bordit të diskutimve në internet dhe email-it ose mund të jetë

Page 55: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

45

plotësisht vetë-studim (self study) me lidhje deri te materialet referuese në vend të komunikimit në kohë reale me instruktorin [34].

Figurë 14. Trajnimi asinkronik

5.6.4 Trajnimi sinkronik

Niveli më i avancuar i të mësuarit elektronik, mësuesi në kohë reale është në dispozicion për të gjithë për të negociuar problemet e tyre në një kohë të parapërcaktuar. Secili mund të komunikojë me njëri-tjetrin. Ky lloj trajnimi zhvillohet nëpër faqet e internetit, audio ose video konferencat, telefon nëpërmejt internetit [34].

5.7 Standardet e të mësuarit elektronik

Për shkak të numrit të madh të mjeteve të të mësuarit elektronik që janë në dispozicion, nevoja për standarde është e qartë. Nuk është e vështirë të imagjinohet se çfarë do të ndodhte nëse secili shitës do të përdorte formatin e tyre të pronësisë për ruajtjen e të dhënve të kursit. Do të jetë e vështirë, nëse jo e pamundur, për të kaluar nga një mjet në një tjetër. Nëse një organizatë ka përdorur një LCMS (Learning content management system) të veçantë një shitësi për vite dhe pastaj vendosë të filloj të përdor disa LCMS të tjera për disa arsye, ata ndoshta do të dëshironin që ky kalim të jetë sa më i lehtë që të jetë e mundur. Nëse LCMS-ja e vjetër dhe LCMS-ja e re përdorin formate të ndryshme për ruajtjen e të dhënave të tyre, atëherë përmbajtja do të duhej të konvertohet në ndonjë mënyrë (nëse është e mundur), ose ndoshta vetëm të transferohen me dorë. Në organizata të mëdha me shumë kurse, kjo do të merrte shumë kohë dhe do të ishte shumë e kushtueshme.

Standardet mund të përdoren për të siguruar që përmbajtja e krijuar në një LCMS mund të përdoret në një tjetër LCMS, duke siguruar se ata të dy janë me të njëjtat standarde. Për shembull, testet (analizat) e krijuara në një mjedis janë të përdorshme në sistemin tjetër. Shembuj të tjerë të materialeve të transferueshme janë objektet e të mësuarit, programet mësimore, informacionet e studentit, etj.

Page 56: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

46

Mësimi i sistemit të menaxhimit të përmbajtjes (LCMS) zakonisht është përgjegjës për shumë gjëra. Për shembull, sistemi duhet të menaxhojë përmbajtjen e të mësuarit dhe ta dorëzojë atë te studentët. Ajo gjithashtu duhet të menaxhojë informacionet e studentve, notat e tyre dhe progresin në një kurs. Ekzistojnë standarde që përcaktojnë se si të bëhen secila nga këto gjëra.

Kryesisht, standardet e të mësuarit elektronik mund të ndahen në tri kategori të përgjithshme nga qëllimi i tyre [35]:

5.7.1 Standardet metadata

Përcakton mënyrën e përshkrimit të përmbajtjes së mësimit. Duke përdorur metadata e bën më të lehtë për të ruajtur, treguar, kërkuar dhe për të tërhequr përmbajtjen e të mësuarit nëpër platforma dhe sisteme të shumta të menaxhimit të përmbajtjes. Metadata mund të jetë e brendshme (ruhet brenda objektit të të mësuarit) ose e jashtme (ruhet jashtë objektit të të mësuarit në një dosje të veçantë). Zakonisht metadata është përshkruar nga një dokument XML. Standardet Metadata përshkruajnë se cilat elemente duhet të ketë ky dokument i veçantë, çfarë lloj të informacionit të ruaj në lidhje me përmbajtjen e të mësuarit dhe si ta ruaj atë. Për shembull, metadata mund të përmbajë përshkrimin e një pjesë të veçantë të të dhënave, autorin e saj, datën e fundit të modifikimit, të drejtat e autorit, vendndodhjen e këtij objekti të të mësuarit, objektivat e të mësuarit, audiencën e synuar etj.

5.7.2 Standardet e paketimit të përmbajtjes Përcaktojnë si të paketojnë materialet mësimore në një mënyrë të standardizuar. Kjo i jep

përparësinë e përdorimit të përmbajtjes së njëjtë në sisteme të ndryshme të menaxhimit të përmbajtjes dhe e bën më lehtë eksportimin dhe importimin e materialeve si dhe shkëmbimin e tyre në mes sistemeve të menaxhimit të përmbajtjes.

5.7.3 Profilet e studentit Përshkruan si të shkëmbehen e informacionit e studentit në mes sistemeve apo komponentëve

të ndryshme të sistemit. Shembuj të informacioneve të tilla mund të jenë të dhënat personale, notat, historia e të mësuarit, informacionet për qasje, çertifikatat, diploma, etj. Përdorimi i standardeve nuk mundet gjithmonë ti bëjë gjërat më të lehta. Krijimi i metadata është një punë e përditshme e tepërt dhe në të shumtën e rasteve nuk mund të priten menjëherë rezultate. Nëse organizata nuk ka qëllimin fillestar të ndarjes së objekteve të tyre të të mësuarit, ata nuk do të dëshironin të shqetësoheshin me metadata. Përdorimi i standardeve kur krijohet sistemi mund ta bëjë më të vështirë zbatimin e tyre dhe mund të mos jetë gjithmonë e nevojshme në të ardhmen e afërt. Por duhet të kenë parasysh, se aplikimi i mëvonshëm i standardeve mund të jetë i pamundur ose të paktën një detyrë shumë e frikshme.

Page 57: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

47

5.8 Arkitektura e sistemit për e-learning SMEUS

Ashtu siç e cekëm më lartë, situata reale e sistemit arsimor në vendim tonë reflekton në mospasjen e një arkitekture të standardizuar sipas së cilës do të realizoheshin dhe integroheshin proceset e mësimit elektronik në nivel shteti. Aplikimi i sistemeve për menaxhim mësimor është akoma i pa konsoliduar dhe gjendet në faza fillestare të implementimit. Aktualisht janë realizuar sisteme për integrimin e mbarëvajtjes mësimore, ku vlen të përmenden sistemi EMIS (Educational Management Information System), dhe ditari elektronik. Duke pas parasysh numrin e madh të nxënësve në shkallë vendi, i cili arrin deri në 245.000, ruajtja apo magazinimi i të dhënave ka karakter multidimensional14. Sa i përket testimit elektronik, iniciativat e autoriteteve udhëheqëse arsimore bëjnë përpjekje për ndërtimin e një sistemi për evaluim dhe testim të jashtëm të nxënësve, që njihet si provimi i maturës shtetërore.

Në vazhdim po i paraqesim modulet e sistemit për testim elektronik ekstern, duke i përfshirë të gjithë hapat e nevojshme për përdorimin e softuerit për testim.

14 Qendra shtetërore për testim e Maqedonisë (www.dic.edu.mk), Ministria e Arsimit dhe Shkencës.

Page 58: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

48

Figurë 15. Modulet e sistemit për testim elektronik ekstern

Procesi i testimit mund të realizohet nëpërmjet disa moduleve të shpërndarjes dhe grumbullimit të testeve.

1. Moduli i centralizuar. Klienti për tu testuar lidhet direkt me serverin qendror prej ku e merr testin dhe ku i regjistron rezultatet e testit të përgjigjur.

Page 59: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

49

2. Moduli i shpërndarjes. Në kuadër të lokacioneve të shkollës ekzistojnë server lokal, kështu që softueri i klientit për testim lidhet me serverët lokal. Serverët lokal komunikojnë me serverin qendror prej ku i pranojnë testet dhe ku i dërgojnë rezultatet.

3. Moduli off-line. Në këtë modul softueri i klientit i pranon testet nga një fajll lokal, e cila mund të ndodhet në një lokacion të para definuar në sistemin e fajlleve ose në ndonjë medium të jashtëm. Rezultatet dërgohen (regjistrohen) në medium të jashtëm. Për zbritjen e testeve nga serveri qendror përdoret një operacion i veçantë në serverin lokal për eksportimin e testeve dhe importimin e testeve të zgjidhur.

4. Sistemi duhet të mbështes çfarëdo kombinacioni nga modulet e sipërshënuar, sipas kësaj radhitje: serveri qendror, serveri lokal dhe fajlli lokal. Softueri i klientit duhet të ketë mundësi të përshtatet dhe ta ndryshojë këtë radhitje.

Si karakteristikë e përbashkët e sistemeve EMIS, e-Ditari dhe aplikacionit për testim elektronik ekstern është mungesa e aplikimit të konceptit të përshkrimeve i bazuar në ontologji për materialet mësimore apo bazës së diturisë si dhe aplikimit të shënimeve semantike për çdo objekt të krijuar mësimor.

Për këtë qëllim, ne tentojmë të ofrojmë një zgjidhje të aplikimit të mësimit elektronik në përgjithësi dhe testimit elektronik në veçanti, duke paraqitur edhe aplikimin e ontologjive si konceptualizim i strukturës së mësimit elektronik. Më poshtë e kemi paraqitur arkitekturën e sistemit tonë SMEUS, duke propozuar mbështetjen për integrimin e ontologjive në mjedisin e mësimit elektronik.

Page 60: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

50

Figurë 16. Arkitektura e sistemit SMEUS

Si elemente përbërëse të sistemit janë: dizajni i ndërfaqes, metadata të sistemit, përshkrimi i përmbajtjeve mësimore dhe metoda apo teknika e të mësuarit. Në kuadër të dizajnit të ndërfaqes, kemi zhvilluar alternativa të veçanta për testimin, konsultimet online dhe në fund e japim propozimin për të paraqitur në mënyrë semantike procesin e të mësuarit, duke aplikuar ontologji. Sa i përket opsionit të konsultimeve, është paraparë komunikimi apo konsultimi i mësimdhënësve sipas lëndëve që ato i zhvillojnë. Ky opsion është i organizuar në formë të një forumi privat, këmbimi i mesazheve në relacionin një-një. Studentëve nuk iu mundësohet të dërgojnë pakufi mesazhe, por ato mund të dërgojnë mesazh tjetër vetëm nëse mesazhi paraprak është përgjigjur nga ana e mësimdhënësit. Ndërfaqja është realizuar ashtu që mësimdhënësi pasi të futet në sistem, i tregohet lista me mesazhe të palexuara, të radhitura sipas lëndës dhe datës së mbërritjes së mesazhit. Studenti pasi të futet në sistem mund të zgjedh nga lista e mësimdhënësve për ti konsultuar, pastaj e selekton edhe lëndën të cilën e zhvillon mësimdhënës. Edhe studenti menjëherë pas futjes në sistem mund ti hetojë mesazhet e palexuara dhe të lexuara, të cilat i janë dërguar nga një mësimdhënës i caktuar.

Karakteri semantik i të mësuarit apo semantika e objektit të mësimit e përfshin propozimin për përshkrimin e materialeve mësimore me domen të ontologjisë, që na jep një paraqitje semantike të përmbajtjes, duke i shtuar shënime semantike secilit burim mësimor. Krijimi i ontologjisë konsiston në identifikimin e strukturës së modulit mësimor dhe definon vokabularin që i

Page 61: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

51

nevojitet studentit për konceptualizimin e moduleve mësimore. Një ontologji tjetër propozojmë që të krijohet edhe për materialet mësimore, që ndodhet në pjesën e metadata-ve të sistemit. Në kuadër të kësaj pjese ndodhen edhe alternativat për qasje në sistem, për regjistrimin e rezultateve dhe për komunikimet.

Në pjesën e përshkrimit të përmbajtjeve mësimore ndodhen opsionet ku janë të ruajtura silabuset e lëndëve dhe materialet mësimore. Metoda e të mësuarit e përfshin aspektin e testimit apo të kontrollimit të diturive për nxënësit, e cila është si një lloj përgatitje para testimit në klasë.

Në diagramin e mëposhtëm e paraqesim logjikën funksionale të sistemit SMEUS.

Figurë 17. Logjika funksionale e sistemit SMEUS

Page 62: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

52

Sistemi SMEUS aplikon arkitekturën klient-server. Para së gjithash, të gjithë studentët duhet të logohen në sistem nëse paraprakisht janë regjistruar nga ana e administratorit apo mësimdhënësit. Sipas diagramit të sipërm, studenti mund të lexoj materiale mësimore, të konsultoj mësimdhënësin, ti nënshtrohet testimit si dhe të ketë qasje te rezultatet e testimit. Nga ana tjetër, mësimdhënësi përveç mundësisë së regjistrimit të studentëve, mund të formuloj pyetjet e testit, të shtojë materiale mësimore, të ndryshojë teste si dhe ti ndryshojë materialet për mësim. Procesi i funksionimit të sistemit është paraqitur më poshtë dhe e përshkruan të gjithë procesin e komunikimit në të gjithë sistemin.

Figurë 18. Procesi i komunikimit në sistemin SMEUS

5.9 Integrimi i ontologjive në SMEUS

Ontologjitë për proceset e e-learning mund të krijohen në shumë mënyra. Ato kanë një vokabular me sqarime të kushteve dhe informatave për mënyrën se si janë të ndërlidhura fjalët me njëra tjetrën. Transformimi i ontologjive në teori të përmbajtjes mësimore ndihmon në klasifikimin e llojeve të objekteve që ndodhen në një domen të caktuar të diturisë.

Ueb-i semantik i mbështet proceset e inovacionit në mjedisin e të mësuarit, duke e shfrytëzuar vetinë e krijimit dhe menaxhimit të dhënave që janë të kuptueshme për makinën dhe më gjerë. Ai i posedon të gjitha veçoritë për kompozimin dhe ripërdorimin e materialeve dhe konteksteve të e-learning duke mundësuar përmirësimin e meta të dhënave të lidhura me materialet e e-learning si dhe zgjerimin e mundësive ekzistuese në përcaktimet e e-learning. Fusha e e-leraning i përfshin disa resurse të proceseve siç janë: LOM, SCORM, RDF, XML,, OWL etj. LOM i përfshin meta të dhënat për objektet e të mësuarit e cila paraqet një standard për menaxhimin e sistemit arsimor

Page 63: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

53

dhe objektet e të mësuarit. SCORM (Sharable Content Object Reference Model) i definon komunikimet ndërmjet përmbajtjeve të klientit dhe sistemit që njihet si mjedisi i kohës së ekzekutimit (run-time environment), i cili mjedis mbështetet nga sistemet e menaxhimit të mësuarit (LMS).

Përdorimi i ontologjive paraqet një mënyrë efikase e aplikimit të qasjes së ueb-it semantik në e-learning, duke bërë që të realizohet përshkrim i bazuar në ontologji i materialeve mësimore apo bazës së diturisë si dhe duke shtuar shënime semantike për çdo objekt të krijuar mësimor. Nga aspekti organizativ përdorimi i ontologjive mundëson kategorizimin e burimeve mësimore në forma të personalizuara mësimore, të cilat i bëhen të qasshme studentit sipas kërkesës së tij, varësisht nga profili dhe nevojat e tij për të mësuar. Në këtë mënyrë, bëhet e mundur që lehtësisht të identifikohen burimet mësimore të nevojshme për të arritur qëllimi i dëshiruar, si dhe zvogëlohet koha për qasjen te burimet mësimore.

Sa i përket kornizës së e-learning, ueb-i semantik siguron një teknologji, e cila bën që objekti i të mësuarit të jetë [36]:

I përshkruar me meta të dhëna: Për shkak të strukturës shpërndarëse të RDF, përshkrimi mund të zgjerohet dhe përshkrime të reja mund të shtohen. Kjo lejon përdorimin kreativ të përmbajtjes në një mënyrë të re dhe të paparashikuar. Pra fakti që secili mund të lidh diçka me diçka – realizohet në RDF.

I shënuar: çdo burim i identifikuar nga URI mund të shënohet me shënime personale dhe të lidhet nga çdokush.

I zgjeruar: përmbajtja e strukturuar me XML mund të lejojë që të ekzistojnë shumë versione të saj. Ndryshimet e njëpasnjëshme të përmbajtjes mund të bëhen me anë të skemave të RDF, duke lejuar versione private, grupore ose të autorit për një dokument të caktuar. Historia e versioneve paraqitet si pemë me degë të njohura dhe të panjohura, e që mund të përshkohen me ndihmën e veglave të posaçme të versioneve.

Ndahet dhe komunikohet me secilin që shpreh interes për atë përmbajtje. Pasi që meta të dhënat shprehen me format standard, i cili është i pavarur nga skemat themelore, edhe aplikacionet më të thjeshta mund të nënkuptojnë pjesë të grafeve komplekse të RDF. Nëse vegla e parapëlqyer e studentit nuk i mbështet skemat përkatëse, së paku ajo mund ti paraqes në një grafik, tabelë ose me ndonjë standard tjetër të papërpunuar për përshkrimin e burimeve dhe vetive të tyre.

Çertifikohet: nuk ka kuptim që vetëm organizatat e mëdha ti certifikojnë burimet mësimore. Edhe individët, siç janë mësimdhënësit, duhet që të bëjnë certifikimin e një përmbajtje mësimore si një burim cilësor mësimor, i cili është i përshtatshëm për punë të caktuara mësimore.

Sistemi SMEUS ka për qëllim që të shërbejë si një vegël inovative për nxjerrjen e diturive dhe aplikimin e mësimit dhe testimit në distancë, që për dallim nga sistemet e ngjashme që mund të ndodhen në treg, propozon dhe mundëson edhe shfrytëzimin e Ueb-it Semantik për

Page 64: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

54

të ofruar një mbështetje të dobishme për proceset e mësimit elektroni. Në fakt, me SMEUS synojmë ti tejkalojmë kufizimet e aplikacioneve aktuale për mësim elektronik nga aspekti i krijimit dhe shpërndarjes së përmbajtjeve mësimore.

Më konkretisht, ontologjitë si koncept në SMEUS i aplikojmë në pjesën e domenit apo semantikës së objektit të mësimit, e cila e përfshin propozimin për përshkrimin e materialeve mësimore me domen të ontologjisë, e cilana jep një paraqitje semantike të përmbajtjes, duke i shtuar shënime semantike secilit burim mësimor. Domeni i objektit të mësimit i përfshin dituritë nga teoria e të mësuarit, gjuha, disiplina shkencore, teknologjitë ndihmëse etj. Të gjitha këto ndërlidhen me fushat e modelimit ontologjik në më shumë mënyra. Nëse e marrim si shembull disiplinën shkencore, përmbajtja tek ajo dallohet për nga tipi dhe nivelet. Në tipin e përmbajtjes mund të bëjnë pjesë: rregullat, proceset, procedurat, konceptet etj. Kurse në nivelet e saj mund të shfaqen nivelet e kompleksitetit të përmbajtjeve, si për shembull: nivel bazik, mesatar dhe i avancuar. Me qëllim që pritjet apo rezultatet nga të mësuarit të fokusohen në përmirësimin e kuptueshmërisë së materialit mësimor, modelet, qëllimet dhe përmbajtjet mësimore duhet të strukturohen apo definohen me metodologji të duhur pedagogjike. Kur jemi te teknologjitë ndihmëse, ato e mbështesin teknikën e prezantimit të përmbajtjeve mësimore me teknologji të ndryshme, siç mund të jenë, ontologjitë, metadata-t dhe magazinimi i objekteve mësimore.

Më poshtë e paraqesin ontologjinë e karakterit semantik që propozohet për tu integruar në SMEUS.

Figurë 19. Ontologjia për karakterin semantik të mësuarit/objektin e mësimit në Protégé

Page 65: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

55

Figurë 20. Ontologjia për karakterin semantik të mësuarit/objektin e mësimit në UML

Në figurën e mëposhtme kemi paraqitur ontologjinë e meta të dhënave për fushën e materialit mësimor. Kjo ontologji i ka dy nën tipe: Materiale për testim/provim si dhe Materiale për lëndë. Materiali për testim edhe më tutje mund të ndahet në Testim dhe Testim provues. Materiale për lëndën ndahet në Material për lexim, Silabus, Skripta, Detyra për zgjidhje dhe Shembuj testesh. Në rastin kur ontologjia strukturohet atëherë nënkuptohet nëse do të jetë Materiale për lexim, Testim apo diçka tjetër. Meqenëse meta të dhënat paraqesin kontekst të ndryshëm për të dhënat, ne mund ta bëjmë qartë dallimin ndërmjet Materialeve për testim dhe Materialeve për lëndën.

Page 66: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

56

Figurë 21. Ontologjia për Materialet Mësimore në Protégé

Figurë 22. Ontologjia për Materialet Mësimore në UML

Modeli jonë i propozuar SMEUS, përfshin një tërësi veglash dhe opsionesh që janë tipike për portalet semantike, siç janë: regjistrimi i përdoruesve (nxënës, instruktor), ngarkimin (ang. upload) dhe shkarkimin (ang. download) e materialeve mësimore, testim provues dhe testim real gjatë procesit mësimor, etj. Po ashtu, në sistem janë përfshirë edhe ontologjitë për objektin e mësimit dhe materialet mësimore. Për të krijuar klasat dhe vetitë/tiparet e ontologjive është përdorur aplikacioni Protégé. Gjatë implementimit të aplikacionit SMEUS, gjithashtu, kemi shfrytëzuar edhe teknologjitë ASP.NET dhe C#. Baza e të dhënave është krijuar me Microsoft SQL Server.

Page 67: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

57

Kapitulli 6. Metodologjitë e aplikimit të kërkimit semantik në sistemet e Inteligjencës Afariste

Sistemet e Inteligjencës Afariste (ang. Business Intelligence – BI) janë “një koleksion i teknologjive për vendim marrje që i ndihmojnë menaxherët dhe analistët e kompanive që të sjellin vendime më të shpejta” [36]. Këto sisteme janë të bazuara në databaza të mëdha dhe specifike të ashtuquajtura data warehouse, të cilat shfrytëzojnë modele multidimensionale, që paraqesin fakte relevante sipas dimensioneve të ndryshme.

Qëllimi primar i sistemeve BI është grumbullimi dhe transformimi i të dhënave nga burimet e të dhënave, që mund të jenë të strukturuara ose të pastrukturuara, për të gjeneruar informacione të sakta, të cilat mund të shfrytëzohen në funksion të sjelljes së vendimeve. Një plan tipik i veprimeve të sistemeve të Inteligjencës Artificiale mund të strukturohet në tre nivele, si vijon:

Niveli i burimeve të dhënave, ku përfshihen të gjitha të dhënat e mundshme pavarësisht formatit të tyre

Niveli i integrimit, i cili synon normalizimin dhe pastrimin e të dhënave të mbledhura nga burimet. Deponimi apo ruajtja e tyre në formatin përkatës po ashtu është pjesë e këtij niveli.

Niveli i analizës, që përmban një tërësi veglash për gjenerimin e informacioneve nga të dhënat e normalizuara, të cilat më tutje iu paraqiten menaxherëve apo analistëve.

BI përdoret tashmë pothuajse nga të gjithë bizneset për të nxjerrë dituri të rëndësishme nga të dhënat e brendshme ose të jashtme. Të dhënat e jashtme mund të jenë ato të dhëna që nuk janë pjesë e sistemit informativ të kompanive në fjalë, por që janë edhe në ueb. Gjatë kërkimit apo nxjerrjes së këtyre të dhënave është shumë me rëndësi të dihet semantika e saktë e të dhënave. Për të arritur këtë, nevojitet aplikimi i teknologjive semantike apo ueb-it semantik, duke bërë që semantika që duhet të përcaktohet për ndonjë resurs të ueb-it, të strukturohet dhe kategorizohet nga semantika më e thjeshtë në semantikë më komplekse. Sipas studimeve më të fundit të realizuara nga [37], konceptet e ueb-it semantik ndihmojnë edhe në shtresën e BI që ka të bëjë me integrimin e të dhënave, ku përfshihet shënimi semantik i të dhënave dhe realizimi semantik i proceseve të nxjerrjes, transformimit dhe ngarkimit të dhënave (ETL – Extract Transform Load).

6.1 Kubi OLAP për analiza shumëdimensionale

Për të analizuar të dhëna që kanë karakter shumëdimensional, kubi OLAP paraqet një metodë mjaft efikase për marrjen e vendimeve kur kemi burime të shumta të dhënave. Dizajnimi i kubit OLAP varet nga natyra e analizave dhe pyetjeve që i parashtrojnë përdoruesit. Ky proces i dizajnimit të skemës së OLAP i nënshtrohet disa hapave. Si hap i parë në procesin e ndërtimit të kubit shumëdimensional është magazinimi i të dhënave. Procesi i magazinimit grumbullimit të

Page 68: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

58

dhënave përfshin burime të dhënash të natyrave të ndryshme dhe që janë të pastrukturuara dhe të pa pastruara. Për këtë arsye, të dhënat përpara se të grumbullohen i nënshtrohen procesit ETL. Më poshtë e paraqesim procesin skematikisht këtë proces.

Burimet e të dhënave Procesi ETL Procesi i magazinimit Vegla/aplikime të BI

Figurë 23. Hapat e nevojshme deri te formimi i kubit OLAP

Modelimi i të dhënave multidimensionale paraqitet me anë të skemës yll ose me anë të skemës flokë bore. Siç dihet, si koncepte themelore të modeleve shumëdimensionale janë faktet dhe konceptet. Fakteve mund t’ju referohemi edhe si përmasa, të cilat janë atribute me vlera numerike që merren për tu analizuar sipas dimensioneve të mundshme në kub. Databaza përmban një tabelë të vetme, që njihet si tabela e fakteve dhe tabela për secilin dimension. Në Figurën 24 paraqesin skemën yll për modelin shumëdimensional të sistemit SMEUS, ku analizojmë disa dimensione potenciale, të cilat nevojiten për të nxjerrë vlera nga tabela e fakteve. Secila tabelë e dimensioneve përmban kolona që korrespondojnë me atributet e dimensionit.

Databaza operacionale

OLTP

Burime të jashtme

ETL

Magazinimi (data warehousing)

OLAP

Minimi i të dhënave

Raportime

Page 69: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

59

Figurë 24. Faktet dhe dimensionet sipas skemës yll në SMEUS

Në sistemin SMEUS, propozojmë për analizë 5 dimensione: Studenti, Koha, Lënda, Testi dhe Mësimdhënësi. Për të realizuar analiza më të thella dhe të detajuara, mund të krijohen edhe më shumë kube OLAP, por mund të definohen edhe kube të tilla që mund të përmbajnë n – dimensione, ku n>3. Këto kube njihen ndryshe si hiper kube.

Figurë 25. Kubi OLAP në SMEUS

Page 70: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

60

Nëse bëhet një analizë shumëdimensionale e bazuar në kubin e paraqitur në Figurën 25, vërejmë se gjatë testimit të realizuar për një lëndë të caktuar në muajin Shkurt të vitit 2013, studenti Diellza ka fituar 98% të pikëve, që korrespondon me vlerën numerike të notës 10. Vlen të theksojmë se jo rrallëherë nevojitet që dimensionet e caktuara të paraqiten në hierarki. Në rastin tonë, si shembull po e ilustrojmë paraqitjen hierarkike të dimensionit Koha. Në paraqitjen e hierarkive aplikohet parimi i relacionit prind-fëmijë. Kështu, Semestri është fëmijë i Vitit, ndërsa Muaji është fëmijë i Semestrit. Për të manovruar nëpër hierarki realizohen veprimet roll-up (kahja e lëvizjes është nga niveli i poshtëm në nivelin e sipërm) dhe veprimet drill-down (kahja e lëvizjes është nga niveli i më sipërm në nivelin e poshtëm).

Si sfidë kryesore gjatë implementimit të kubit OLAP paraqitet balancimi i numrit të duhur të dimensioneve në strukturën e tij. Shumë dimensione mund të shkaktojnë konfuzione gjatë përdorimit të tyre ndërsa më pak dimensione në OLAP nënkuptojnë kufizime të manovrimeve me të dhënat. Për këtë arsye nevojitet aplikimi i modelit relacional të dimensioneve, i cili i ruan të dhënat në një model të optimizuar sipas të cilit ndërtimi i pyetësorëve apo kubit OLAP do të jetë më i lehtë dhe i qartë. Në propozimin tonë për ndërtimin e OLAP kubit mund të radhiten edhe më shumë dimensione, mbi bazën e të cilave mund të realizohen analiza të shumta të strukturuara.

Me qëllim të ekzaminimit, raportimit dhe menaxhimit të dhënave që ndodhen në kubin OLAP përdoren aplikacione të quajtura OLAP shfletues. Ky veprim është i një rëndësie të madhe meqë në mënyrë tepër fleksibile dhe me shpejtësi realizohet nxjerrja e të dhënave për qëllime analitike. Këto aplikacione i lexojnë të dhënat nga kubi dhe mund ti qasen kubeve lokal apo edhe atyre kubeve që ndodhen në server.

6.1 Mbi aspektet e integrimit të teknologjisë semantike në data warehouse

Aktualisht, zgjidhjet softuerike të BI sistemeve ballafaqohen me dy sfida. E para ka të bëjë me mënyrën e paraqitjes së domenit dhe semantikës afariste, që përfshin modelimin e domeneve, koncepteve dhe logjikës afariste, në mënyrë që marrësit e vendimeve të kenë qasje në hapësirat deponuese të dhënave, duke mos pasur paraprakisht njohuri teknologjike mbi ato. Si sfidë e dytë paraqitet integrimi i burimeve heterogjene të informacionit. Meqenëse qasja e të dhënave të strukturuara dhe jo të strukturuara akoma ngelet një problematikë që nuk ka ndonjë zgjidhje të konsoliduar, janë propozuar shënimet semantike për këtë qëllim. Këto shënime bëjnë abstrahimin semantik për të mundësuar qasje heterogjene në të dhënat e shpërndara apo të pa strukturuara, si dhe e përmirësojnë procesin e integrimit të dhënave që realizohet në kuadër të procesit ETL.

Page 71: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

61

6.1.1 Modeli i domenit dhe koncepteve afariste Shënimet mund të interpretohen si objekte ose si komente që i bashkëngjiten një pjese të caktuar të dokumentit. Formati i tyre mund të jetë i ndryshëm, mund të paraqiten si linqe në burimet e informacionit për të bashkëngjitur objektin e shënuar, si tekst i pa strukturuar etj. Sipas [38], shënimet semantike janë procese të zbulimit apo bashkëngjitjes nëpër entitete në linqet tekstuale të përshkrimeve të tyre semantike. Zbatimi i tyre është i gjerë. Ato mund të përdoren në çdo lloj të tekstit: ueb faqe, dokumente tekstuale, fusha tekstuale në databaza etj. Praktikisht, këto mund të llogariten si pjesë e procesit të krijimit të meta të dhënave, duke bërë të mundur që shënimet të avancohen në një nivel më të lartë semantik dhe ekspresiv. Është me rëndësi edhe gjuha për përshkrimin e skemave të shënimeve, meqë sa më formale të jetë semantika e kësaj gjuhe, më lehtë mund të përpunohen nga makina ato shënime.

Kur jemi te sistemet e Inteligjencës Afariste, ku aplikacionet varen nga domenet, shënimet semantike bëjnë përcaktimin e koncepteve të domeneve dhe atyre afariste nga ontologjitë apo burimet e tjera të diturive. Varshmëria e aplikacioneve konsiston në faktin që ato tentojnë në mënyrë automatike të nxjerrin sa më shumë entitete dhe ti lidhin ato me burimet e diturive, me qëllim të përmirësimit të funksionalitetit të motorëve të kërkimit.

Studimet e fundit që janë bërë nga fusha e Inteligjencës Afariste rekomandojnë përdorimin e shënimeve semantike për integrimin e të dhënave nga sistemet heterogjene të informacionit. Në studimin e [39] propozohet një arkitekturë me shtresa ku secila skemë e burimeve të dhënave pasqyrohet në mënyrë të pavarur nga ontologjitë teknologjike (TO) në ontologji afariste (BO) për të ndërlidhur konceptet teknike me konceptet e nivelit afarist. Në shtresën aplikative, përdoruesi mund ta formojë pyetësorin sipas paraqitjes grafike të ontologjisë afariste, e cila përmban terme të rëndësishme afariste që i njohin afaristët. Nga këndvështrimi afarist, ky model është shumë i lehtë për tu kuptuar dhe përdorur.

Page 72: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

62

Figurë 26. Arkitektura me shtresa për kërkim në sistemet BI [39]

Një tjetër qasje është propozuar edhe nga [40] ku bëhet dallimi ndërmjet ontologjisë së domenit, i cili posedon terminologjinë e domenit afarist dhe ontologjisë së BI, duke modeluar konceptet që përdoren për përshkrimin e mënyrës së organizimit të burimeve të dhënave. Këto të dhëna më pastaj pasqyrohen në konceptet e përshkruara në ontologjinë e domenit.

Figurë 27. Ilustrimi i kornizës semantike për mbështetje të BI [40]

Page 73: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

63

6.2 Integrimi i burimeve heterogjene të informacionit

Një problematikë tjetër që i ka preokupuar vazhdimisht studiuesit nga fusha e BI, sidomos gjatë procesit të eksplorimit interaktiv të hapësirave multidimensionale të informacionit është integrimi i burimeve heterogjene të informacionit. Në këtë rast, të dhënat janë të shpërndara dhe heterogjene, dhe rezultatet e nxjerra duhet të integrohen. Përdorimi i informacionit semantik, siç janë ontologjitë, duket se është çështje shpresëdhënëse dhe implikon një numër të caktuar të problemeve të pazgjidhura. Kohëve të fundit ka pasur po ashtu një interesim të theksuar në mbështetjen e formave hulumtuese të kërkimit të informacionit kur përdoruesit nuk janë të njohur me domenin që e hulumtojnë, terminologjinë e informacionit, burimet e informacionit, ose madje edhe kur përdoruesit nuk janë të sigurt për qëllimet e tyre të kërkimit.

Një zgjidhje për mbështetjen e kërkimit hulumtues paraqet përdorimi i kërkimit dhe navigimit vizual. Për shembull, sistemi Polestar15 mundëson që përdoruesit të navigojnë dhe që vizualisht ti filtrojnë pyetësorët dhe rezultatet e kërkuara në bashkësi të dhënash multidimensionale.

Poashtu Relation Browser [41] ofron një tërësi vizuelizimesh dhe ndërveprimesh, përfshirë edhe shtimin e reve (cloud computing), për kërkim interaktiv. Edhe ndërfaqja Parallax16 ofron një kombinim të kërkimit, si shikimi i fakteve, koha, dhe hartat që u ndihmon përdoruesve të eksplorojnë një sasi të caktuar të të dhënave heterogjene në ueb. Së fundmi, vizualizimi multidimensional i shpërndarë [42] u lejon përdoruesve që në mënyrë interaktive të zgjedhin pika në dimensione të ndryshme me qëllim të filtrojnë dhe rafinojnë kriterin e kërkimit.

Një metodë interesante për shfrytëzimin e shënimeve semantike të bazuara në ontologji për dizajnimin e data warehouse multidimensionale ka paraqitur [43]. Në këtë metodë supozohet se shumë burime heterogjene paraqiten nga një ontologji, duke identifikuar po ashtu faktet potenciale, dimensionet dhe masat e bazuara në varshmërinë funksionale. Këtu bëhet përdorimi i ontologjisë së domenit, e cila kodohet në gjuhën OWL DL-Lite, për të nxjerrë modelin multidimensional, i cili në mënyrë të plotë e merr parasysh semantikën e domenit.

Ekzistojnë edhe modele tjera relevante të fushës, që eksplorojnë analizën e shënimeve semantike të koduara në gjuhët RDF dhe OWL. Në modelin e propozuar nga [44] paraqitet një kornizë multidimensionale me përdorim të ontologjive për analizën e shënimeve semantike nga këndvështrimi logjik. Këtu, shënimet semantike bazohen në ontologjitë e aplikacionit dhe domenit.

15 http://polestar.ondemand.com/Excel2Polestar.jsp

16 http://mqlx.com/~david/parallax/

Page 74: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

64

Figurë 28. Analiza e data warehouse semantik me ontologji multidimensionale [44]

Përdoruesi mund të ndërtoj ontologji të integruara multidimensionale që përmbajnë analizën edhe dimensionet e nevojshme, të cilat merren nga ontologjitë që janë në përdorim. Ontologjitë këtu janë të shumëfishta dhe përdoren si vegël integruese për burimet e ndryshme. Ontologjia e integruar multidimensionale paraqet një nën bashkësi konsistente me të dhëna nga data warehouse semantik, e cila i mbulon kërkesat e analistit. Nga ana tjetër, kjo nën bashkësi me të dhëna përdoret për ndërtimin e kubit OLAP, i cili përdoret për analiza multidimensionale.

6.3 Rëndësia e aspektit semantik gjatë dizajnimit të proceseve ETL

Meqenëse kemi të bëjmë me dizajn konceptual të ETL, si fazë fillestare e ETL projektit është pasqyrimi i burimeve të dhënave dhe përshkrimit të transformimeve të atyre të dhënave me konceptet dhe të dhënat përkatëse në data warehouse. Për këtë arsye, është e nevojshme të identifikohen dhe analizohen aspektet semantike të burimeve të dhënave si dhe koncepteve në depon e të dhënave (data warehouse). Gjatë këtij procesi, janë bërë shumë propozime nga autor të ndryshëm që të përdoret teknologjia e Ueb-it semantik, pasi që kjo e tejkalon mënyrën manuale semantike në procesin ETL.

Si ide më adekuate për këtë qëllim, [45] sugjeron përdorimin e Ueb-it semantik për ETL, duke përdor ontologji globale për pasqyrimin e të gjitha regjistrimeve (të dhënat e ruajtura) që përfshihen në proces. Me këtë qasje, ontologjia e aplikacionit, e konstruktuar si model konceptual i domenit, i përgjigjet skemës globale dhe përshkrimet semantike e regjistrimeve, ku përfshihen klasat dhe tiparet/vetitë e definuara në ontologji, korrespondojnë me mënyrën e përshkrimit të skemës lokale. Por, zbatimi i ontologjisë, në vend të skemës globale, paraqet një model formal ku mund të aplikohen mekanizmat e arsyetimit automatik. Një tjetër qasje interesante do të ishte edhe metodologjia me përdorimin e kubit OLAP në Ueb-in semantik. Këtë

Page 75: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

65

teknikë tashmë e kanë aplikuar [46], duke përdorur një OLAP ontologji të përgjithshme e trajtuar si ontologji e sipërme për të gjithë kubet OLAP. Me këtë ontologji definohen vetëm konceptet e përgjithshme të OLAP, duke e bërë atë të pavarur nga sfera aplikative. Këtu, ontologjitë specifike për domenin konsiderohen si të jenë të bazuara në ontologjinë e sipërme. Ontologjitë e tilla janë definuar sipas koncepteve të përgjithshme që kanë definicione globale të shpërndara nëpër të gjitha ontologjitë specifike për domenin. Edhe kubet OLAP përshkruhen duke u bazuar në ontologjitë specifike të domenit dhe burimet e të dhënave definohen duke shfrytëzuar konceptet globale. Për të integruar të dhënat nga burimet e ndryshme e të shpërndara, aplikohet formatimi RDF i të dhënave dhe gjuha për pyetësorë RDF. Fillimisht, bëhet pasqyrimi i burimeve në ontologjitë RDF/OWL. Pastaj, përdoruesi e dizajnon strukturën e kubit OLAP, i cili më tutje konstruktohet sipas pyetësorëve RDF që lansohen në drejtim të burimeve të dhënave. Kubi OLAP paraqitet duke përdor RDF serializimin e XML. Në nivelin e instancës, rezultati i kombinuar nga pyetësorët paraqet instancën e kubit OLAP. Ajo që e bën të kufizuar këtë teknikë është nevoja e sigurimit të një teknologjie të përgjithshme për burimet e të dhënave si dhe çdo burim i të dhënave duhet të përshkruhet në nivelin e mjaftueshëm për t’u bërë i mundur pasqyrimi në formatin RDF.

Ekzistojnë edhe disa teknika të tjera të propozuara që diskutojnë mbi aspektet semantike gjatë proceseve ETL. Por, të gjitha këto e parashohin si të njohur burimin e të dhënave dhe skemat e synuara, duke e vendosur theksin në pasqyrimin nga burimi tek skemat, kështu që nevojat apo kërkesat afariste, të cilat mund të jenë dinamike e të panjohura paraprakisht, nuk merren parasysh. Për këtë qëllim, një studim i viteve të fundit [47] i merr në konsideratë edhe kërkesat afariste dhe burimet e të dhënave, duke vënë në dukje përpjekjen e përbashkët drejt identifikimit të skemës së synuar dhe transformimeve të duhura për realizimin e procesit ETL. Pas vërtetimit dhe kompletimit të kërkesës afariste krijohet relacion i saj me burimin e të dhënave me qëllim të pajisjes me shënime për ontologjinë e përgjithshme. Më tutje, konceptet karakterizohen ose si fakte ose si dimensione, respektivisht, vërtetohet principi i dizajnit multidimensional. Shënimet e grumbulluara përdoren për nxjerrjen e operatorëve për ndryshimin e skemës, siç janë: selektimi, projektimi, unioni, operatorët me bashkësi etj. Në hapin vijues, mund të shtohen transformime shtesë që bazohen ose në kërkesat funksionale të dhënave (p.sh. që të mos përsëriten konsumatorët më shumë se një herë), ose të bazuara në kërkesat standarde afariste (p.sh. zëvendësimi i çelësave me çelësa surrogat). Si hap i fundit, të gjitha rezultatet e nxjerra për secilën kërkesë individuale afariste bashkohen për të formuar dizajnin multidimensional përfundimtar dhe procesin ETL.

Page 76: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

66

6.4 Ndërlidhja e modeleve multidimensionale me SMEUS

Modelimi multidimensional paraqet një teknikë në fushën e data warehouse dhe në databaza në përgjithësi. Së pari është përdor nga Ralph Kimball në nivelin logjik [48] dhe më vonë nga Matteo Golfarelli në nivelin konceptual [49]. Disa propozime janë dhënë edhe nga [50]. Siç edhe përmendëm edhe më lartë, në qendër të këtij modeli qëndrojnë faktet dhe dimensionet. Modeli ka për qëllim të analizojë instancat e fakteve nga këndvështrime të ndryshme (dimensione). Instancat e fakteve mund të vendosen në hapësirë multidimensionale (boshtet e së cilës janë dimensionet), që njihet ndryshe si kubi i të dhënave. Pra, çdo instancë e fakteve identifikohet nga një pikë në çdo dimension të analizës. Një çështje me rëndësi gjatë modelimit multidimensional, paraqet edhe varshmëria funksionale. Pasi që dy instanca të ndryshme të fakteve nuk mund të vendosen në një pikë të njëjtë në hapësirën multidimensionale, detyrimisht një bashkësi me dimensione, e cila quhet baza multidimensionale, e përcakton nga ana funksionale atë fakt.

Figurë 29. Aspekti multidimensional dhe semantik i SMEUS

Sistemi SMEUS i paraqitur në Figurën 29 synohet të zgjerojë funksionalitetin e sistemit për testim ekstern dhe të jetë komplementar me të.

Duke u mbështetur në analizat dhe studimet e [49] dhe [50], propozimi jonë për nxjerrjen semantike nga hapësirat multidimensionale të dhënave nëpërmjet sistemit SMEUS bazohet në idenë e sistemeve të bazuara në Ueb që integrojnë dy burime të informacionit: (1) nga OLAP shfletuesi, i cili i nxjerr të dhënat nga data warehouse dhe (2) nga sistemi për menaxhimin e

OLAP

ETL

Databaza operacionale

Dokumente

Data warehouse

Ontologjia e përgjithshme

Elem

ente

Sem

antik

e Pë

rmba

jtje

tjera

m

ësim

ore

S M E U S

Menaxhimi i dokumenteve

OLAP shfletues

Page 77: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

67

dokumenteve, që mundëson qasje deri te të dhënat e pastrukturuara që ndodhen në databazën e dokumenteve. Duke e ditur natyrën e ndjeshme që mund ta kenë të dhënat arsimore, në veçanti rezultatet e testeve, karakterin heterogjen të dhënave dhe për ta mbajtur të përditësuar ontologjinë e përgjithshme, propozojmë që procesi ETL të realizohet dy herë. Pra, njëherë për formimin e data warehouse dhe së dyti, para integrimit të dhënave në ontologjinë e përgjithshme. Procesi i nxjerrjes së dokumenteve dhe kontrollit të qasjes te dokumentet, do të mundësohet nga sistemi i menaxhimit të dokumenteve, i cili do të mbështesë meta të dhëna të bazuara në RDF, kështu që të mund të shfrytëzojë ontologjinë e përgjithshme.

Në qendër të arkitekturës së propozuar ndodhet ontologjia e përgjithshme, e cila do ta përmbajë modelin e përgjithshëm të dhënave, dhe pasqyrimin e meta të dhënave nga sistemi i menaxhimit të dokumenteve dhe nga meta të dhënat që gjenerohen gjatë procesit të dytë të ETL. Përveç këtyre informacioneve, duhet të përfshihen edhe informacione për objektin e të mësuarit. Shumë nga këto objekte që gjinden nëpër data warehouse arsimore përdoren për nxjerrjen e dokumenteve të ndryshme të kësaj natyre. Këto objekte mund të krijohen apo përditësohen edhe në procesin e parë të ETL, përpara formimit të data warehouse.

Si hap i parë në drejtim të ndërtimit të ontologjisë do të jetë paraqitja e dimensioneve të kubit OLAP duke përdor skemën RDF dhe instancat e saj. Diagramet e skemave të RDF shpeshherë bëhet shumë komplekse dhe vështirë të lexueshme. Siç e kemi theksuar më parë, RDFS apo Resourse Description Framework Schema përdoret për të definuar hierarkitë e klasave dhe për të specifikuar tiparet apo vetitë e tyre si dhe relacionet ndërmjet tyre. Për këtë qëllim do të përdorim disa shkurtesa. Sipas modelit shumëdimensional të SMEUS të paraqitur në Figurën 24, modeli i të dhënave përbëhet nga 5 dimensione:

1. Studenti: me atributet (ID_studenti, Emri, Drejtimi, Klasa, Shkolla, Qyteti); 2. Mësimdhënësi: me atributet (ID_mësimdhënësi, Emri, Profili, Shkolla, Qyteti); 3. Testi: me atributet (ID_testi, Koha_testimit, Rezultati, Perqindja); 4. Lënda: me atributet (ID, Emri_lendes, Tipi); 5. Koha (ID_Koha, Data, Muaji, Semestri, Viti).

Këto dimensione mund ti quajmë edhe si objekte të mësuarit. Për të ndërtuar skemën e RDF për dimensionet Studenti dhe Testi, i përdorim këto deklarime namespace.

xmlns:rdf =” http://www.w3.org/1999/02/22-rdf-syntax-ns# “ xmlns:rdfs =” http://www.w3.org/2000/01/rdf-schema# “ s = http://www.smeus.com/semantika/schema# o = http://www.smeus.com/semantika/objekte/

Page 78: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

68

Figurë 30. RDF skema për OLAP dimensionet Studenti dhe Testi

Nga figura 30 shohim ndërlidhjen e vetive brenda një dimensioni si dhe ndërmjet dy dimensioneve. Shigjetat dy kahëshe nënkuptojnë se resursi i lidhur nga ana me një kokë e shigjetës është domeni. Rangu i vetive paraqitet me resursin (që duhet të jetë një rdf:Class) e lidhur me anën me dy koka të shigjetës. Vetitë në RDF (rdf:Property) janë instanca të klasave. Resursi rdf:range është një instancë e rdf:Property, që përdoret për shënuar se vlerat e vetive janë instanca të një apo më shumë klasave. Resursi rdf:objekt është instancë e rdf:property, që përdoret për shënuar objektin. Resursi rdf:type është një instancë e rdf:Property, që përdoret për të shënuar se resursi është instancë e një klase.

Përveç këtij notacioni, shigjeta normale (me një kokë) përdoret për nënklasat (rdf:subClassOf – është instancë e rdf:Property, që përdoret për të shënuar se të gjitha instancat e një klase janë instanca të një klase tjetër), dhe nënvetitë (rdf:subPropertyOf – është instancë e rdf:Property, që përdoret për të shënuar se të gjitha resurset që janë në relacion me një veti (property), janë në relacion edhe me një veti tjetër).

Kjo është paraqitur në Figurën 31, ku kemi bërë paraqitjen e skemës RDF për dimensionet Lënda dhe Mësimdhënësi.

Page 79: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

69

Figurë 31. RDF skema për OLAP dimensionet Lënda dhe Mësimdhënësi

Pas konfigurimit të përgjithshëm të meta të dhënave në këtë formë, si hap tjetër tepër me rëndësi është kërkimi i informacioneve apo resurseve relevante. Si alternativë më e thjeshtë për kërkim do të ishte formulimi i pyetësorëve për të nxjerrë të dhëna nga databaza e dokumenteve (që posedon meta të dhëna të bazuara në RDF). Por, procesi i formulimit të pyetësorëve, që si rezultat do të plotësonte kërkesat e shfrytëzuesve, do të mund të shoqërohet me gabime eventuale dhe vonesa. Kjo implikon nevojën e implementimit të një aplikacion/model për nxjerrje të informacioneve, i cili nga një proces kompleks me formulime pyetësorësh dhe jo gjithmonë të perfeksionuar, do të krijonte një proces ku në mënyrë të përkryer do të aplikohen të gjithë hapat e nxjerrjes së informacioneve: nxjerrjen e dokumenteve relevante për pyetësorin, dhe rangimin e tyre sipas nivelit të rëndësisë të dokumentit. Si model i këtillë mund të përdoret modeli i definuar nga [9].

Viteve të fundit, Sistemet e Inteligjencës Afariste dhe Ueb-i Semantik përbëjnë fusha me interes për hulumtim, në veçanti për projektimin apo dizajnimin e sistemeve informative. Shumë hulumtime kanë treguar se këto dy fusha, në një farë mënyre, janë komplementare. Siç kemi parë deri tani, është e natyrshme të kombinohet inteligjenca afariste (modelet multidimensionale dhe OLAP) me ueb-in semantik (ontologjitë). Në literaturë, janë bërë disa përpjekje për të definuar relacionin ndërmjet modeleve multidimensionale dhe ueb-it semantik, në veçanti ontologjive. Në studimin e [51], jepet një model RDF i kubit OLAP, duke i vënë rëndësi edhe diturive agregate. Ajo që paraqitet si kufizim në këtë studim është se dituritë nuk janë të bazuara në OWL dhe

Page 80: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

70

modelit RDF i mungojnë nivelet e dimensionit dhe hierarkitë ndërmjet dimensioneve. Aktualisht, për dallim nga numri i madh i studimeve për pasqyrimin e databazave relacionale në OWL ontologji, publikimet shkencore që paraqesin ontologji të plota për konceptet multidimensionale janë tepër të kufizuara.

Si sfidë bashkëkohore në fushën e Ueb-it semantik mbetet tranzicioni apo kalimi i inteligjencës afariste në të ashtuquajturën “inteligjencë e reve – cloud intelligence”, ku do të zbatohej potenciali i plotë i cloud computing. Sfidat e Ueb-it semantik konsistojnë në zbatimin e Ueb-it semantik për të arritur pavarësinë e lokacionit dhe pajisjes, duke e bërë inteligjencën si shërbim dhe duke i përshkallëzuar shërbimet e inteligjencës në një nivel global nëpërmjet teknikave për mbledhjen e burimeve apo resurseve të nevojshme sipas kërkesës, jo vetëm nga aspekti i fuqisë kompjuterike por edhe nga aspekti i burimit të dhënave.

Page 81: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

71

Kapitulli 7. Rezultatet e testimit

Në këtë hulumtim kemi bërë aplikimin e sistemit SMEUS, moduli i testimit elektronik, për të testuar 134 student të Informatikës dhe Ekonomikut, të cilët iu përkasin viteve të ndryshme të studimit. Janë marrë në studim studentë nga viti I, II dhe IV. Në tabelën e mëposhtme po japim shpërndarjen e studentëve të testuar.

Tabelë 4. Shpërndarja e studentëve për testim elektronik

Viti Numri i studentëve Përqindja sipas viteve

I 45 33.58 %

II 42 31.34 %

IV 47 35.07 %

Totali 134 100.00 %

Para inkuadrimit të studentëve në testimin klasik (bazuar në letër), të njëjtët i janë nënshtruar testimit elektronik pas një periudhe prej 3 muaj. Testi i ka përfshirë lëndët: Teknologjia Informative (drejtimi Biznes), E-biznes (drejtimi Biznes) dhe Softuer Sistemor (drejtimi Informatikë). Pas marrjes së rezultateve nga testimi elektronik dhe ai klasik, kemi bërë një analizë krahasuese si më poshtë.

Figurë 32. Rezultatet e testimit në përqindje në E-biznes – grupi A

0

20

40

60

80

100

120

1 2 3 4 5 6 7 8 9 10 11 12

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën E-biznes, gr. A

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 82: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

72

Në grafikun 32 janë paraqitur rezultatet e testimit në përqindje të testeve të studentëve nga grupi A në lëndën E-biznes. Sipas të dhënave të paraqitura në grafikun e sipërm rezulton se të gjithë studentët kanë rezultat më të lartë në testimin e kryer në formë elektronike në raport me testimin e kryer në formë klasike. Te shumica e studentëve vërehet një rritje e rezultateve me mbi 15% më shumë se në mënyrën e testimit në formë klasike.

Në figurën 33 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit B për të njëjtën lëndë. Nga grafiku vërehet qartë se nga 10 student, 8 student kanë përmirësim në rezultatet e testimit elektronik, 7 student prej më shumë se 10% dhe 1 student me një rritje të vogël, kurse 2 student të tjerë kanë një rënie të vogël prej më pak se 8% në testimin elektronik në raport me atë klasik.

Figurë 33. Rezultatet e testimit në përqindje në E-biznes – grupi B

Në figurën 34 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit C. Siç shihet nga grafiku nga 10 student, 9 student kanë rritje të rezultateve në testimin elektronik në raport me atë klasik, dhe 1 student ka konfirmim të rezultatit.

0102030405060708090

100

1 2 3 4 5 6 7 8 9 10

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën E-biznes, gr. B

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 83: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

73

Figurë 34. Rezultatet e testimit në përqindje në E-biznes – grupi C

Në figurën 35 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit D. Nga grafiku vërehet se te shumica e studentëve ka një rritje prej më shumë se 10% të rezultateve të testeve në formë elektronike në raport me testet në formë klasike. Prej 10 studentëve, 9 kanë rritje të rezultatit dhe 1 student ka konfirmim të rezultatit.

Figurë 35. Rezultatet e testimit në përqindje në E-biznes – grupi D

0

10

20

30

40

50

60

70

80

90

100

1 2 3 4 5 6 7 8 9 10

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën E-biznes, gr. C

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

0.00

10.00

20.00

30.00

40.00

50.00

60.00

70.00

80.00

90.00

100.00

1 2 3 4 5 6 7 8 9 10

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën E-biznes, gr. D

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 84: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

74

Në figurën 36 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit A nga lënda Teknologjia Informative. Nga grafiku vërehet se shumica e studentëve kanë një rezultat me mbi 20% më të madh të testimit elektronik në raport me testimin klasik.

Figurë 36. Rezultatet e testimit në përqindje në Teknologji Informative – grupi A

Në figurën 37 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit B. Nga grafiku mund të shohim se nga 10 student, 9 student kanë rritje të rezultatit prej të cilëve 6 student kanë një rritje më të madhe se 15%, kurse 1 student ka një ulje të vogël të rezultatit.

0.00

20.00

40.00

60.00

80.00

100.00

120.00

1 2 3 4 5 6 7 8 9 10

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Teknologjia Informative, gr. A

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 85: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

75

Figurë 37. Rezultatet e testimit në përqindje në Teknologji Informative – grupi B

Në figurën 38 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit C. Nga grafiku vërehet se prej 17 studentëve, 15 student kanë rritje të rezultateve dhe te 2 student ka ulje të rezultateve të testeve elektronike në raport me testet klasike.

Figurë 38. Rezultatet e testimit në përqindje në Teknologji Informative – grupi C

0.00

20.00

40.00

60.00

80.00

100.00

120.00

1 2 3 4 5 6 7 8 9 10

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Teknologjia Informative, gr.B

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

0.0010.0020.00

30.0040.00

50.0060.0070.00

80.0090.00

100.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Teknologjia Informative, gr.C

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 86: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

76

Në figurën 39 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit D. Nga grafiku vërehet se nga 18 student, 15 student kanë rritje të rezultateve të testimit elektronik në raport me testimin klasik dhe 3 student kanë ulje të vogël të rezultateve të testimit elektronik në raport me testimin klasik.

Figurë 39. Rezultatet e testimit në përqindje në Teknologji Informative – grupi D

Në figurën 40 janë paraqitur rezultatet në përqindje të testeve të studentëve të vitit IV, gr. A, nga lënda Softuer Sistemor. Nga grafiku vërehet se nga 23 student, 19 student kanë rritje të rezultateve të testimit elektronik, prej të cilëve 14 student kanë një rritje me mbi 20% të rezultateve të testimit elektronik në raport me testimin klasik, dhe 4 student kanë ulje të rezultateve të testimit elektronik prej të cilëve 1 student ka një ulje prej më shumë se 15%.

0.00

10.00

20.00

30.00

40.00

50.00

60.00

70.00

80.00

90.00

100.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Teknologjia Informative, gr.D

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 87: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

77

Figurë 40. Rezultatet e testimit në përqindje në Softuer Sistemor – grupi A

Në figurën 41 janë paraqitur rezultatet në përqindje të testeve të studentëve të grupit B nga e njëjta lëndë. Nga grafiku vërehet se nga 24 student, 15 student kanë rritje të rezultateve, 7 student kanë një ulje të vogël të rezultateve dhe 2 student kanë konfirmim të rezultateve të testeve elektronike për dallim nga testet klasike.

Figurë 41. Rezultatet e testimit në përqindje në Softuer Sistemor – grupi B

0.0010.0020.0030.0040.0050.0060.0070.0080.0090.00

100.00

1 2 3 4 5 6 7 8 9 1011121314151617181920212223

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Softuer Sistemor, gr.A

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

0.00

20.00

40.00

60.00

80.00

100.00

120.00

1 3 5 7 9 11 13 15 17 19 21 23

Përq

indj

a

Numri i studentëve

Testimi elektronik dhe klasik në lëndën Softuer Sistemor, gr.B

Perqindja e testeve ne forme elektronike

Perqindja e testeve ne forme klasike

Page 88: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

78

7.1 Diskutim mbi testimin me SMEUS

Në botën e arsimore, teknologjia e informacionit ka fituar një rol të rëndësishëm, jo vetëm në ngjarjet e përditshme, por teknologjia e informacionit është bërë tashmë vnjë pjesë vitale e procesit të arsimimit të studentëve. Për shkak të përfshirjes së teknologjisë në shoqëri, institucionet arsimore duhet të përgatisin student të pajisur me dituri solide edhe nga teknologjia. Në përgjithësi, studentët pëlqejnë të mësuarit elektronik sepse ai iu mundëson lloje të ndryshme të stileve të mësuarit. Studentët kanë avantazhin e të mësuarit në ritmin e tyre, e përshtatin të mësuarit elektronik në orarin e tyre të zënë. Nëse ata mbajnë një punë, ata përsëri mund të angazhohen në të mësuarit elektronik. Nëse studenti ka nevojë për të bërë të mësim gjatë natës, atëherë ky opsion është në dispozicion nga një lokacion që është i pavarur nga objektet arsimore. Duke i marrë parasysh nevojat e studentëve ky punim ndihmon në realizimin nevojave të tyre. Aplikacioni për mësim elektronik, përpos testimit të studentëve përfshin edhe furnizimin e tyre me materiale në formë elektronike në lëmi të ndryshme, mundësinë e komunikimit online me mësimdhënësit etj.

Sipas hulumtimit të kryer me studentët rezultoi se nga numri i përgjithshëm i studentëve të përfshirë në testim, mbi 80% e tyre kanë rritje të rezultateve në testimin e kryer në formë elektronike në krahasim me testimin e kryer në formë klasike.

Megjithatë, jo gjithmonë testimi elektronik e ilustron diturinë e vërtetë që e posedon studenti, në veçanti në shkencat ekzakte. Ashtu siç e kemi theksuar, në SMEUS është e mundur që studenti përpara se ti nënshtrohet testimit real, ai paraprakisht mund të bëj testim provues. Gjatë testimit provues dhe atij real, pyetjet gjenerohen në formë të rastësishme. Origjina e pyetjeve për të dy llojet e testimeve është databaza me pyetje. Kjo bën që gjatë testimit provues, ndonjëhere mund të shfaqen pyetje të njëjta me ato që do të paraqiten edhe në testimin real. Në këtë rast, sa më shumë testime provuese të realizoj një student, aq më shumë ai i zotëron pyetjet e vendosura në databazë. Si rrjedhim, testimi nuk do ta reflektojë diturinë e studentit për lëndën por diturinë e tij vetëm për sasinë e pyetjeve që ndodhen në databazë.

Page 89: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

79

Kapitulli 8. Teknologjia e SMEUS

Në këtë kapitull janë të paraqitura një pjesë e kodit të SMEUS, karakteristikat e databazës si dhe disa ndërfaqe me rëndësi.

8.1 Sqarimi i databazës Në vazhdim po japim një përshkrim të databazës e krijuar në MS SQL Server, më konkretisht secilën tabelë të krijuar për nevojat e sistemit SMEUS.

Tabela Users

Përdoret për krijimin e përdoruesve (administrator/student) Rolet përdoruesit i marrin duke u bazuar te fusha (roles), prej ku edhe ata identifikohen në aplikacion si përdorues apo administrator.

Figurë 42. Tabela për ruajtjen e të dhënave të përdoruesit.

Tabela Quiz_tblQsnCreationMaster

Përdoret për krijimin e pyetjeve me numrin e opsioneve dhe pikëve për secilën pyetje.

Figurë 43. Tabela për ruajtjen e pyetjeve të krijuara.

Page 90: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

80

Tabela Quiz_tblQsnCreationDetail

Kjo tabelë është në varësi nga tabela Quiz_tblQsnCreationMaster e cila është në relacion një-me-shumë. Në këtë tabelë regjistrohen vlerat e opsioneve për secilën pyetje.

Figurë 44. Tabela për ruajtjen e opcioneve të pyetjeve.

Tabela Quiz_tblQsnsLimitMaster

Kjo tabelë përdoret për krijimin e testeve, ku caktohet kohëzgjatja e testit.

Figurë 45. Tabela për ruajtjen e testeve.

Tabela Quiz_tblQsnsLimitDetail

Kjo tabelë është në varësi një-me-shumë me tabelën Quiz_tblQsnsLimitMaster. Këtu regjistrohen pyetjet e testit.

Figurë 46. Tabela për ruajtjen e pyetjeve për testet.

Page 91: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

81

Tabela Quiz_tblOnlineTest_Master

Tabelë e cila ruan rezultatet e testimit: Kohëzgjatjen, Pikët maksimale, Pikët e fituara, Emrin e studentit dhe Rezultatin në përqindje.

Figurë 47. Tabela për ruajtjen e rezultateve të testeve.

Tabela Quiz_tblOnlineTest_Detail

Është në varësi një-me-shumë me tabelën Quiz_tblOnlineTest_Master. Këtu ruhen përgjigjet e sakta të regjistruara nga mësimdhënësi dhe përgjigjet e dhëna nga studenti, pikët e çdo pyetje dhe pikët e marra për çdo pytje.

Figurë 48. Tabela për ruajtjen e përgjigjeve të dhëna nga përdoruesi.

Page 92: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

82

Me lidhjen e tabelave është krijuar diagrami për testimin elektronik i cili është paraqitur në vijim:

Figurë 49. Diagrami i bazës për testimin elektronik

Page 93: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

83

8.2 Ndërfaqja e sistemit SMEUS

8.2.1 Logimi

Figurë 50. Kontrolli për logim

Për tu loguar në aplikacion duhet sëpari të regjistrohemi. Nëse jemi tashmë të regjistruar në momentin kur klikojmë Log in bëhet verifikimi i username dhe password-it ku për qëllime sigurie krijojmë sesione për Username, Name dhe Roles. if ((UserName == Dr["Username"].ToString()) & (Password == Dr["Password"].ToString())) { Session["Username"] = Dr["Username"].ToString(); Session["Name"] = Dr["Name"].ToString(); Session["Roles"] = Dr["roles"].ToString(); boolReturnValue = true; Dr.Close(); return boolReturnValue; } Për qëllime sigurie përdoren sesionet të cilat ruajnë informacionin e përdoruesit gjatë gjithë kohës që është duke punuar në aplikacion. if (Session["Username"] != null) { name = Session["Name"].ToString(); loginView(name); } else

Page 94: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

84

{ Session.Abandon(); Response.Redirect("../Default.aspx"); } Në logjikën e testimit është përdorur i njëjti template me meny të ndryshme sipas roleve, kjo verifikohet si me metodën: protected void Login1_LoggedIn(object sender, EventArgs e) { if (adminRole == Session["Roles"].ToString()) Response.Redirect("administration/"); else if (studnetRole == Session["Roles"].ToString()) Response.Redirect("Student/"); else Session.Abandon(); } Nëse roli i përdoruesit është “a” e kemi këtë ndërfaqje:

Figurë 51. Menyja e Administratorit

Ndërsa nëse roli i përdoruesit është “u” e kemi këtë ndërfaqe:

Figurë 52. Menyja e studentit

Page 95: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

85

8.2.2 Ndërfaqja e administratorit Në ndërfaqen e administratorit shfaqen opsionet e krijimit të pyetjeve, vendosjen e materialeve të ndryshme mësimore, silabuseve. Nëpërmjet kësaj ndërfaqeje po ashut bëhet edhe regjistrimi i studentëve apo përdoruesve të rinj.

8.2.3 Insertimi i pyetjeve

Figurë 53. Insertimi i pyetjeve

protected void btnSubmit_Click(object sender, EventArgs e) { string sQsnDesc = "", sCorrectOptn = "", sOptns = "", stxtOption = "", sResult = ""; sQsnDesc = txtQsnDesc.Text.ToString().Trim().Replace("\r\n", "<br>"); if (btnSubmit.Text == "Submit") { sOptns = ddlOptions.SelectedValue.ToString().Trim(); if (rbtnOpt1.Checked == true) { sCorrectOptn = "Option1"; } else if (rbtnOpt2.Checked == true) { sCorrectOptn = "Option2"; }

Page 96: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

86

else if (rbtnOpt3.Checked == true) { sCorrectOptn = "Option3"; } else if (rbtnOpt4.Checked == true) { sCorrectOptn = "Option4"; } else if (rbtnOpt5.Checked == true) { sCorrectOptn = "Option5"; } sResult = SqlHelper.ExecuteNonQueryOutput(sCon, "PS_Quiz_QsnCreationMaster_Insert", sQsnDesc, sOptns, sCorrectOptn, txtMarks.Text, Session["Username"].ToString(), null); if ((sResult != "Error") && (sResult != "Duplicate")) { string[] sDResult = sResult.Split('~'); if (sDResult[1].Equals("Inserted")) { for (int i = 0; i < GrdOptions.Rows.Count; i++) { stxtOption = ((TextBox)GrdOptions.Rows[i].FindControl("txtText")).Text.ToString().Trim(); SqlHelper.ExecuteNonQuery(sCon, "PS_Quiz_QsnCreationDetail_Insert", sDResult[0].ToString(), (i + 1), stxtOption, "Admin"); } ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Pyetja u krijua me sukses.');location.href='CreateQuestion.aspx';", true); } } else if (sResult == "Duplicate") { ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Pyetja ekziston.');", true); return; }

Page 97: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

87

else if (sResult == "Error") { ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Gabim gjate krijimit te pyetjes.');", true); return; } } } Krijimi i pyetjeve në bazë bëhet përmes procedurës PS_Quiz_QsnCreationMaster_Insert në MS Sql Server. Insert Into Quiz_tblQsnCreationMaster (QuestionId, QsnDesc, NoOfOptions, CorrectOption, Marks, CreationloginId) Values (@RefID, @QsnDesc, @NoOfOptions, @CorrectOption, @Marks, @CreationloginId) Krijimi i opcioneve për secilën pyetje bëhet përmes procedurës PS_Quiz_QsnCreationDetail_Insert Insert Into Quiz_tblQsnCreationDetail (QuestionId, OptionValue, CreationloginId, optionorder) Values (@QuestionId, @OptionValue, @CreationloginId, @OptionOrder)

8.2.4 Përditësimi (update) i pyetjeve if (btnSubmit.Text.Equals("Update")) { if (rbtnOpt1.Checked == true) { sCorrectOptn = "Option1"; } else if (rbtnOpt2.Checked == true) { sCorrectOptn = "Option2"; }

Page 98: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

88

else if (rbtnOpt3.Checked == true) { sCorrectOptn = "Option3"; } else if (rbtnOpt4.Checked == true) { sCorrectOptn = "Option4"; } else if (rbtnOpt5.Checked == true) { sCorrectOptn = "Option5"; } sResult = SqlHelper.ExecuteNonQueryOutput(sCon, "PS_Quiz_QsnCreationMaster_Update", sQuestionIdUpd, sQsnDesc, sCorrectOptn, txtMarks.Text, Session["Username"].ToString(), null); if (sResult.Equals("Inserted")) { for (int i = 0; i < GrdOptions.Rows.Count; i++) { stxtOption = ((TextBox)GrdOptions.Rows[i].FindControl("txtText")).Text.ToString().Trim(); SqlHelper.ExecuteNonQuery(sCon, "PS_Quiz_QsnCreationDetailUpdate", sQuestionIdUpd, stxtOption, (i + 1)); } ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Pyetja u ndryshua me sukses.');location.href='CreateQuestion.aspx';", true); } else if (sResult == "Duplicate") { ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Pyetja ekziston.');", true); return; } else if (sResult == "Error") {

Page 99: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

89

ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Gabim gjate krijimit te pyetjes.');", true); return; } } }

Përditësimi (update) i pyetjeve në bazë bëhet përmes procedurës PS_Quiz_QsnCreationMaster_Update në MS Sql Server.

Update Quiz_tblQsnCreationMaster Set QsnDesc=@QsnDesc, CorrectOption = @CorrectOption, Marks = @Marks

Where DeletionStatus='U' And QuestionId=@QuestionId

Përditësimi (update) i opcineve për secilën pyetje bëhet përmes procedurës PS_Quiz_QsnCreationDetailUpdate. Update Quiz_tblQsnCreationDetail Set OptionValue=@OptionValue Where DeletionStatus='U' And QuestionId=@QuestionId And OptionOrder=@OptionOrder

8.2.5 Krijimi i testit

Figurë 54. Krijimi i testit

Page 100: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

90

protected void btnSubmit_Click(object sender, EventArgs e) { string sOutput = SqlHelper.ExecuteNonQueryOutput(sCon, "PS_Quiz_QsnLimitMaster_Insert", txtQuestionnaireName.Text.ToString().Trim(), ddlMin.SelectedValue.ToString(), Session["Username"].ToString(), null); if ((sOutput != "Duplicate") && (sOutput != "Error")) { string[] sData = sOutput.ToString().Split('~'); string sQsns = ""; string sQsnsQuot = ""; for (int i = 0; i < GrdQsns.Ro ës.Count; i++) { string sQsnId = GrdQsns.DataKeys[i].Values["QuestionId"].ToString(); CheckBox chkQsn = (CheckBox)GrdQsns.Rows[i].FindControl("chk"); if (chkQsn.Checked == true) { //sQsns += "'" + sQsnId + "',"; sQsnsQuot += "" + sQsnId + ","; } } if (sQsnsQuot != "") { //sQsns = sQsns.Substring(0, sQsns.Length - 1); sQsnsQuot = sQsnsQuot.Substring(0, sQsnsQuot.Length - 1); SqlHelper.ExecuteNonQuery(sCon, "PS_Quiz_QsnsLimitDetail_Insert", sData[1].ToString().Trim(), sQsnsQuot, "Admin"); } ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Testi u krijua me sukses.');location.href='CreateQuestionPaper.aspx';", true); } else if (sOutput.Equals("Error")) { ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Gabim gjate krijimit te testit.');", true); return; } else if (sOutput.Equals("Duplicate")) { ScriptManager.RegisterStartupScript(this, typeof(string), "Message", "alert('Testi ekziston.');", true);

Page 101: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

91

return; } } Krijimi i testit bëhet nëpërmjet procedurës PS_Quiz_QsnLimitMaster_Insert në MS Sql Server. Insert Into Quiz_tblQsnsLimitMaster (QsnId, QsnName, Durationoftest, CreationLoginId) Values (@RefID, @QsnName, @Durationoftest, @CreationLoginId) Zgjedhja e pyetjeve për test bëhet përmes procedurës PS_Quiz_QsnsLimitDetail_Insert Insert Into Quiz_tblQsnsLimitDetail (QsnId, QsnsManual, CreationLoginId) Values (@QsnId, @QsnsManual, @CreationLoginId)

8.2.6 Kodi për rezultatet e testimit Rezultatet e testimit ruhen në tabelën Quiz_tblOnlineTest_Master e cila ruan rezultatet e testimit duke përfshirë: kohëzgjatjen e testimit, pikët maksimale, pikët e fituara të studentëve, emrin e studentit dhe rezultatin në përqindje.

protected void BindResult(string Id) { SqlConnection MyConnection = ne ë SqlConnection(connStr); SqlCommand command = ne ë SqlCommand("Ps_Quiz_Result", MyConnection); command.CommandType = CommandType.StoredProcedure; SqlParameter myParm1 = command.Parameters.Add("@Test_id", SqlDbType.VarChar, 50); myParm1.Value = Id; MyConnection.Open(); SqlDataReader Dr; Dr = command.ExecuteReader(); ResultDataList1.DataSource = Dr; ResultDataList1.DataBind();

Page 102: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

92

}

Paraqitja e rezultateve bëhet përmes procedurës Ps_Quiz_Result në MS Sql Server.

select * from Quiz_tblOnlineTest_Master where QuesPaperId=@Test_id

8.2.7 Vlerësimi i studentëve

Në aplikacion vlerësimi është bërë në dy variante edhe në përqindje edhe me notë numerike. Nota numerike gjindet si fushë në tabelën për ruajtjen e rezultateve por vetëm është paraqitur në një Datalist, ku duke u bazuar në përqindjen nga pikët e testimit është bërë një krahasim prej ku kemi fituar edhe vlerësimin me notë numerike. Ky krahasim është bërë brenda një Datalist si në vijim: <%# System.Convert.ToDouble(DataBinder.Eval(Container.DataItem, "Percentage")) >= 90 ? "10" : System.Convert.ToDouble(DataBinder.Eval(Container.DataItem, "Percentage"))>=80 ? "9" : System.Convert.ToDouble(DataBinder.Eval(Container.DataItem, "Percentage"))>=70 ? "8" : System.Convert.ToDouble(DataBinder.Eval(Container.DataItem, "Percentage"))>=60 ? "7" : System.Convert.ToDouble(DataBinder.Eval(Container.DataItem, "Percentage"))>=50 ? "6":”5”%>

Page 103: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

93

8.2.8 Vendosja e materialeve në aplikacion Për vendosjen e materialeve në aplikacion është shfrytëzuar një UserControl në të cilën administratori ka mundësi të vendos dhe të fshijë materialet në formë elektronike, ndërsa studenti ka mundësi vetëm të leximit apo edhe të marrjes së materialeve elektronike.

Figurë 55. Vendosja e materialeve elektronike

8.3 Ndërfaqja e testimit

Testi është i mundshëm vetëm për studentët të cilët janë të regjistruar në aplikacion. Regjistrimi është paraparë të bëhet nga ana e administratorit për shkak të mos keqpërdorimit të aplikacionit. Studentët pasi të regjistrohen atëherë do të kenë mundësi të testohen në testin të cilin e ka lejuar mësimdhënësi. Studentët kanë të drejtë të testohen vetëm njëherë në lëmin e caktuar. Për çdo testim është paraparë edhe kohëzgjatja e tij e duhur. Ndërfaqja e testit është paraqitur në vijim:

Page 104: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

94

Figurë 56. Forma e testit

8.4 Ndërfaqja eKonsultime

Aspekti i komunikimit në relacionin student-mësimdhënës është paraparë të jetë në formë të një forumi privat, ku është dizajnuar qasje e veçantë për mësimdhënës dhe student. Ndërfaqja është realizuar ashtu që mësimdhënësi pasi të futet në sistem me shifrat e tij personale, i tregohet lista me mesazhe të palexuara, të radhitura sipas lëndës dhe datës së mbërritjes së mesazhit. Studenti pasi të futet në sistem mund të zgjedh nga lista e mësimdhënësve për ti konsultuar apo dërguar porosi, pastaj e selekton edhe lëndën të cilën e zhvillon mësimdhënës. Edhe studenti edhe mësimdhënësi, menjëherë pas futjes në sistem mund ti hetojë mesazhet e palexuara dhe të lexuara, të cilat i janë dërguar nga një mësimdhënës i caktuar.

Page 105: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

95

Figurë 57. Kontrolli i logimit për student

Figurë 58. Kontrolli i logimit për mësimdhënës

Page 106: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

96

Figurë 59. Faqja e studentit

Pasi që të jetë loguar me sukses studenti, faqja fillestare e tij do të duket me këto elemente: 1) logoja e aplikacioni; 2) linku për dalje; 3) porosia/mesazhi i ri i pa lexuar akoma; 4) porosi tashmë të lexuara; 5) butoni për fshirje të porosive, nëse paraprakisht selektohen; 6) lidhje të cilat çojnë deri te pjesa për të shkruar një mesazh të ri (për mësimdhënësin e caktuar); 7) lidhja për te pjesa e formimit të porosisë së re.

Figurë 60. Faqja e mësimdhënësit

Page 107: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

97

Figurë 61. Faqja e krijimit të porosisë për studentin

Figurë 62. Faqja e leximit të porosisë për mësimdhënësin

Page 108: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

98

9. REFERENCAT

[1] D. Harman. Information Retrieval: Data Structures and Algorithms, chapter Ranking Algorithms, pages 363–392. Prentice-Hall, Englewood Cliffs, 1992

[2] Gruber, T., 1993: Toward principles for the design of ontologies used for knowledge sharing. International Journalof Human-Computer Studies, special issue on Formal Ontology in Conceptual Analysis and Knowledge Representation. Eds,Guarino, N. & Poli , R.

[3] H. Baazaoui-Zghal, M.-A. Aufaure, R. Soussi “Towards an on- Line Semantic Information Retrieval System based on Fuzzy Ontologies”, Journal of Digital Information Management, vol. 6, issue 5, pp 375-385, October, 2008

[4] Lopez, V., Uren, V., Motta, E. and Pasin, M. “AquaLog: An ontology-driven question answering system for organizational semantic intranets” (2007) Journal of Web Semantics, 5, 2, pp. 72-105, Elsevier

[5] G. Pasi, “Flexible Information Retrieval: some research trends”, Mathware and Soft Computing, Vol IX, number 9-1, pp. 107-121, 2002.

[6] White, R.W., Marchionini, G. and Muresan, G. Evaluating exploratory search systems Introduction. Inf. Process. Management 44, 2 (2008)

[7] The S M A R T Information Retrieval Project, C. Buckley, G. Salton, J. Allan, Department of Computer Science , Cornell University, Ithaca , N Y, 14853. 1993 ACL Anthology

[8] S. Robertson. On the history of evaluation in IR. Journal of Information Science, 34 (4):439–456, 2008a

[9] Baeza Yates, R., & Ribeiro Neto, B. (1999). Modern Information Retrieval. Harlow, UK: Addison-Wesley.

[10] Croft, W. B., & Harper, D. J. (1993). Knowledge-based and statistical approaches to text retrieval. IEEE Expert: Intelligent Systems and their Applications , 8(2):8-12.

[11] William S. Cooper. Getting beyond boole. Reading in Information Retrieval. pp 265-267, 1997 [12] Fabio Crestani, Mounia Lalmas, Cornelis J. Van Rijsbergen, and Ian Campbell. Is this dokument

relevant? Probably: a survey of probabilistic models in information retrieval. ACM comp. Surv. 30(4): 528-552, 1998.

[13] Stephen E. Robertson. The probability ranking principe in IR. Readings in information retrieval, pages 281-286, 1997.

[14] Stephen E. Robertson and Karen Sparck Jones. Relevance weighting of search terms. Journal of the American Society of Information Science. 27: 129-146, 1976.

[15] Norbert Fuhr. Probabilistic models in information retrieval. The computer journal. 35(3): 243-255, 1992.

[16] Singhal Amit. Modern Information Retrieval: A brief overview. In IEEE Data Engineering Bulletin 24(4), pages 35-43, 2001.

[17] John F. Sowa. Knowledge representation: logical, philosophical and computational foundations. Brooks/Cole Publishing Co., Pacific Grove, CA, USA, 2000.

[18] Asuncion Gomez-Perez, Mariano Fernandez Lopez, and Oscar Corcho. Ontological Engineering. Springer-Verlag 2004.

[19] Nicola Guarino and Pierdaniele Giaretta. Ontologies and knowledge bases: towards a terminological clarification. Amsterdam, April 1995. 2nd International conference on building and sharing very large scale knowledge bases, Ensche, IOS press.

[20] Nicola Guarino. Formal ontology and information systems. Formal ontologies in Information Systems, 3-15, Trento, Italy, 1998. 1st International conference on Formal Ontologies in Information Systems. FQIS’98. IOS press.

[21] Ora Lassila and Deborah McGuinness, The role of frame based represantation on the semantik web. Technical report kls-01-02. Stanford University, California, 2001.

Page 109: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

99

[22] Oscar Corcho, Mariano Fernandez Lopes, and Asuncon Gomez-Perez. Methodologies, tools and languages for building ontologies: where is their meeting point? Data knowl. 46(1): 41-64, 2003.

[23] Robert MacGregor. Inside the llom description classifier. SIGART Bull., 2(3): 88-92, 1991. [24] Maedche, A., Staab, S., Stojanovic, N., Studer, R., & Sure, Y. (2003). SEmantic portAL: The

SEAL Approach. Spinning the Semantic Web. MIT Press , 317-359 [25] Som N. (2006). E-Learning - A Guidebook of Principles, Procedures and Practices. Aishi Creative

Workshop, H-4/6/1, Flat No. 302, Bengali Colony, Mahavir Enclave, New Delhi-110 045. [26] Romiszowski, A. (2004). How’s the e-learning baby? Factors leading to success or failure of an

educational technology innovation, Educational Technology, 44(1), January-February, 5-27. [27] Jennex, M. E. (2005). What is KM? International Journal of Knowledge Management, 1(4), i-iv [28] Churchman, C. W. (1979). The systems approach. New York: Dell Publishing. [29] Alavi, M., & Leidner, D. E. (2001). Review: Knowledge management and knowledge management

systems: Conceptual foundations and research issues. MIS Quarterly, 25(1), 107-136 [30] Jennex, M. E., & Olfman, L. (2002). Organizational memory/knowledge effects on productivity, a

longitudinal study. In Proceedings of the 35th Hawaii International Conference on System Sciences.

[31] Murray E. Jennex (2007). Knowledge Management in Modern Organizations. San Diego University, USA: Idea Group Publishing.

[32] Rosenberg, Marc J. (2001).E-learning strategies for delivering knowledge in the digital age: McGraw-Hill Professional.

[33] E-learning Essentials. Online education delivery methods: Types of e-learning. Retrieved February 13th, 2006 from http://www.worldwidelearn.com/elearning-essentials/elearning-types.htm

[34] Lee Ann Obringer, “How E-learning Works”, Oct.2001, URL: http://www.howstuffworks.com/elearning1.htm Konsultuar më 10.04.2013

[35] Naeve,A.,Nilsson,M., &Palmer,M. (2001), E-learning in the semantic age. CID., Centre For User Oriented It Design. Stockhom, Sweden.

[36] S. Chaudhuri, U.Dayal, and V. Narasayya, An overview of business intelligence technology, Communications of the ACM, vol. 54, no. 8, August 2011, pp 88-98

[37] Simitsis, A., Skoutas, D., & Castellanos, M. (2010). Representation of conceptual ETL designs in natural language using Semantic Web technology. Data & Knowledge Engineering, 69(1), 96-115.

[38] Kiryakov, A., Popov, B., Terziev, I., Manov, D., & Ognyanoff, D. (2004). Semantic annotation, indexing, and retrieval. Web Semantic, 2(1), 49-79.

[39] Spahn, M., Kleb, J., Grimm, S., & Scheidl, S. (2008). Supporting business intelligence by providing ontology-based end-user information self-service. In Proceedings of the first international workshop on Ontology-Supported Business Intelligence (pp. 1-12). Karlsruhe, Germany: ACM. doi:10.1145/1452567.1452577

[40] Sell, D., Silva, D. C. D., Beppler, F. D., Napoli, M., Ghisi, F. B., Pacheco, R. C. S., & Todesco, J. L. (2008). SBI: A semantic framework to support business intelligence. In Proceedings of the First International Workshop on Ontology-Supported Business Intelligence (pp. 1-11). Karlsruhe, Germany: ACM. doi:10.1145/1452567.1452578

[41] [Capra & Marchionini 2008] Capra, R. and Marchionini, G. The relation browser tool for faceted exploratory search. In Proc. JCDL08, ACM Press (2008), 420-420.

[42] [Elmqvist & al. 2008] Elmqvist,N., Dragicevic, P., Fekete, J.-D. Rolling the Dice: Multidimensional Visual Exploration using Scatterplot Matrix Navigation. In IEEE Transactions on Visualization and Computer Graphics (Proc. InfoVis 2008).

[43] Romero, O., & Abelló, A. (2010b). A framework for multidimensional design of data warehouses from ontologies. Data & Knowledge Engineering, 69(11), 1138-1157

[44] Nebot, V., Berlanga, R., Pérez, J., Aramburu, M., & Pedersen, T. (2009). Multidimensional integrated ontologies: A framework for designing semantic data warehouses. Journal of Data Semantics. SpecialIssue on Semantic Data Warehouses, 13, 1-36.

[45] Lenzerini, M. (2002). Data integration:Atheoretical perspective. In Proceedings of the Twenty-first

Page 110: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

100

ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems (PODS), (pp. 233-246).

[45] Niemi, T., Toivonen, S., Niinimäki, M., & Num-menmaa, J. (2007). Ontologies with Semantic Web/Grid in data integration for OLAP. International Journal on Semantic Web and Information Systems, 3(4), 25-49.

[45] Romero, O., & Abelló, A. (2010a). Automatic validation of requirements to support multidimensional design. Data & Knowledge Engineering, 69(9), 917-942.

[45] Kimball, R. (1996). The data warehouse toolkit: Practical techniques for building dimensional data warehouses. John Wiley.

[45] Golfarelli, M., Maio, D., & Rizzi, S. (1998). The dimensional fact model: A conceptual model for data warehouses. International Journal of Cooperative Information Systems, 7(2-3), 215-247.

[45] T. Niemi and M. Niinimäki, “Ontologies and summarizability in OLAP”, Proc. of SAC’10, Sierre, Switzerland, March 2010.

[45] Sell, D., Silva, D. C. D., Beppler, F. D., Napoli, M., Ghisi, F. B., Pacheco, R. C. S., & Todesco, J. L. (2008). SBI: A semantic framework to support business intelligence. In Proceedings of the First International Workshop on Ontology-Supported Business Intelligence (pp. 1-11). Karlsruhe, Germany: ACM. doi:10.1145/1452567.1452578

[45] [Capra & Marchionini 2008] Capra, R. and Marchionini, G. The relation browser tool for faceted exploratory search. In Proc. JCDL08, ACM Press (2008), 420-420.

[46] [Elmqvist & al. 2008] Elmqvist,N., Dragicevic, P., Fekete, J.-D. Rolling the Dice: Multidimensional Visual Exploration using Scatterplot Matrix Navigation. In IEEE Transactions on Visualization and Computer Graphics (Proc. InfoVis 2008).

[47] Romero, O., & Abelló, A. (2010b). A framework for multidimensional design of data warehouses from ontologies. Data & Knowledge Engineering, 69(11), 1138-1157

[48] Nebot, V., Berlanga, R., Pérez, J., Aramburu, M., & Pedersen, T. (2009). Multidimensional integrated ontologies: A framework for designing semantic data warehouses. Journal of Data Semantics. SpecialIssue on Semantic Data Warehouses, 13, 1-36.

[49] Lenzerini, M. (2002). Data integration:Atheoretical perspective. In Proceedings of the Twenty-first ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems (PODS), (pp. 233-246).

[50] Torsten Priebe, Günther Pernul , Ontology-based Integration of OLAP and Information Retrieval, Proceedings. 14th International Workshop on Database and Expert Systems Applications, 2003

[51] Niemi, T., Toivonen, S., Niinimäki, M., & Nummenmaa, J. (2007). Ontologies with Semantic Web/Grid in data integration for OLAP. International Journal on Semantic Web and Information Systems, 3(4), 25-49.

Page 111: Doktoratura Fisnik Dalipi, Fakulteti i Shkencave i Natyrore

101

Abstrakti

Me qëllim të zvogëlimit të kostos për gjetjen e informacioneve dhe arritjes së rezultateve relevante, imponohet nevoja e ndërtimit të pyetësorëve kompleks, e kjo natyrisht që paraqet një sfidë serioze. Në këtë tezë, fillimisht, ne bëjmë përshkrimin dhe analizën e zhvillimit të teknologjive për nxjerrje të informacioneve duke i sqaruar në detaje disa nga modelet apo algoritmet më të zbatuara siç janë modeli Boolean, probabilistik dhe modeli i hapësirave vektoriale duke e trajtuar edhe metrikën e vlerësimit të tyre. Janë sqaruar dhe propozuar edhe alternativa algoritmike të reja për zbatimin e modelit të hapësirave vektoriale për kërkimin e informacioneve të bazuar në procesin e indeksimit. Me qëllim të menaxhimit dhe nxjerrjes së informacioneve apo diturive semantike nga databazat e mëdha apo nga burimet heterogjene të informacioneve, kemi bërë paraqitjen e disa teknologjive të bazuar në ontologji. Zbatimi i kërkimit semantik nga mjediset e shpërndara dhe heterogjene paraqet një koncept të ri dhe teknologjitë e kërkimit apo nxjerrjes së informacionit të bazuara në ontologji janë shumë hipotetike, duke mos pasur të definuar një kornizë të qëndrueshme për zbatimin e kërkimit sipas ontologjive në ueb-in si tërësi, i cili përbëhet nga një numër i pakufizuar i domeneve. Për të ilustruar këtë teknikë të aplikimit të kërkimit semantik për sistemet e Inteligjencës Afariste, në këtë punim, kemi ndërtuar një sistem informativ nga fusha E-learning. Në sistemin tonë kemi përfshirë aplikimin e testimit elektronik apo E-testing, mbi bazën e të cilit do të analizojmë dhe propozojmë mundësinë e zgjerimit të funksionalitetit të tij për të mbështetur teknikat e nxjerrjes së informacioneve të bazuara në ontologji.

Fjalët kyçe: Nxjerrja e informacioneve, ontologji, kërkim semantik, Inteligjenca Afariste.

Abstract

In order to reduce the cost for finding information and achieve relevant results there is a need to build a very complex query which indeed is a serious challenge. In this thesis, we describe and analyze the evolution of information retrieval technologies by explaining the details of most widely used models and their evaluation metrics. These models include: Boolean model, probabilistic model and vector space model. We explain and propose new algorithmic alternatives for applying vector space model for index-based search. In order to manage and extract information or semantic knowledge form large databases or from heterogeneous information sources, we survey some ontology-based technologies. Semantic retrieval from distributed and heterogeneous environments is quite new concept and current ontology based retrieval technologies are very hypothetical, without having any well defined framework on applying ontology based search to the web as whole, which is consisted by unlimited number of domains. Here, we analyze and illustrate the methodology of applying semantic search for Business Intelligence (BI) systems by designing a new prototype information system from the field of E-learning. In our system we have included E-testing application; based on our application, we will analyze and propose the possibility of extending its functionalities in order to support ontology-based information retrieval. Keywords: Information Retrieval, ontology, semantic search, Business Intelligence.