számítógépes nyelvi adatbázisok a magyarórán · az e-szókincs projekt nyelvi adatbázis...

33
Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közrem ˝ uködtek Összegzés S ZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint [email protected] Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöll ˝ o, 2006. április 10-12.

Upload: others

Post on 04-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

A MAGYARÓRÁN

Sass Bá[email protected]

Magyar Tudományos AkadémiaNyelvtudományi Intézet

Korpusznyelvészeti Osztály

XVI. MANYE kongresszusGödöllo, 2006. április 10-12.

Page 2: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

1 AZ E-SZÓKINCS PROJEKT

CélkituzésKeretrendszer

2 NYELVI ADATBÁZIS

Nyelvi „eroforrások”Bemutató

3 ELEKTRONIKUS TANANYAG

A tananyag elkészítéseA tananyag szerkezetePéldák

Page 3: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

1 AZ E-SZÓKINCS PROJEKT

CélkituzésKeretrendszer

2 NYELVI ADATBÁZIS

Nyelvi „eroforrások”Bemutató

3 ELEKTRONIKUS TANANYAG

A tananyag elkészítéseA tananyag szerkezetePéldák

Page 4: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

CÉLKIT UZÉS

Kortárs szépirodalmi nyelvi adatbázis éshozzá kapcsolódó elektronikus tananyag

Jellemzoknyelvészetileg releváns kereshetoségkvantitatív vizsgálatokmodern nyelvtechnológiai eszköztár bemutatása

Page 5: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

KERETRENDSZER

SDT (Sulinet Digitális Tudásbázis) kezdeményezés

Cél: 12 évfolyamra kiterjedo, teljes tantervet lefedoelektronikus tananyag létrehozása

Bárki által szerkesztheto, továbbfejlesztheto

Szaklektorálás→ ún. értékes közkincs

Zárt egészet alkotó, szabadon kombinálhatótananyagelemek

Témák > foglalkozások > „lapok”

http://sdt.sulinet.huSulinet Digitális Tudásbázis

Page 6: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

AZ SDT NYITÓLAPJA

Page 7: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

EGY SDT-S TANANYAGRÉSZ

Page 8: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

1 AZ E-SZÓKINCS PROJEKT

CélkituzésKeretrendszer

2 NYELVI ADATBÁZIS

Nyelvi „eroforrások”Bemutató

3 ELEKTRONIKUS TANANYAG

A tananyag elkészítéseA tananyag szerkezetePéldák

Page 9: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

NYELVI „ EROFORRÁSOK”

Szövegtár20 millió szavasmorfológiailag elemzett korpusz

http://corpus.nytud.hu/e-szokincs/szovegtar

Alaktani táblázatokadott szó összes lehetséges ragozott alakjaigei és névszói paradigmák megállapításaElekfi László Magyar Ragozási Szótára alapján

http://corpus.nytud.hu/e-szokincs/alaktan

Gyakorisági listákszóalak / szóto / szófaj szerintadott kötet / szerzoi életmu / teljes korpusz tekintetében

http://corpus.nytud.hu/e-szokincs/gyakorisag

Page 10: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

NYELVI „ EROFORRÁSOK”

Szövegtár20 millió szavasmorfológiailag elemzett korpusz

http://corpus.nytud.hu/e-szokincs/szovegtar

Alaktani táblázatokadott szó összes lehetséges ragozott alakjaigei és névszói paradigmák megállapításaElekfi László Magyar Ragozási Szótára alapján

http://corpus.nytud.hu/e-szokincs/alaktan

Gyakorisági listákszóalak / szóto / szófaj szerintadott kötet / szerzoi életmu / teljes korpusz tekintetében

http://corpus.nytud.hu/e-szokincs/gyakorisag

Page 11: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

NYELVI „ EROFORRÁSOK”

Szövegtár20 millió szavasmorfológiailag elemzett korpusz

http://corpus.nytud.hu/e-szokincs/szovegtar

Alaktani táblázatokadott szó összes lehetséges ragozott alakjaigei és névszói paradigmák megállapításaElekfi László Magyar Ragozási Szótára alapján

http://corpus.nytud.hu/e-szokincs/alaktan

Gyakorisági listákszóalak / szóto / szófaj szerintadott kötet / szerzoi életmu / teljes korpusz tekintetében

http://corpus.nytud.hu/e-szokincs/gyakorisag

Page 12: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

NYELVI „ EROFORRÁSOK”

Szövegtár20 millió szavasmorfológiailag elemzett korpuszhttp://corpus.nytud.hu/e-szokincs/szovegtar

Alaktani táblázatokadott szó összes lehetséges ragozott alakjaigei és névszói paradigmák megállapításaElekfi László Magyar Ragozási Szótára alapjánhttp://corpus.nytud.hu/e-szokincs/alaktan

Gyakorisági listákszóalak / szóto / szófaj szerintadott kötet / szerzoi életmu / teljes korpusz tekintetébenhttp://corpus.nytud.hu/e-szokincs/gyakorisag

Page 13: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - SZÖVEGTÁR

Page 14: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - SZÖVEGTÁR

Page 15: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - SZÖVEGTÁR

Page 16: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - SZÖVEGTÁR

Page 17: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - ALAKTANI TÁBLÁZATOK

Page 18: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - ALAKTANI TÁBLÁZATOK

Page 19: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

BEMUTATÓ - GYAKORISÁGI LISTÁK

Page 20: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A GYAKORISÁGI TÁBLÁZATOK HASZNÁLATA

Tamási Áron és Kálnoky László szavaiTamási Áronnál: a kötoszavak (mint, ha, vagy stb.) sokkalritkábbakleggyakoribb igék: van, mond↔ van, tudKálnoky Lászlónál: nagyobb szókincs

Nemes Nagy Ágnes két muvének leggyakoribb foneveiSzó és szótlanság: vers, szó, költo, kép, költészetAz aranyecset: kéz, szem, ecset, ember, nap

Page 21: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

1 AZ E-SZÓKINCS PROJEKT

CélkituzésKeretrendszer

2 NYELVI ADATBÁZIS

Nyelvi „eroforrások”Bemutató

3 ELEKTRONIKUS TANANYAG

A tananyag elkészítéseA tananyag szerkezetePéldák

Page 22: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG ELKÉSZÍTÉSE

Több mint 24 tanórányi anyag

Gyakorló magyarszakos pedagógusok munkája

Magyarázatok, feladatok, tesztsorok

http://sdt.sulinet.huSulinet Digitális Tudásbázis (2006. tavaszától ??)

Page 23: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 24: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 25: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 26: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 27: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 28: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

A TANANYAG SZERKEZETE

Az adatbázisok használatának leírása

Fejezetek az alaktan és a mondattan körébol

Hangalak és jelentés

Nyelvváltozás

Nyelvhelyesség

Helyesírás

Page 29: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

TIPIKUS FELADATÖSSZETETT MONDATOK– SZÖVEGTÁRHASZNÁLAT – 9. ÉVF

1 Keressen ki a szövegtárból összetett példamondatokat azalábbi módon!

2 Legyen az elso keresett szó valamelyik kötoszó!pl.: hogy, és, is, vagy, akár, de, bár, ám, noha, mert, ezért,így, emiatt, mint, mintha stb.

3 A példamondatok közül válassza ki azokat, amelyekbenvalóban tagmondatokat köt össze a beírt kötoszó!Határozza meg az összetétel fajtáját!

4 Figyelje meg, hogy a példamondatokban gyakran csakszavakat vagy szószerkezeteket köt össze az illetokötoszó, tehát ha kötoszavakra keresünk rá, akkor nemtalálunk automatikusan összetett mondatokat.

Page 30: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

TIPIKUS FELADATBIRTOKVISZONY – ALAKTANI TÁBLÁZATOK HASZNÁLATA – 9. ÉVF

1 Az alaktani táblázatokból keresse ki különbözo névszókbirtokos alakjait.pl.: szó, fül, ház, olvasó, apa

2 Ezekbol válassza külön a ragos és a jeles alakokat!3 Jelölje meg közülük az egyalakú illetve a többalakú

toldalékokat!4 Van-e a birtokviszonyt kifejezo toldalékok között

többjelentésu?

Page 31: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

KÖZREMUKÖDTEK

PedagógusokCsábi DomonkosHamza ÁgnesKulin ÁgnesSzucs GáborTilless Béláné

Számítógépes nyelvészekVáradi Tamás (osztályvezeto)Nagy ViktorOravecz CsabaSass Bálint

Page 32: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

ÖSSZEGZÉS

A bemutatott nyelvi eroforrások az interneten keresztülhasználhatók.http://corpus.nytud.hu/e-szokincs

Az SDT-be integrált tananyag 2006. tavaszától (??) leszelérheto. http://sdt.sulinet.hu

A tapasztalatokról várjuk visszajelzé[email protected]

Köszönöm a figyelmet!

Page 33: Számítógépes nyelvi adatbázisok a magyarórán · Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködte˝ k Összegzés SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Az E-Szókincs projekt Nyelvi adatbázis Elektronikus tananyag Közremuködtek Összegzés

ÖSSZEGZÉS

A bemutatott nyelvi eroforrások az interneten keresztülhasználhatók.http://corpus.nytud.hu/e-szokincs

Az SDT-be integrált tananyag 2006. tavaszától (??) leszelérheto. http://sdt.sulinet.hu

A tapasztalatokról várjuk visszajelzé[email protected]

Köszönöm a figyelmet!