ترجمه ماشینی مبتنی بر آنتولوژی

33
1 Click to edit Master title style Click to edit Master subtitle style ی ن ی ش ه ما م ج ر ت ی وژ ل و ت ن ر آ ت ی ن ی ب مOntology based translation machine ی س د ب ه م کده ش ن دآ ر ت و ت) ی م روه کا گ ی ی ا ب ع م اوژی وب ن ف گاه ش ن ما ژ آ د ی آژش س ا ب ش اژ کاژ ب ی م س آژش ر گ

Upload: jody

Post on 21-Jan-2016

103 views

Category:

Documents


2 download

DESCRIPTION

دانشکده مهندسی گروه کامپیوتر آزمایشگاه فناوری وب معنایی گزارش سمینار کارشناسی ارشد. ترجمه ماشینی مبتنی بر آنتولوژی. Ontology based translation machine. به نام خدا. فهرست مطالب. مقدمه آنتولوژی وب معنایی ترجمه ماشینی ترجمه معنایی نتیجه گیری مراجع. 1. مقدمه- جایگاه و ضرورت. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: ترجمه ماشینی مبتنی بر آنتولوژی

1

Click to edit Master title style

Click to edit Master subtitle style

ترجمه ماشینی

مبتنی بر

آنتولوژیOntology based translation machine

دانشکده مهندسیگروه کامپیوتر

آزمایشگاه فناوری وب معناییگزارش سمینار کارشناسی ارشد

Page 2: ترجمه ماشینی مبتنی بر آنتولوژی

2 1

فهرست مطالب

مقدمه•

آنتولوژی•

وب معنایی•

ترجمه ماشینی•

ترجمه معنایی•

نتیجه گیری •

مراجع•

به نام خدا

Page 3: ترجمه ماشینی مبتنی بر آنتولوژی

3 2

مقدمه- جایگاه و ضرورت

نانو تکنولوژی • بیوتکنولوژی• تکنولوژی اطالعات•علوم شناختی • و...روباتیک و هوش مصنوعی •

ترجمه ماشینی •

زبان متفاوت در دنیا وجود 6809بیش از

دارد

239زبان از این تعداد فقط در قاره اروپا

استفاده می شود.

زبان متفاوت را 2196قاره آسیا

داراست.

Page 4: ترجمه ماشینی مبتنی بر آنتولوژی

4 3

آنتولوژی- تاریخچه

ریشه آغازین این واژه از فلسفه یونان گرفته شده که البته پس از مدتها در • فالسفه آلمانی آن را در مورد هستان شناسی و مطالعه چیستی به 19قرن

. کار برده اند • Human = Rational sensitive animate material Substance

Page 5: ترجمه ماشینی مبتنی بر آنتولوژی

5 4

آنتولوژی - تعاریف رسمی

• Ontology is a term in philosophy and its meaning is ``theory of existence''.

• Ontology is an explicit specification of conceptualization.

• Ontology is a body of knowledge describing some domain, typically

common sense knowledge domain.

مطرح کرده است و به طور کلی مورد Thomas Gruber تعریف دوم را که آقای•پذیرش دانشمندان هوش مصنوعی می باشد که در مورد آنتولوژی برای استفاده

در فنون مهندسی کاربردی تر می باشد

Page 6: ترجمه ماشینی مبتنی بر آنتولوژی

6 5

آنتولوژی

• Person A: "what is the last document you read ?"

• Person B: "the article Gruber wrote on ontology in 1993."

The syllogism "a article is a book" "a book is a document" so "a article is a document

بهره برداری غیر مبهم از آنتولوژی در واقع پیشنهاد دهنده یک ساختار مفید برای .ستداده ها

Page 7: ترجمه ماشینی مبتنی بر آنتولوژی

7 6

وب معنایی – اجزاء

Page 8: ترجمه ماشینی مبتنی بر آنتولوژی

8 7

وب معنایی

وب معنQایی در واقQع فضQایی از جنس •

محاسQبات QهوشQمند QاسQت کQهQ درQ آن

کتابخانQه هQا ،QدانQش نامQه هQا ،Q روQزنامQه

هQا وQ QسQایQرQ منQابQع دانشQ ، می توQاننQد

Q ر ازQاخبQب ،QدیگرQیک QاییQمعنQ یQواQمحت

.و یکدQیگر راQ درک نمQایند شدQه

Page 9: ترجمه ماشینی مبتنی بر آنتولوژی

9 8

ترجمه ماشینی– تاریخچه

دوره آغازین

زبان بر می گردد و ابتدا با معرفی یک 17ایده اصلی ترجمه ماشین به قرن

توسط رنه دکارت)ریاضیدان و فیلسوف 1629. در سال شروع شد ساختگی

فرانسوی(

دوره رخوت

رام بQه این خQاطر کQه طراحQان و محققQان این رشQته ، متوجQه 1970-1960در دهQه

گردید. Qرخوت و Qسستی QاQین مسQئله شدند، Qدچار QنشدنQی بودن

دوره حیات مجدد

خQوبی روبQرو شQدند و هزینQه هQا بهبQود سیسQتم هQا بQاسQخت افQزار کQه 80در اوایQل دهQه

QهQوبارQد Q،کردQ پیدا QاهشQک ،QوعیQه نQم بQهQ QریQیگیQه پQب QآمدعالقهQ ودQهم بوجQ Qموضوع.

Page 10: ترجمه ماشینی مبتنی بر آنتولوژی

10 9

دسته بندی - ترجمه ماشینی

مستقیم - غیر مستقیمواسط انتقال دهنده زبان میانی – سراسریدامنه محلی - دامنه

MATMAT

MTMT

HAMTHAMT MAHTMAHT

Page 11: ترجمه ماشینی مبتنی بر آنتولوژی

11 10

انواع ترجمه ماشینی - ترجمه ماشینی

Rule basedسیستم های ترجمه مبتنی بر قاعده •

Knowledge based سیستم های ترجمه مبتنی بر دانش•

سیستم های ترجمه مبتنی بر مجموعه نوشتجات•

Corpus based

Example basedمبتنی بر نمونه)مثال( •

Statistical مبتنی بر روشهای آماری•

Hybrid MT سیستم های ترکیبی•

Page 12: ترجمه ماشینی مبتنی بر آنتولوژی

12 11

مبتنی بر روشهای آماری - ترجمه ماشینی

اربردQتفاده از کQا اسQه بQد کQعی دارنQاری سQای آمQه هQاریترجمQای آمQد هQر روی متQب ،

دانشنامه های دو زبانی ترجمه هایی را تولید نمایند . اریQه روش آمQینی بQه ماشQزار ترجمQرم افQاولین ن CANDID رکتQاز ش IBM بود .

Google الها ازQرای سQب SystranردQتفاده می کQال . اسQبر سQهای 2007 از اکتQه روشQب

.آماری روی آورد

ئلهQک مسQورت یQه صQه بQئله ترجمQه مسQع بQین در واقQادگیری ماشQد یQورد می کنQبرخ.

، انQط انسQده توسQام شQای انجQه هQق ترجمQی دقیQک کالم بررسQا در یQیوه کلی آنهQش

آموQختن آQن Qو سپسQ ارایهQ ترجمQه Qبر اسQاQس آQموQزشQ Qهای QمرحلهQ قبل میQ باشQد .

Page 13: ترجمه ماشینی مبتنی بر آنتولوژی

13 12

ترجمه مبتنی بر نوشتجات نمونه - ترجمه ماشینی

Case base reasoning ی استقیاساستنتاج مبتنی بر •

شامل یک پیکره به حد کافی بزرگ دو زبانی است که از تعداد زیادی نمونه و ترجمه نظیر آن تشکیل شده است

برای یافتن شبیه ترین عبارات به عبارت ورودیانطباقیک الگوریتم 1( برای تولید ترجمه هر یک از عبارا ت مرحله قبلانتقالیک الگوریتم 2( برای اتصال عبارات ترجمه شده شده به ترکیب مجددیک الگوریتم 3(

یکدیگر

Page 14: ترجمه ماشینی مبتنی بر آنتولوژی

14 13

ترجمه آنالین - ترجمه ماشینی

Page 15: ترجمه ماشینی مبتنی بر آنتولوژی

15 14

ارزیابی سیستم های ترجمه - ترجمه ماشینی

به عنوان قدیمی ترین روش می توان از قضاوت انسانی استفاده •

کرد .

BLEU

NIST

F-Score

METEOR

Page 16: ترجمه ماشینی مبتنی بر آنتولوژی

16 15

ترجمه ماشینیBleuبه روش ارزیابی -

در این معیار ارزیابی، میزان همبستگی باال میان متن تولید شده توسط ماشین، و متن ترجمه شده توسط انسان به صورت کمی، مورد بررسی

قرار گرفته است.

m در این فرمول تعداد کلماتی از عبارت کاندید است که در عبارت :مرجع نیز وجود دارد .

M.تعداد کل کلماتی است که در عبارت کاندید ظاهر شده است :

M

mP

NISTبه روش ارزیابی -

برای BLEU می باشد، با این تفاوت که در مدل BLEUدارای الگوریتمی مشابه الگوریتم

گرمی، وزن یکسانی فرض شده است در حالیکه در این روش کلمات nهر کلمه مرکب

مرکب چند گرمی بر اساس تعداد تکرارشان در متن وزن دهی می شوند.

Page 17: ترجمه ماشینی مبتنی بر آنتولوژی

17 16

F-Scoreبه روش ارزیابی - ترجمه ماشینی

برای محاسبه دقت به صورت زیر محاسبه می شوند: p(precision) , r(recall) دو پارامتر

p .برابر است با تعداد نتایج صحیح، تقسیم بر تعداد کل نتایج برگشت داده شده

r.برابر است با تعداد نتایج صحیح، تقسیم بر تعداد نتایجی که باید برگشت داده می شد

در حالت کلی به ازای عدد نامنفی بتا داریم:

Page 18: ترجمه ماشینی مبتنی بر آنتولوژی

18 17

ترجمه معنایی

ایQع از مزایQا . این روش در واقQد دادن معنQود در پیونQای موجQه داده هQب

را در زبQان دوم معQادل و هم معنQا لغتنامQه بهQره می گQیرد تQا بتوانQد واژه

.پیدا نماید

هQا را بQه معنQت کQات این روش این اسQاص یکی از ملزومQکلی خQه شQن

s زبQان مبQدا و نQه در قQالب زبQان مقصQد بQه گونQه ای می کند.بQاز نمQایی لزومQا رایQا بQوژی هQود در آنتولQات موجQام از امکانQع ابهQد رفQای تولیQه هQدر ترجم

شده بهره می گیرد. مثال رابطه معادل بودن.

Page 19: ترجمه ماشینی مبتنی بر آنتولوژی

19 18

ترجمه معنایی Mikrokosmosسیستم

Page 20: ترجمه ماشینی مبتنی بر آنتولوژی

20 19

ترجمه معنایی Mikrokosmosسیستم

معماری سیستم برای تحلیل متون ورودی

خروجی مرحله تحلیل، یک بازنمایی معنایی، از متن

یک ساختار نوشته شده به زبان مبدا است که بوسیله

ارایه می گردد.TMR مستقل با نام

Page 21: ترجمه ماشینی مبتنی بر آنتولوژی

21 20

سه سطح اول نمودار سلسله مراتبی آنتولوژی :

Object ،Event ،Property

ترجمه معنایی Mikrokosmosسیستم

Page 22: ترجمه ماشینی مبتنی بر آنتولوژی

22 21

ترجمه معنایی – نقش آنتولوژی

El grupo Roche adquirio Docteur Andreu

.آموختند“یا ”تملک کردند“ ” راDocteur Andreuگروه روشه

adquirio دارای دو معنای ACQUIRE و LEARN

در آنتولوژی بر روی مفاهیم محدودیت های انتخابی ،ACQUIRE و LEARN

مشخص کننده این نکته هستند که اگر موضوع عبارت یک شی انتزاعی

Abstract Object نیست معنی واژه adquirio عبارت ”تملک کردن“ است و

نه“ آموختن“.

بعد از اینکه نامDocteur Andreu شی ء )یک یک شرکت به عنوان نام

نبوده و Abstract Objectمعلوم می گردد که یک ( شناسایی شد .اجتماعی

.انتخاب می گرددتملک کردند لذا معنی

Page 23: ترجمه ماشینی مبتنی بر آنتولوژی

23 22

ترجمه معنایی Mikrokosmosسیستم

نمایش فریم مفهومACQUIRE به

همراه نمایش بخشی از رکورد فعل اسپانیایی

‘adquirir ’ در لغتنامه با نگاشت معنایی با

ACUIRE , LERAN

Page 24: ترجمه ماشینی مبتنی بر آنتولوژی

24 23

Micrososmosترجمه معنایی-ویژگیهای سیستم

و مستقل از زبان مبدا می باشدسمبولیکبازنمای معنایی به صورت

پیچیده سازماندهی می کند.سلسله مراتبی سمبولها را در یک ساختار

اشتراک گذاری دانشیک لغتنامه مشترک برای زبانهای مختلف جهت به ،

فراهم نماید.

و تولید کننده مبدا امکان به اشتراک گذاری دانش برای تحلیلگر زبان

را فراهم آورد. مقصد زبان

را ذخیره نماید.محدودیت های انتخابی

بین ببرد و بوسیله استنتاج هایی که از روی را ازابهامات معنایی

توپولوژی انجام می دهد میزان شباهت معنایی را تفسیر نماید .

Page 25: ترجمه ماشینی مبتنی بر آنتولوژی

25 24

ترجمه معنایی مبتنی بر نوشتجات ترجمه معنایی-نمونه

بQه نمونQه هQای موجQود در روش RDFایQده اصQلی: اضQافه کQردن اطالعQات -

EBMT

مزایا :-

میان متن و ترجمهعبارات همتراز یافتن

افزودن معنا به نمونه ها ی ترجمه

رفع ابهام

 مثال : دو جمله زیر در پایگاه نمونه ها موجود است

Große Besonderheiten ↔ important peculiarities Große Städte ↔ big cities

große Schlößer سوال : ترجمه عبارت زیر چیست:

Page 26: ترجمه ماشینی مبتنی بر آنتولوژی

26 25

ترجمه معنایی مبتنی بر نوشتجات ترجمه معنایی-نمونه

Important peculiarities

Big cities

große Schlößer

Big castle

Page 27: ترجمه ماشینی مبتنی بر آنتولوژی

27 26

چالشهای سیستم های ترجمه معنایی ترجمه معنایی-

باال بودن هزینه و زمان اجرای پروژه های ترجمه به طور کلی•

حجم باالی اندازه پایگاه دانش زبان های طبیعی•

ابهام در انتخاب یک قطعه به حد کافی مناسب از دانش•

عدم وجود آنتولوژی مناسب برای بسیاری از زبانهای دنیا•

چالشهای مربوط به مسئله انطباق آنتولوژی ها•

•...

Page 28: ترجمه ماشینی مبتنی بر آنتولوژی

28 27

نتیجه گیری

است.موضوعاتی است که در پنجاه سال اخیرپیچیده ترین فرآیند ترجمه، یکی از •از یک سو به خصوصیات سیستمی است که ترجمه کننده مطلوب سیستم های •

توجه داشته طرف دیگر به مسئله درک معانی، ازساختاری زبان های طبیعی و . باشد

مبتنی بر قواعد زبانی ، مبتنی بر نوشتجات عموما سیستم های مترجم فعلی •.می باشندنمونه و ترجمه ماشینی مبتنی بر روشهای آماری،

هر کدام از این روشها دارای نقاط قوت و ضعف اساسی می باشند:s زیادی موجود استمبتنی بر قواعد در روشهایی • پیچیدگی نسبتابه اندازه زیادی وابسته به حجم پایگاه مبتنی بر نوشتجات نمونه قدرت روشهای •

نوشتجات نمونه ای است که عمل استنتاج با توجه به آنها صورت می گیرد.مبتنی بر روشهای آماری در حال حاضر، بهترین عملکرد مربوط به سیستم های •

می شود که در سالهای اخیر هم مورد استفاده ماشینهای ترجمه آنالین از قبیل google .قرار گرفته است

Page 29: ترجمه ماشینی مبتنی بر آنتولوژی

29 28

نتیجه گیری

با این وجود، یکی از چالشهایی که همچنان شالوده این معماری و همه •عدم توجه به معنا روشهای مرسوم، با آن دست به گریبانند، موضوع

و مفاهیم درون متن می باشد.

مهمترین و شاخص ترین دست آورد مربوط به کاربرد آنتولوژی ها، •از میان است که می تواند موجب استنتاج هایی آنتولوژیکی موضوع

در تشخیص معنا گردد. اهمیت این موضوع آنجا روشنتر می رفتن ابهام گردد که دیگر روشهای آماری و گرامری نتوانند ابهام هایی را رفع

کنند که تنها راه تشخیص آن توجه به مفاهیم و معانی باشد.

Page 30: ترجمه ماشینی مبتنی بر آنتولوژی

30 29

مراجع

• [RYC 2007] Rychtyckyj, N, “Machine Translation for Manufacturing”: AI Magazine Vol 28 No 3, 2007.

• [Slo1985] Sloculn, J, “Survey of Machine Translation, Its History, Current Status and Future Prospects”: Computational Linguistics, Volume 11, No 1, 1985

• [BAR 2007] Bar, K, Chueka, Y, Dershowitz, N, “An Arabic to English Example-based Translation System”: ICTIS, 2007

• [LOP 2008] Lopez, A, “Statistical Machine Translation”: ACM Computing Surveys, Vol. 40, No. 3, 2008.

• [HUT 2007] Hutchins, J, “Machine Translation: aconcise history”: InComputer Aided Translation: Theory and Practice, C. S. Wai, Ed. Chinese University of Hong Kong, 2007

• [MAH 1996] Mahesh, K, “Ontology Development for Machine Translation: Ideology and Methodology”: Technical report, Computer Research Laboratory, New Mexico State University, 1996.

• [HAH 2005] Hahn, W, “Knowledge Representation in Machine Translation”: Technical report, Computer Science Department, University of Hamburg, 2005

Page 31: ترجمه ماشینی مبتنی بر آنتولوژی

31 30

مراجع

• [VER 2004] Vertan, C, “Language Resources for the Semantic Web – perspectives for Machine Translation”: Proceedings of the Second International Workshop on Language Resources for Translation Work, Research and Training, Coling. Geneva.37:42, 2004

• [GAN 2002] Gandon, F, “Ontology Engineering: A survey and a return on experience”, ACACIA Team, Rapport de Recherche 2002

• [ABT 2007] Rasoolian, A, ”Antology Matching”, BC Degree Thesis in Computer Faculty of Sharif University, 2007

• [OBT 2007] Obitko, M., “Translations between Ontologies in Multi-Agent Systems”, Ph.D. dissertation, Faculty of Electrical Engineering, Czech Technical University in Prague, 2007.

• [BER 2001] Berners-Lee, T, Hendler, J, Lassila, O, "The Semantic Web: Scientific American," Scientific American, pp. 34-43, 2001.

• [AND 2004] Anderson, S, “How many languages are there in the world?” Linguistic Society of America. 1325 18th St, NW, Suite 211 Washington, D.C. 2004

• [CAR 2003] A-Way, and Carl, M. “Introduction to Example-based machine Translation”, Kluwer Academic Press, 2003

Page 32: ترجمه ماشینی مبتنی بر آنتولوژی

32 31

مراجع

• [PAP 2002] Papineni, K, Roukos, S, Ward, T and Zhu, W. J. "BLEU: a method for automatic evaluation of machine translation" in ACL-2002: 40th Annual meeting of the Association for Computational Linguistics pp. 311–318

• [HUT 1992] Hutchins, W. John; and Harold L. Somers (1992). An Introduction to Machine Translation. London: Academic Press. P 107

Page 33: ترجمه ماشینی مبتنی بر آنتولوژی

33 با سپاس از شما32