ترجمه ماشینی مبتنی بر آنتولوژی
DESCRIPTION
دانشکده مهندسی گروه کامپیوتر آزمایشگاه فناوری وب معنایی گزارش سمینار کارشناسی ارشد. ترجمه ماشینی مبتنی بر آنتولوژی. Ontology based translation machine. به نام خدا. فهرست مطالب. مقدمه آنتولوژی وب معنایی ترجمه ماشینی ترجمه معنایی نتیجه گیری مراجع. 1. مقدمه- جایگاه و ضرورت. - PowerPoint PPT PresentationTRANSCRIPT
1
Click to edit Master title style
Click to edit Master subtitle style
ترجمه ماشینی
مبتنی بر
آنتولوژیOntology based translation machine
دانشکده مهندسیگروه کامپیوتر
آزمایشگاه فناوری وب معناییگزارش سمینار کارشناسی ارشد
2 1
فهرست مطالب
مقدمه•
آنتولوژی•
وب معنایی•
ترجمه ماشینی•
ترجمه معنایی•
نتیجه گیری •
مراجع•
به نام خدا
3 2
مقدمه- جایگاه و ضرورت
نانو تکنولوژی • بیوتکنولوژی• تکنولوژی اطالعات•علوم شناختی • و...روباتیک و هوش مصنوعی •
ترجمه ماشینی •
زبان متفاوت در دنیا وجود 6809بیش از
دارد
239زبان از این تعداد فقط در قاره اروپا
استفاده می شود.
زبان متفاوت را 2196قاره آسیا
داراست.
4 3
آنتولوژی- تاریخچه
ریشه آغازین این واژه از فلسفه یونان گرفته شده که البته پس از مدتها در • فالسفه آلمانی آن را در مورد هستان شناسی و مطالعه چیستی به 19قرن
. کار برده اند • Human = Rational sensitive animate material Substance
5 4
آنتولوژی - تعاریف رسمی
• Ontology is a term in philosophy and its meaning is ``theory of existence''.
• Ontology is an explicit specification of conceptualization.
• Ontology is a body of knowledge describing some domain, typically
common sense knowledge domain.
مطرح کرده است و به طور کلی مورد Thomas Gruber تعریف دوم را که آقای•پذیرش دانشمندان هوش مصنوعی می باشد که در مورد آنتولوژی برای استفاده
در فنون مهندسی کاربردی تر می باشد
6 5
آنتولوژی
• Person A: "what is the last document you read ?"
• Person B: "the article Gruber wrote on ontology in 1993."
The syllogism "a article is a book" "a book is a document" so "a article is a document
بهره برداری غیر مبهم از آنتولوژی در واقع پیشنهاد دهنده یک ساختار مفید برای .ستداده ها
7 6
وب معنایی – اجزاء
8 7
وب معنایی
وب معنQایی در واقQع فضQایی از جنس •
محاسQبات QهوشQمند QاسQت کQهQ درQ آن
کتابخانQه هQا ،QدانQش نامQه هQا ،Q روQزنامQه
هQا وQ QسQایQرQ منQابQع دانشQ ، می توQاننQد
Q ر ازQاخبQب ،QدیگرQیک QاییQمعنQ یQواQمحت
.و یکدQیگر راQ درک نمQایند شدQه
9 8
ترجمه ماشینی– تاریخچه
دوره آغازین
زبان بر می گردد و ابتدا با معرفی یک 17ایده اصلی ترجمه ماشین به قرن
توسط رنه دکارت)ریاضیدان و فیلسوف 1629. در سال شروع شد ساختگی
فرانسوی(
دوره رخوت
رام بQه این خQاطر کQه طراحQان و محققQان این رشQته ، متوجQه 1970-1960در دهQه
گردید. Qرخوت و Qسستی QاQین مسQئله شدند، Qدچار QنشدنQی بودن
دوره حیات مجدد
خQوبی روبQرو شQدند و هزینQه هQا بهبQود سیسQتم هQا بQاسQخت افQزار کQه 80در اوایQل دهQه
QهQوبارQد Q،کردQ پیدا QاهشQک ،QوعیQه نQم بQهQ QریQیگیQه پQب QآمدعالقهQ ودQهم بوجQ Qموضوع.
10 9
دسته بندی - ترجمه ماشینی
مستقیم - غیر مستقیمواسط انتقال دهنده زبان میانی – سراسریدامنه محلی - دامنه
MATMAT
MTMT
HAMTHAMT MAHTMAHT
11 10
انواع ترجمه ماشینی - ترجمه ماشینی
Rule basedسیستم های ترجمه مبتنی بر قاعده •
Knowledge based سیستم های ترجمه مبتنی بر دانش•
سیستم های ترجمه مبتنی بر مجموعه نوشتجات•
Corpus based
Example basedمبتنی بر نمونه)مثال( •
Statistical مبتنی بر روشهای آماری•
Hybrid MT سیستم های ترکیبی•
12 11
مبتنی بر روشهای آماری - ترجمه ماشینی
اربردQتفاده از کQا اسQه بQد کQعی دارنQاری سQای آمQه هQاریترجمQای آمQد هQر روی متQب ،
دانشنامه های دو زبانی ترجمه هایی را تولید نمایند . اریQه روش آمQینی بQه ماشQزار ترجمQرم افQاولین ن CANDID رکتQاز ش IBM بود .
Google الها ازQرای سQب SystranردQتفاده می کQال . اسQبر سQهای 2007 از اکتQه روشQب
.آماری روی آورد
ئلهQک مسQورت یQه صQه بQئله ترجمQه مسQع بQین در واقQادگیری ماشQد یQورد می کنQبرخ.
، انQط انسQده توسQام شQای انجQه هQق ترجمQی دقیQک کالم بررسQا در یQیوه کلی آنهQش
آموQختن آQن Qو سپسQ ارایهQ ترجمQه Qبر اسQاQس آQموQزشQ Qهای QمرحلهQ قبل میQ باشQد .
13 12
ترجمه مبتنی بر نوشتجات نمونه - ترجمه ماشینی
Case base reasoning ی استقیاساستنتاج مبتنی بر •
شامل یک پیکره به حد کافی بزرگ دو زبانی است که از تعداد زیادی نمونه و ترجمه نظیر آن تشکیل شده است
برای یافتن شبیه ترین عبارات به عبارت ورودیانطباقیک الگوریتم 1( برای تولید ترجمه هر یک از عبارا ت مرحله قبلانتقالیک الگوریتم 2( برای اتصال عبارات ترجمه شده شده به ترکیب مجددیک الگوریتم 3(
یکدیگر
14 13
ترجمه آنالین - ترجمه ماشینی
15 14
ارزیابی سیستم های ترجمه - ترجمه ماشینی
به عنوان قدیمی ترین روش می توان از قضاوت انسانی استفاده •
کرد .
BLEU
NIST
F-Score
METEOR
16 15
ترجمه ماشینیBleuبه روش ارزیابی -
در این معیار ارزیابی، میزان همبستگی باال میان متن تولید شده توسط ماشین، و متن ترجمه شده توسط انسان به صورت کمی، مورد بررسی
قرار گرفته است.
m در این فرمول تعداد کلماتی از عبارت کاندید است که در عبارت :مرجع نیز وجود دارد .
M.تعداد کل کلماتی است که در عبارت کاندید ظاهر شده است :
M
mP
NISTبه روش ارزیابی -
برای BLEU می باشد، با این تفاوت که در مدل BLEUدارای الگوریتمی مشابه الگوریتم
گرمی، وزن یکسانی فرض شده است در حالیکه در این روش کلمات nهر کلمه مرکب
مرکب چند گرمی بر اساس تعداد تکرارشان در متن وزن دهی می شوند.
17 16
F-Scoreبه روش ارزیابی - ترجمه ماشینی
برای محاسبه دقت به صورت زیر محاسبه می شوند: p(precision) , r(recall) دو پارامتر
p .برابر است با تعداد نتایج صحیح، تقسیم بر تعداد کل نتایج برگشت داده شده
r.برابر است با تعداد نتایج صحیح، تقسیم بر تعداد نتایجی که باید برگشت داده می شد
در حالت کلی به ازای عدد نامنفی بتا داریم:
18 17
ترجمه معنایی
ایQع از مزایQا . این روش در واقQد دادن معنQود در پیونQای موجQه داده هQب
را در زبQان دوم معQادل و هم معنQا لغتنامQه بهQره می گQیرد تQا بتوانQد واژه
.پیدا نماید
هQا را بQه معنQت کQات این روش این اسQاص یکی از ملزومQکلی خQه شQن
s زبQان مبQدا و نQه در قQالب زبQان مقصQد بQه گونQه ای می کند.بQاز نمQایی لزومQا رایQا بQوژی هQود در آنتولQات موجQام از امکانQع ابهQد رفQای تولیQه هQدر ترجم
شده بهره می گیرد. مثال رابطه معادل بودن.
19 18
ترجمه معنایی Mikrokosmosسیستم
20 19
ترجمه معنایی Mikrokosmosسیستم
معماری سیستم برای تحلیل متون ورودی
خروجی مرحله تحلیل، یک بازنمایی معنایی، از متن
یک ساختار نوشته شده به زبان مبدا است که بوسیله
ارایه می گردد.TMR مستقل با نام
21 20
سه سطح اول نمودار سلسله مراتبی آنتولوژی :
Object ،Event ،Property
ترجمه معنایی Mikrokosmosسیستم
22 21
ترجمه معنایی – نقش آنتولوژی
El grupo Roche adquirio Docteur Andreu
.آموختند“یا ”تملک کردند“ ” راDocteur Andreuگروه روشه
adquirio دارای دو معنای ACQUIRE و LEARN
در آنتولوژی بر روی مفاهیم محدودیت های انتخابی ،ACQUIRE و LEARN
مشخص کننده این نکته هستند که اگر موضوع عبارت یک شی انتزاعی
Abstract Object نیست معنی واژه adquirio عبارت ”تملک کردن“ است و
نه“ آموختن“.
بعد از اینکه نامDocteur Andreu شی ء )یک یک شرکت به عنوان نام
نبوده و Abstract Objectمعلوم می گردد که یک ( شناسایی شد .اجتماعی
.انتخاب می گرددتملک کردند لذا معنی
23 22
ترجمه معنایی Mikrokosmosسیستم
نمایش فریم مفهومACQUIRE به
همراه نمایش بخشی از رکورد فعل اسپانیایی
‘adquirir ’ در لغتنامه با نگاشت معنایی با
ACUIRE , LERAN
24 23
Micrososmosترجمه معنایی-ویژگیهای سیستم
و مستقل از زبان مبدا می باشدسمبولیکبازنمای معنایی به صورت
پیچیده سازماندهی می کند.سلسله مراتبی سمبولها را در یک ساختار
اشتراک گذاری دانشیک لغتنامه مشترک برای زبانهای مختلف جهت به ،
فراهم نماید.
و تولید کننده مبدا امکان به اشتراک گذاری دانش برای تحلیلگر زبان
را فراهم آورد. مقصد زبان
را ذخیره نماید.محدودیت های انتخابی
بین ببرد و بوسیله استنتاج هایی که از روی را ازابهامات معنایی
توپولوژی انجام می دهد میزان شباهت معنایی را تفسیر نماید .
25 24
ترجمه معنایی مبتنی بر نوشتجات ترجمه معنایی-نمونه
بQه نمونQه هQای موجQود در روش RDFایQده اصQلی: اضQافه کQردن اطالعQات -
EBMT
مزایا :-
میان متن و ترجمهعبارات همتراز یافتن
افزودن معنا به نمونه ها ی ترجمه
رفع ابهام
مثال : دو جمله زیر در پایگاه نمونه ها موجود است
Große Besonderheiten ↔ important peculiarities Große Städte ↔ big cities
große Schlößer سوال : ترجمه عبارت زیر چیست:
26 25
ترجمه معنایی مبتنی بر نوشتجات ترجمه معنایی-نمونه
Important peculiarities
Big cities
große Schlößer
Big castle
27 26
چالشهای سیستم های ترجمه معنایی ترجمه معنایی-
باال بودن هزینه و زمان اجرای پروژه های ترجمه به طور کلی•
حجم باالی اندازه پایگاه دانش زبان های طبیعی•
ابهام در انتخاب یک قطعه به حد کافی مناسب از دانش•
عدم وجود آنتولوژی مناسب برای بسیاری از زبانهای دنیا•
چالشهای مربوط به مسئله انطباق آنتولوژی ها•
•...
28 27
نتیجه گیری
است.موضوعاتی است که در پنجاه سال اخیرپیچیده ترین فرآیند ترجمه، یکی از •از یک سو به خصوصیات سیستمی است که ترجمه کننده مطلوب سیستم های •
توجه داشته طرف دیگر به مسئله درک معانی، ازساختاری زبان های طبیعی و . باشد
مبتنی بر قواعد زبانی ، مبتنی بر نوشتجات عموما سیستم های مترجم فعلی •.می باشندنمونه و ترجمه ماشینی مبتنی بر روشهای آماری،
هر کدام از این روشها دارای نقاط قوت و ضعف اساسی می باشند:s زیادی موجود استمبتنی بر قواعد در روشهایی • پیچیدگی نسبتابه اندازه زیادی وابسته به حجم پایگاه مبتنی بر نوشتجات نمونه قدرت روشهای •
نوشتجات نمونه ای است که عمل استنتاج با توجه به آنها صورت می گیرد.مبتنی بر روشهای آماری در حال حاضر، بهترین عملکرد مربوط به سیستم های •
می شود که در سالهای اخیر هم مورد استفاده ماشینهای ترجمه آنالین از قبیل google .قرار گرفته است
29 28
نتیجه گیری
با این وجود، یکی از چالشهایی که همچنان شالوده این معماری و همه •عدم توجه به معنا روشهای مرسوم، با آن دست به گریبانند، موضوع
و مفاهیم درون متن می باشد.
مهمترین و شاخص ترین دست آورد مربوط به کاربرد آنتولوژی ها، •از میان است که می تواند موجب استنتاج هایی آنتولوژیکی موضوع
در تشخیص معنا گردد. اهمیت این موضوع آنجا روشنتر می رفتن ابهام گردد که دیگر روشهای آماری و گرامری نتوانند ابهام هایی را رفع
کنند که تنها راه تشخیص آن توجه به مفاهیم و معانی باشد.
30 29
مراجع
• [RYC 2007] Rychtyckyj, N, “Machine Translation for Manufacturing”: AI Magazine Vol 28 No 3, 2007.
• [Slo1985] Sloculn, J, “Survey of Machine Translation, Its History, Current Status and Future Prospects”: Computational Linguistics, Volume 11, No 1, 1985
• [BAR 2007] Bar, K, Chueka, Y, Dershowitz, N, “An Arabic to English Example-based Translation System”: ICTIS, 2007
• [LOP 2008] Lopez, A, “Statistical Machine Translation”: ACM Computing Surveys, Vol. 40, No. 3, 2008.
• [HUT 2007] Hutchins, J, “Machine Translation: aconcise history”: InComputer Aided Translation: Theory and Practice, C. S. Wai, Ed. Chinese University of Hong Kong, 2007
• [MAH 1996] Mahesh, K, “Ontology Development for Machine Translation: Ideology and Methodology”: Technical report, Computer Research Laboratory, New Mexico State University, 1996.
• [HAH 2005] Hahn, W, “Knowledge Representation in Machine Translation”: Technical report, Computer Science Department, University of Hamburg, 2005
31 30
مراجع
• [VER 2004] Vertan, C, “Language Resources for the Semantic Web – perspectives for Machine Translation”: Proceedings of the Second International Workshop on Language Resources for Translation Work, Research and Training, Coling. Geneva.37:42, 2004
• [GAN 2002] Gandon, F, “Ontology Engineering: A survey and a return on experience”, ACACIA Team, Rapport de Recherche 2002
• [ABT 2007] Rasoolian, A, ”Antology Matching”, BC Degree Thesis in Computer Faculty of Sharif University, 2007
• [OBT 2007] Obitko, M., “Translations between Ontologies in Multi-Agent Systems”, Ph.D. dissertation, Faculty of Electrical Engineering, Czech Technical University in Prague, 2007.
• [BER 2001] Berners-Lee, T, Hendler, J, Lassila, O, "The Semantic Web: Scientific American," Scientific American, pp. 34-43, 2001.
• [AND 2004] Anderson, S, “How many languages are there in the world?” Linguistic Society of America. 1325 18th St, NW, Suite 211 Washington, D.C. 2004
• [CAR 2003] A-Way, and Carl, M. “Introduction to Example-based machine Translation”, Kluwer Academic Press, 2003
32 31
مراجع
• [PAP 2002] Papineni, K, Roukos, S, Ward, T and Zhu, W. J. "BLEU: a method for automatic evaluation of machine translation" in ACL-2002: 40th Annual meeting of the Association for Computational Linguistics pp. 311–318
• [HUT 1992] Hutchins, W. John; and Harold L. Somers (1992). An Introduction to Machine Translation. London: Academic Press. P 107
33 با سپاس از شما32