یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/ai-ch02-961-bw.pdf ·...

35
هوش مصنوعی فصل دولهای هوشمند عام( Intelligent Agents )

Upload: others

Post on 05-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

هوش مصنوعی

عامل های هوشمند –فصل دو (Intelligent Agents)

Page 2: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

مطالب این فصل

تعریف عامل هوشمند• تعریف مفهوم عقالنیّت• انواع محیط ها و ویژگی های آن ها• انواع عامل ها•

Page 3: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

تعریف عامل هوشمند عامل های هوشمند –فصل دوم –هوش مصنوعی

Page 4: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

(کارگزار)تعریف عامل

(Agent)تعریف عامل •اطککرافر را اط طریکک محککیط، سککامانا ای اسککت کککا عامککلیکک –

هککایر عملررو در آن محکیط، اط طریک درک ککرد هایر حسکرر .فعالیت می کند

Agent= عامل • Environment= محیط • Sensor= حسرر •

Percept= ادراک • Actuators= عملرر •

Action= کنر، اقدام •

Page 5: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

عامل ها و محیط ها: مثال انسان•

واقعی و قوانین آنتمام یا بخشی اط دنیای : محیط– حواس پنجرانا: حسرر– دست، پا، ماهیچا های صورت و بدن، دهان: عملرر–

ربات• و قوانین آن...( کارخانا، منزل، طمین فوتبال، )محدود حرکت ربات : محیط– .دوربین، سنسورهای مادون قرمز و صوتی و نظیر آنها: حسرر– موتورهای مختلف با وظایف گوناگون، بلندگو، نشانررهای نوری: عملرر–

در برناما کامپیوتری( تابع)ی طیربرناما • (main routine)بدنا برناما اصلی : محیط– ورودیهای تابع: حسرر– خروجیهای تابع: عملرر–

ماشین لباسشویی هوشمند• .قوانین شستشو و آب کشیمحل نصب و شرایط آن، : محیط– سنجر حرارت و سختی آب، سنجر میزان آلودگی لباسها: حسرر– روشهای مختلف شستشو و آب کشی: عملرر–

Page 6: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

اجزای عامل

برناما عامل+ معماری عامل = عامل • (architecture)معماری –

تمامی امکانات سخت افزاری؛ اط جملا حسکررها، عملررهکا، در صکورت • !لزوم مهیاست

(program)برناما –منطک انجکام . آن چا توسط متخصص هوش مصنوعی بایکد آمکاد شکود •

.کنشها توسط عاملبرناما عامل، با توجا با دنبالا مشاهدات اط محیط، ی کنر را انتخکاب •

.میکند–f : P* A

Page 7: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

جاروبرقیدنیای : مثال (تمرینهای عملی انتهای فصل)مثال کاربردی • موقعیت اتاق و وضعیت نظافت آن: ادراک ها•

[A , Dirty ]: مثالً– حرکت، مکر و بیکار: کنر ها•

–Left, Right, Suck, No-Op. .ساختمان، یا فضایی کا باید نظافت شود: محیط•

.ساد ترین شکل؛ فضایی فقط با دو موقعیت–دسکترا جکاروبرقی، بکا همکرا حسکررها، : معماری•

موتورهککای محککر ک و تجهیککزات الکتریکککی مککورد .احتیاج آن

دستوراتی کا برای فعالیت در این محیط، با : برناما• .عامل داد شد است

جدول جستجو: ساد ترین شکل–

رشته ادراکات کنش

Right [A, clean]

Suck [A, dirty]

… …

No-Op [A, clean] , [B, clean]

Suck [A, clean] , [B, dirty]

… …

Left [A, clean] , [B, dirty] , [B, clean]

… …

Page 8: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

عقالنیّت و هوشمندیمفهوم عامل های هوشمند –فصل دوم –هوش مصنوعی

Page 9: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

(Rationality)معنای عقالنیّت ، باید کار درست را انجام (Rational Agent)ی عامل عقالنی •

(.کار را درست انجام بدهد)بدهد با چا معناست؟( انجام درست کار)انجام کار درست –

.کاری کا باعث موفقیت عامل بشود• روش انداط گیری موفقیت چیست؟–

(Performance Measure)معیار کارایی •ی مالک سنجر عینی برای سنجر و مقکداردهی بکا میکزان کارآمکدی و موفقیکت –

کنشهای عامل .بستا با مسالا، عامل و محیط متفاوت است– .برای شرایط ثابت، معیارهای کارایی متفاوتی وجود دارد–

بیشترین آشغال جمع شد در واحد طمان؛ بیشترین -برای عامل جاروبرقی: مثال«مدت طمان پاکیز بودن اتاق؛ کمتکرین میکزان انکرمی مصکرفی؛ کمتکرین سکر و

.صدای ایجاد شد

Page 10: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

(هوشمند)عامل عقالنی

عقالنیت با چا چیزی وابستا است؟• .دانر قبلی عامل در مورد محیط– .دنبالا ادراکات عامل تا لحظا جاری– .مجموعا اقداماتی کا عامل می تواند انجام دهد– .معیار کارایی تعریف شد –

(هوشمند)تعریف دقی عامل عقالنی •دانر درونی و دنبالا ادراکات، اقکدامی اساس ی عامل عقالنی بر –

معیکار ککارایی اش را بیشکینا ( انتظار می رود)را انتخاب می کند کا .کند

Page 11: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

؟!عقالنیت، چا نیست

حتمی( successful)موفقیت -( perfection)کمال •امکا عامکل . بیشترین کارایی واقعی در هر مسالا؛ پیکروطی قطعکی : یعنی–

.عقالنی ممکن است شکست بخورد

(omniscience)هما چیز دانی •در -( جکامع العلکوم بکودن )دانستن مجموع هما دانشکهای زطم : یعنی–

.حالیکا عقالنیت، بیشینا کردن کارایی با مشاهدات و دانر ناقص است

(clairvoyance)غیب دانی •گاهی برای رسیدن با کمال مطل ، دانستن علم غیب و توانایی پیشرویی –

!اما پیشرویی کردن حوادث آیند در عمل ممکن نیست! زطم است

Page 12: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

ویژگی های عامل عقالنی ( Information Gathering)جمع آوری دانر •

(exploration)اکتشاف •حکاوی اطالعکات )انتخاب کنشهایی با منظور کسب ادراکهای ارطشمند –

. در لحظات بعد( مفید ( Learning)یادگیری •

.خالصا ساطی و ساختن قوانین اط روی تجربیات و مشاهدات– (Adaptation)تطبی •

.تغییر رفتار با تغییر شرایط محیط؛ با کم یادگیری در شرایط جدید– (Autonomy)خودمختاری •

وابسکتری محکب بکا ، بکا جکای اط یادگیریبعد عامل ( کنشهای)رفتار –دریافت شد اط طراح، بکا تجربیکات خکودش نیکز متککی دانر درونی

.است

Page 13: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

محیط و ویژگی های آن هوشمندعامل های – 2فصل –هوش مصنوعی

Page 14: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

(Task Environment)محیط کار محیط کار•

مجموعککا تمککامی شککرایط و اهککداف مسککالا و همچنککین مشککاهدات و – .عملکردهای مجاط توسط عامل

توصیف محیط کار• .مشخص نمودن تمامی اجزای محیط کار در ی مسالا خاص: یعنی–

:اجزای محیط کار•

P erformance Measure

معیار کارایی

E nvironment

قوانین و )محیط (ویژگی ها

A ctuators

عملررها

S Sensors

حسررها

Page 15: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

مثال توصیف محیط کار طراحی رانند تاکسی خودکار: مثال•

.سالمتی، سرعت، قانونمندی، راحتی، سود و منفعت: معیار کارایی–جاد هکا و قکوانین فیزیککی حکاکم بکر آن، وضکعیت ترافیک و : محیط–

اطالعات مربوط با اخالق ترافیکی ساکنین، عابرین پیاد و شیو رفتاری آنها، مسافرین و اولویت های آنها، شرایط آب و هوایی و طمانی، آگاهی اط

راننکدگی و اخکالق مکامورین -رفتار اتومبیلهای دیرر، قکوانین راهنمکایی ...پلیس،

.فرمان، گاط، ترمز، بوق، عالئم هشداردهند : عملررها–، سرعت سنج، مسافت سکنج، (Sonar)دوربینها، ردیاب صوتی : حسررها–

، صفحا کلید، میکروفکون، (GPS)حسررهای موتور، مکانیاب ماهوار ای ...

Page 16: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

مثال توصیف محیط کار

سامانا تشخیص پزشکی: مثال•بهبود بیمار، کاهر درد، بهبکود وضکعیت سکالمتی و : معیار کارایی–

.پزشکی جامعا، کاهر هزینا های بیماریدانر پزشکی مرتبط با بیماریهای هدف، اطالعات اقلیمی و : محیط–

مردم شناسی منطقا وقکوع بیمارسکتان، آگکاهی اط میکزان امکانکات .آطمایشراهی، بیمارستانی و دارویی در دسترس

پرسیدن سکوال، دسکتور آطمکایر، تجکویز دارو، درمکان، : عملررها– ...ارجاع با منابع و کتب،

.نشانا های بیماری، معاینا، پاسخهای بیمار: حسررها–

Page 17: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

1 -دستا بندی انواع محیط کار

قابلیت مشاهد –رویت پذیری

کامالً رویت پذیر (قابل مشاهد کلی)

Fully Observable حسررها وضعیت محیط را با .صورت کامل درک می کنند

نیما رویت پذیر (قابل مشاهد جزیی)

Partially Observable بخشی اط رویدادهای محیط اط دید

.حسررها پنهان است

Page 18: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

2 -کار دستا بندی انواع محیط

قطعیت

معیّن -قطعی Deterministic وضعیت بعدی محیط با کم وضعیت جاری و

کنر عامل، دقیقاً .مشخص می گردد

نامعیّن -اتفاقی Stochastic

وضعیت بعدی محیط فقط تابع کنر عامل و .وضعیت جاری نیست

راهبردیStrategic

وضعیت محیط بدون توجا با کنشهای

عامل های دیرر، قطعی .است

Page 19: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

3 -کار دستا بندی انواع محیط

ارتباط اجرایی

مرحلا ایEpisodic

تجربا عامل با بخر های مجزا تفکی شد و کنر ها در هر

مرحلا، فقط تابع ادراکات همان مرحلا بود و فقط در همان

.مرحلا اثر می گذارند

ترتیبیSequential

هر کنر می تواند بر تمامی .کنر های بعدی تاثیر برذارد

Page 20: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

4 -کار دستا بندی انواع محیط

تغییرپذیری محیط

ایستاStatic

وضعیت محیط در طمان تامل عامل، بدون تغییر

.است

پویاDynamic

وضعیت محیط اط طمان دریافت ادراک تا صدور

.کنر، تغییر می کند

نیما پویاSemi dynamic

وضعیت خود محیط تغییر نمی کند، اما گذشت طمان

در معیار کارایی موثر .است

Page 21: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

5 -کار دستا بندی انواع محیط

گذشت طمان

گسستا

Discrete ادراک و کنر ها در طمان های مجزا و تعیین شد و با تعداد

.محدود تعریف شد اند

پیوستاContinuous

رسیدن ادراک و صدور کنر در هر لحظا اط طمان ممکن است

(.مفهوم واقعی طمان پیوستا)

Page 22: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

6 -کار دستا بندی انواع محیط

تعداد عوامل موجود

ت عاملاSingle Agent

عامل درمحیط تنهاست و با .تنهایی عمل می کند

چندعاملاMutliagent

حداقل دو عامل در محیط موجودند کا می توانند همکار یا

.رقیب باشند

Page 23: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

مثال ویژگیهای محیط کارشطرنج با

زمان شطرنج معمولی

تشخیص راننده تاکسی پزشکی

خرید اینترنتی

بازیBackgamm

on

بازیSolitaire

Yes Yes No No No Yes Yes مشاهد ؟ قابل Strategic Strategic No No Strategic No Yes قطعی؟

No No No No No No No مرحلا ای؟ Semi Yes No No Semi Semi Yes ایستا؟

Yes Yes No No Yes Yes Yes گسستا؟ No No No Yes No No Yes عاملا؟ ت

دنیای واقعی؟• قابل مشاهد جزیی– اتفاقی–

ترتیبی– پویا– پیوستا– چندعاملا–

Page 24: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل ها عامل های هوشمند –فصل دوم –هوش مصنوعی

Page 25: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

طراحی عامل عقالنی :یادآوری•

برنامککا عامککل، نراشککتی اسککت اط دنبالککا – .ادراکات با ی کنر

یکک عامککل عقالنککی، سککعی میکنککد کککار – .درست را انجام بدهد

چرونا ی عامکل عقالنکی سکاد : سوال• بساطیم؟

جککدول جسککتجو یککا : سککاد تککرین ایککد • (lookup table)مراجعا

شامل تمامی دنبالکا مشکاهدات ممککن و –بهترین کاری ککا در صکورت وقکوع آن

.دنبالا، میتوان انجام داد . سادگی مفهوم• :اشکازت•

.نیاز به جدولی بسیار عظیم–زمااان بساایار یااوتنی جهاات اااخت و –

.پرکردن جدول .از د ت دادن خودمختاری–در صورت لحاظ کردن یاادگیری زماان –

بساایار یااوتنی جهاات ت ربااه و تکمیاال .جدول

رشته ادراکات کنش

Right [A, clean]

Suck [A, dirty]

… …

NoOp [A, clean] , [B, clean]

Suck [A, clean] , [B, dirty]

… …

Left [A, clean] , [B, dirty] , [B, clean]

… …

Page 26: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Simple Reflex Agent)عامل واکنشی ساد •با توجکا بکا فقطاقدام –

بککدون )ادراک فعلککی (توجا با ادراکات قبلی

مجموعککا ای اط قواعککد –-If-Then)آنرکا -اگر

Rule ) بککا نککام قواعککداقککککککدام -شککککککرط

condition-action-rule

.سادگی طراحی–. محکککدود هوشکککمندی–

مشکککل در محیطهککای .نیما رویت پذیر

Page 27: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Simple Reflex Agent)عامل واکنشی ساد •

ی برناما نمونا برای عامل واکنشی ساد جاروبرقی

Page 28: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Model-Based Reflex Agent)عامل واکنشی مبتنی بر مدل •نرهداری سواب محیط –

در ( سککواب ادراکهککا )، روشکی (state)حازت

برای غلبکا بکر فقکدان .اطالعات محیطی

ترکیب ادراک فعلکی و –حالت داخلی قبلی برای

.رسیدن با حالت فعلینوع اطالعکات زطم دو–

چرکونری تغییکر : است؛ (مدل کردن دنیا)دنیا

اثر اقدامهای عامل بکر .دنیا

Page 29: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Model-Based Reflex Agent)عامل واکنشی مبتنی بر مدل •

t-n . . . t-3 t-2 t-1 t

Pt-n . . . Pt-3 Pt-2 Pt-1 Pt

مقایسا عامل واکنشی مبتنی بر مدل با عامل واکنشی ساد – At = f( Pt , … , Pt-n ): واکنشی مبتنی بر مدل At = f( Pt ): واکنشی ساد

دنبالا ادراکها

لحظا جاری

Page 30: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Goal-Based Agent)عامل مبتنی بر هدف •عککالو بککر توصککیف –

حالکککت فعلکککی، بکککا هدفاطالعات دربار

.هم نیاط داریمپیر بینی حالت بعکد، –

در صورتیکا ی اقدام .انتخاب شود

برنامکککا و جسکککتجو–، روشهایی بکرای ریزی

یافتن و انتخاب دنبالکا اقککدامها بککا منظککور

.رسیدن با هدف

Page 31: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Goal-Based Agent)عامل مبتنی بر هدف • تصمیم گیری متفاوت با عاملهای واکنشی–

.خاص عاملهای واکنشی است( اقدام-شرط)آنرا معمول -قواعد اگر• !را هم در نظر میریرد آیند عامل مبتنی بر هدف، •

اگر اینکار انجام شود، در آیند چا اتفاقی خواهد افتاد؟– (باعث خشنودی میرردد؟)چا اقدامی با هدف منجر خواهد شد؟ –

قابلیت انعطاف بیشتر–موفقیت در شرایط محیطی متفاوت، با افزودن دانر مکرتبط بکا سکادگی •

.امکان پذیراستتغییر هدف، با سادگی انجام میشود، امکا در عامکل واکنشکی بایکد تمکام •

!آنرا را باطنویسی کرد-قوانین اگر

Page 32: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Utility-Based Agent)عامل مبتنی بر سودمندی •راههکککای متفکککاوتی –

بککرای رسککیدن بککا هککدف وجککود دارد؛ کککدام سککودمندی

بیشتری دارد؟سودمندی، با معنی –

مقککدار خوشککنودی : در مقابککل هککدف)

وجود یا عدم وجود (خوشنودی

Page 33: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

انواع عامل

(Utility-Based Agent)عامل مبتنی بر سودمندی • (Utility function)تابع سودمندی –

ی حالت یا ی رشتا اط حازت: ورودی• .ی عدد حقیقی، نشاندهند میزان خوشنودی عامل در حالت: خروجی•

عملکرد عقالنی در هنرام وجود اهداف ناکافی–اهداف نسبی؛ اهدافی کا رسیدن یا نرسیدن با آنها مطکرح نیسکت، بلککا •

.نسبت رسیدن با آنها مهم است .اهداف متناقب؛ فقط بعضی همزمان قابل برآورد میشوند• .اهداف متعدد غیر قطعی؛ هیچ هدفی الزاماً قابل رسیدن نیست•

Page 34: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

عامل یادگیرند

افزودن ویژگی هکای -( Learning Agent)عامل یادگیرند • .اکتشاف، یادگیری، خودمختاری: عامل عقالنی

:دارای چهار جزء– مسااا ول : عنصااار کاااارایی•

انتخاااف اعالیاات بیروناای (بدنه عاملهای قبلی)

تعیای میازان (: ناظر)منتقد •مواقیت عامل با ا اتفاده از ا ااتاندارد کااارایی اباات و

.دریاات ادراکهاتغییر عنصر :عنصر یادگیری•

کاااارایی باااا ا اااتفاده از باه (نااظر )بازخورد منتقاد

نحوی کاه در آیناده بهتار .عمل کند

پیشااانهاد :مولاااد مسااااله•اقاااداماتی جهااات یااااات

راهکاااری -ت ربیااات تااازه .برای اکتشاف محیط

Page 35: یعونصم شوه - afamodarres.irafamodarres.ir/download/entry/course6/AI-ch02-961-BW.pdf · .میرا طاین مه ،دکعب تلاح ینیب ریپ– مادقا ی اکیتروص

طراحی عامل رانند تاکسی: مثال :عامل واکنشی•

If car-in-front-is-breaking then initiate-breaking

:عامل واکنشی مبتنی بر مدل• .وجود حازت داخلی جهت تصمیم گیری بهتر–

If car-in-front-is-breaking and on freeway then initiate-breaking

:عامل مبتنی بر هدف• .روالهایی جهت جستجوی هدف و برناما ریزی برای رسیدن با آن–

If car-in-front-is-breaking and needs to get to hospital then go to adjacent lane and plan

:عامل مبتنی بر سودمندی• .وجود تابع سودمندی–

If car-in-front-is-breaking and on freeway and needs to get to hospital alive then search of a way to get to the hospital that will make your passengers happy.

:عامل یادگیرند • .کسب تجربا اط اقدامات انجام شد قبلی–

If do-some-action and passenger shouts on you then never-do-that-action again!