ﯽﻤﺋﺎﻗ ﺎﺿﺭ ﺮﺘﮐﺩ...

Post on 09-Jul-2020

4 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

قائمی رضا دکتر : مدرس

فصل اولمقدمه

پردازش فکرواستدالل Thought Processes & Reasoning

رفتارBehavior

اندازه گيری موفقيت براساس وفادارماندن به عملکردانسان

اندازه گيری موفقيت براساسمفهوم ايده ال هوشمندی

(Rationality عقالنيت (

A system is Rational if it does the "right thing," given what it knows.

Homo Sapiens انسان خردمندArtificial Intelligence هوش مصنوعی

1956 - Systematizes & Automates Intellectual Tasks(Learning & Perception) کاربرد درزمينه های يادگيری وادراک

،اثبات قضايای رياضی ،وزمينه های خاص مانند بازی شطرنج و تشخيص بيماری ،سرودن شعر

Main Parts of AINatural Language Processing

Knowledge RepresentationAutomated Reasoning

Machine Learning

Acting Humanly : Test TuringTo provide a satisfactory operational

definition of intelligence.

Test Turing: a test based on indistinguishabilityfrom undeniably intelligent entities.

.برقراری ارتباط موثر به زبان انگليسی:

.ذخيره سازی آنچه می داند يا می شنود:

. استفاده ازاطالعات ذخيره شده درراستای پاسخ به سواالت ونتيجه گيری های جديد:

.سازگاری با شرايط جديد وشناسايی و برون يابی الگوها:

Direct Physical Interaction:interrogator & Computer

Computer Vision: to perceive objectsRobotics: to manipulate objects & move

Introspection

Psychological Experiments

Thinking Humanly : Cognitive Modeling ApproachThe interdisciplinary field of cognitive science brings together computer models from AI and experimental techniques from psychology to try to

construct precise and testable theories of the workings of the human mind.

(General Problem Solver -حل کننده عمومی مسائل (

Thinking Rationally : The “Laws of Thought" Approach(Syllogisms) قياس صوری: ارسطو

ايجاد الگوهايی برای ساختار مباحثه که درصورت دريافت فرضهای درست .هميشه نتايج صحيحی برمی گرداند

(By Logical Notation -عالمت گذاری منطقی (

)کم : قطعيت دانش (

Acting Rationally : The Rational Agent Approach(Agent) عامل

چيزی است که عمل می کند با ويژگيهايی مانند عمل با کنترل ،استمرار درخالل زمانهای بسيارطوالنی ،درک محيط ،خودمختار

.انطباق با تغييرات وتوانايی پيگيری هدف يک عامل ديگر

. )عقالنی عمل کردنی که با استنتاج سروکاری ندارد(

(Rational Agent) عامل منطقی عاملی است که به نحوی عمل ميکند تا بهترين نتيجه حاصل شود ويا

.بهترين نتيجه ممکن را بدست آورد ،وقتی عدم قطعيت وجوددارد

(Autonomous Planning & Scheduling) برنامه ريزی وزمان بندی خودمختار(Game Playing) انجام بازی , (Autonomous Control) کنترل خودمختار

(Diagnosis) تشخيص پزشکی , (Logistics Planning) برنامه ريزی ترابری(Language Understanding & Problem Solving) درک زبان وحل مسأله

(Robotics) روباتيک

فصل دومعامل های هوشمند

EnvironmentSensor

Actuator

Agent

PerceptionAction

Percept Sequence

Agent Function

Agent Program

رشته ادراکاتPercept Sequence

اقدامAction

… …

Agent Function’s Table

:مثــــــال رشته ادراکات

Percept Sequenceاقدام

Action

[A, Clean][A, Dirty][B, Clean][B, Dirty]

[A, Clean], [A, Clean][A, Clean], [A, Dirty]

…………[A, Clean], [A, Clean], [A, Clean][A, Clean], [A, Clean], [A, Dirty]

RightSuction

LeftSuction

RightSuction

….Right

Suction

Perception

Action

LeftRightSuctionNo Operation

Percept :1. A & B Places2. Dirty & Clean

Action :Right & Left Move , Suction , No Operation

A Simple Agent FunctionIf the current square is dirty, then suction, otherwise move to the other square.

(Rational Agent) عامل منطقی ،بعبارتی ديگر. را انجام می دهد عمل درستعاملی است که

. به درستی پرشود ،هررديف جدول تابع عامل

عمل درست

نمی توان يک مقياس ثابت را برای .کردتمام عامل ها استفاده Multi-Objective

Performance Measure

A General RuleIt is better to design performance measures according to what one actually wants in the

environment, rather than according to how one thinks the agent should behave.

Rational Agent

Knowledge Collection

Autonomous

Action

Perception Sequence

Performance Measure

Built-in Knowledge

(Rationality) عقالنيت :به چهارموردزير بستگي دارد ،است عقالنياينكه درهرلحظه چه چيزي

.درمورد محيطدانش قبلی عامل ) 2. که معيارموفقيت را تعيين می کندمقياس کارايی آن ) 1 .تا اين لحظهرشته ادراکات عامل ) 4. می تواند انجام دهد عاملی که اقدامات) 3

Omniscience همه چيزدانی Rationality

.)را بيشينه ميکند واقعیکارايی کمالدرحاليکه ،را بيشينه ميکندموردانتظارکارايی عقالنيت(

.)مگراينکه طراح به عامل کمک کند ،هنگام نداشتن تجربه يا کم تجربگی تصادفی عمل کردن عامل(

ماهيت محيط ها(Nature of Environment)

:اولين گام درطراحي عامل هاي هوشمند (Task Environment) محيط كارمشخص سازي

محيط کار= معيارکارايی + محيط + اقدام گرها + حسگرها

حسگرهاSensors

اقدام گرهاActuators

محيطEnvironment

مقياس کارايیPerformance Measure

نوع عاملAgent Type

،دوربين ها،حسگرصوتی،سرعت سنج

،GPS،کيلومترشمار،شتاب سنج

،حسگرهای موتور.صفحه کليد

،فرمان،گاز،ترمز

،چراغ ها،بوق

.صفحه نمايش

،ها جاده،رفت و آمدهای ديگر

،عابرين پياده.مشتريان

،امن،سريع،قانونی

،سفرراحت.بيشينه کردن سود

راننده تاکسی

برای محيط کار يک تاکسی خودکار PEAS توصيف

PEAS مثال هايی از

حسگرهاSensors

اقدام گرهاActuators

محيطEnvironment

مقياس کارايیPerformance Measure

نوع عاملAgent Type

يافته ها ،واردکردن عالئم بيماری.وپاسخهای بيمارازطريق صفحه کليد

،آزمايشها ،نمايش پرسشها.وارجاع ها ،تجويزها ،تشخيص ها

.کارکنان ،بيمارستان ،بيمار مسائل ،کمينه کردن هزينه ها ،بيمارسالم.حقوقی

.سيستم تشخيص پزشکی

.ازپيکسل های رنگی آرايه هايی .نمايش دسته بندی تصوير .ارتباط رو به پايين ماهواره .دسته بندی صحيح تصوير .ماهواره ای سيستم تحليل تصاوير

.حسگرهای زاويه مفصل ،دوربين .بازو ودست مفصل دار ،کمربند نقاله همراه با قطعات.سطل ها

درصد قطعاتی که در سطل درست قرار .گرفته اند

.روباتی که قطعات را بر می دارد

.فشار و شيميايی ،حسگرهای دما ،گرماسازها ،پمپ ها ،شيرها.صفحه های نمايش

.کاربران ،پااليشگاه .بازده واقعيت ،بيشينه کردن خلوص .کنترلگر پااليشگاه

.ورودی صفحه کليد پيشنهادات و ،نمايش تمرينها.تصفيه ها

،مجموعه دانش آموزان.موسسه امتحان گيرنده

.بيشينه کردن نمره امتحان دانش آموز .معلم انگليسی محاوره ای

Fully ObservablePartially Observable

.اگرحسگرها تمام جنبه های مرتبط با انتخاب اقدام را شناسايی کنند، محيط کارکامال رويت پذيراست.مرتبط بودن به خودی خود به مقياس کارايی بستگی دارد

.نيازی به ثبت اتفاقات توسط عامل نيست

عدم دقت حسگرها و نويز آنها يا حذف قسمتهايي ازحالتها درداده هاي حسگر

DeterministicStochastic

.نيازی به نگرانی ندارد ،يک عامل درباره عدم قطعيت ،دريک محيط کامال رويت پذيرقطعی.چراکه رفتارترافيک قابل حدس نيست، راننده تاکسی ازاين نطر کامال اتفاقی است EpisodicSequential

قطعات (محيط مرحله اي مانند كارهاي دسته بندي )معيوب توسط روبات براساس قطعه فعلي

محيط ترتيبي مانند شطرنج و راننده تاكسي

StaticDynamic

.نيازی نيست) محيط(در محيط های ايستا توجه مدام به دنيا .محيط های پويا بطورمدام خواسته های خودرا به عامل می گويد

.و جدول کلمات متقاطع يک محيط ايستاست، شطرنج زمان دار يک محيط نيمه پويا ،راننده تاکسی يک محيط پويا

Semi Dynamic

DiscreteContinuous

.و اقدامات متمايز دارد ،ادراکات ،يعنی تعداد محدودی حالت، شطرنج محيطی گسسته است).موقعيت خودروها درطول زمان ، تغييرات پيوسته سرعت(راننده تاکسی محيطی پيوسته است

Single AgentMulti Agent

.جدول کلمات متقاطع يک محيط تک عاملی و شطرنج يک محيط دوعاملی است).بيشينه شدن مقياس کارايی يک عامل وکمينه شدن مقياس کارايی عامل ديگر(شطرنج يک محيط چندعاملی رقابتی است

.راننده تاکسی يک محيط چندعاملی مشارکتی استدرمحيط های رقابتی نيمه رويت پذير رفتاراتفاقی . درمحيط های چندعاملی اغلب ارتباط بعنوان يک رفتارعقالنی ظهورميکند

.عقالنی به حساب می آيد زيرا ازمشکالت پيش بينی پذيری جلوگيری می کند

،اتفاقي، حالت نيمه رويت پذير ،و چندعامله ،پيوسته ،پويا ،ترتيبي

.مشكلترين مورد محيطي است)راننده تاكسي(

Task Environment Observable Deterministic Episodic Static Discrete Agents

Crossword puzzle Fully Deterministic Sequential Static Discrete Single

Chess with a clock Fully Strategic Sequential Semi Discrete Multi

Poker Partially Stochastic Sequential Static Discrete Multi

Backgammon Fully Stochastic Sequential Static Discrete Multi

Taxi driving Partially Stochastic Sequential Dynamic Continuous Multi

Medical diagnosis Partially Stochastic Sequential Dynamic Continuous Single

Image-analysis Fully Deterministic Episodic Semi Continuous Single

Part-picking robot Partially Stochastic Episodic Dynamic Continuous Single

Refinery controller Partially Stochastic Sequential Dynamic Continuous Single

Interactive English tutor Partially Stochastic Sequential Dynamic Discrete Multi

وظيفه هوش مصنوعي

تابع عامل برروي نوعي دستگاه محاسباتي همراه با حسگرها .مي ناميممعماري واقدامگرهاي فيزيكي كارخواهدكرد كه آن را

عامل= معماري + برنامه .معماري ميتواند يك كامپيوترشخصي يا يك خودرو روباتيك باشد

برنامه عامل ادراك فعلي را بعنوان ورودي ازحسگرها

دريافت مي كند ويك اقدام .را به اقدام گرها برمي گرداند

درصورتيکه ،زيراهيچ چيزديگری ازمحيط قابل دسترسی نيست ،تنها ادراک فعلی را بعنوان ورودی می پذيردبرنامه عامل .عامل بايد ادراکات را به ياد داشته باشد ،به کل رشته ادراکات وابسته باشد ،تابع عاملاقدامات عامل براساس

(Table-Driven Approach) رويکرد جدول گرا

Table-Driven-Agentبراي هرادراك جديد فراخواني مي شود و هربار يك اقدام برنامه . رابرميگرداند وبا استفاده ازساختارداده اي اختصاصي خود تاريخچه رشته ادراكات را ثبت ميكند

،درساخترويكرد جدول گرا .محكوم به شكست است

T مجموعه ادراكات ممكن و P فرض كنيد ) تعدادكل ادراكات دريافتي(طول عمرعامل

تعدادداده هاي جدول مرجع. باشد

مگابايت درثانيه است 27نرخ داده بينابي ،درتاكسي خودكار ،درنتيجه). بيتي24درثانيه ورنگ640*480فريم30(

تعدادداده جدول براي يك ساعت رانندگي بيش از 250000000000^10

اصول زيربنايي تقريبا هرسيستم هوشمند

اين عاملهااقدامات رابراساس ادراك فعلي انتخاب ميكنند

. وتاريخچه ادراكها راناديده مي گيرندجاروبرقي

برنامه عامل جاروبرقی

IF-THEN اقدام –قاعده شرايط

) مانند رانندگي(پاسخهاي اكتسابي )پلك زدن(و واكنشهاي ذاتي

مشخص سازي وضعيت دروني فعلي فرآيند تصميم گيري عامل

شکل نموداری

ارائه اطالعات زمينه اي كه درفرآيند تصميم گيري

.عامل بكار ميرود

پياده سازي واقعي ميتواند به سادگي مجموعه اي از دروازه هاي منطقي باشد .كه يك مداربولي را پياده سازي مي كند

عامل هاي واكنشي ساده.بسيارساده ولي هوشمندي بسيارمحدود

وجودحلقه هاي (محيط بايد كامال رويت پذير باشد ).اقدامات تصادفي >بينهايت درمحيط نيمه رويت پذير

تشخيص ترمززدن خودرو در رنگهاي تركيبيخراب شدن حسگر موقعيت سنج مكان درجاروبرقي

يك توصيف انتزاعي ازوضعيت فعلي .براساس ادراك را برمي گرداند

اولين قاعده ازمجموعه قواعدي را كه با توصيف وضعيت داده شده

.تطابق دارد، برمي گرداند

يك عامل واكنشي ساده ممكن است تصادفي شده

ازيك عامل واكنشي ساده .قطعي بهتر عمل كند

.نگهداشتن سوابق محيط حس نشده: موثرترين روش برخورد عامل با نيمه رويت پذيري.استفاده از حافظه براي ثبت حاالت داخلي وابسته به تاريخچه ادراكات

چه زماني چراغهاي قرمزپشت خودرو (نگهداري فريم قبلي دوربين درتشخيص ترمزخودرو ).همزمان خاموش و روشن ميشوند

نگهداري سوابق موقعيت خودروهاي ديكر بعلت عدم توانايي : عوض كردن خط دراتوبانها .ديدن همه خودروها دريك لحظه توسط عامل

خودرويي كه ميخواهد سبقت بگيرد، عموما ازچندلحظه قبل، به پشت

.خودرو ما نزديكتر است

چرخاندن فرمان خودرو توسط عامل و .چرخيدن خودرو به يك سمت خاص

تركيب ادراك فعلي با حالت داخلي قبلي براي توصيف .بروزآوري شده ي وضعيت فعلي را توليد ميكند

.مسئول ساخت توصيف حالت داخلي جديد.تفسير ادراك جديد براساس دانش موجود درباره وضعيت

.استفاده ازدانشي درباره چگونگي تغييردنيا براي پيگيري قسمتهاي ناديده ي دنيا.دانستن تاثير اقدامات عامل بر وضعيت دنيا

عالوه برتوصيف وضعيت قعلي، عامل به نوعي اطالعات .كه وضعيت مطلوب را توصيف كند، نيازدارد هدفدرباره

و اطالعات مربوط به حالت فعلي تركيببرنامه عامل با .، اقدام بعدي را انتخاب ميكنداطالعات هدف

رسيدن مسافر به مقصد

هنگامي كه ارضاي هدف بالفاصله بعداز انجام يك اقدام نتيجه ميشود، انتخاب اقدام مبتني

.برهدف، ساده وسرراست استهنگامي كه عامل بايد رشته اقدامات متعددي رادر نظربگيرد تا راهي براي رسيدن به هدف بيابد،

.انتخاب اقدام مبتني برهدف دشوارتر خواهدبودبه يافتن رشته اقداماتي برنامه ريزيو جستجو

.براي رسيدن به اهداف عامل اختصاص يافته اند

عامل مبتني برهدف شايدكمترموثرباشد، ولي انعطاف پذيرتر است، زيرا دانشي كه

ازتصميماتش پشتيباني ميكند، بطورصريح .ارائه شده است وميتواند تغييركند

بروزآوري دانش عامل درباره ميزان موثرعمل .كردن ترمزها

رد وضعيت دنيا و مجموعه اهداف عامل براي انتخاب اقدام بعدي .براي رسيدن به اهداف

عامل ، وقتي كه چراغهاي ترمز را مي بيند، ترمز ميزند، ولي عامل واكنشي ، اصوال ميتواند استدالل كند كه اگرچراغهاي ترمزخودروي جلويي مبتني برهدف

.روشن باشد، سرعتش كم خواهدشد

دررسيدن به اهداف، كلمه علمي ناخشنودبودن يا خشنودبودنبايدبگوييم اگريك وضعيت دنيا برديگري ارجحيت . نيست

.بيشتري براي عامل دارد سودمنديداشته باشد، آنگاه

.مانند سرعت و ايمني

است واينكار را تصميمات عقالني ، قادربه گرفتن تابع سودمندي صريحعاملي با (General Purpose Algorithm) الگوريتم همه منظورهازطريق يك . انجام ميدهد كه به بيشينه شدن يك تابع سودمندي خاص بستگي ندارد

عامل مبتني بر مدل و سودمنديبراي اندازه گيري سليقه عامل درمورد تابع سودمندي ، همراه با يك مدل دنيااستفاده ازيك

.حالتهاي دنيا، وسپس انتخاب اقدامي كه به بهترين سودمندي موردانتظار منجرشودسودمندي موردانتظار با ميانگين گرقتن ازتمام حالتهاي نتيجه ي ممكن كه براساس احتمال نتيجه به

.هريك وزن داده شده است، محاسبه ميگردد

مزيت يادگيري اين است كه اجازه ميدهد تا ابتدا عامل درمحيطي ناشناخته عمل كند وسپس ازآنچه دانش اوليه اش

.به تنهايي ممكن بود اجازه بدهد، ماهرتر شود

(Performance Element) عنصركارآيي و (Learning Element) عنصريادگيري .بترتيب مسئول بهبودبخشيدن و مسئول انتخاب اقدامات بيروني مي باشند

درباره چگونگي عملكرد عامل (Critic) منتقدعنصريادگيري ازبازخور دريافتي از استفاده ميكند و تعيين مي كند كه چگونه عنصر كارايي بايد تغيير كند تا در

(Problem Generator) مسئول پيشنهاد مولدمسأله . آينده بهتر عمل نمايد .اقداماتي است كه به تجربياتي تازه و آموزنده منجر خواهد شد

فصل سومحل مسائل ازطريق جستجو

Problem Solving Agent

Problem Formulation

Searching Algorithms

(PSA)

عاملهاي . ازنوع عاملهاي مبتني برهدف مي باشدعامل هاي حل مسأله حل مسأله با پيدا كردن رشته هايي از اقدامات كه به حالتهاي مطلوب

.منجرمي شوند، تصميم مي گيرند كه چه عملي را انجام دهند

براساس تدوين هدف اولين گام درحل مسأله، .عامل مي باشد مقياس كاراييو حالت فعلي

حالتهاي دنياست هدف بصورت مجموعه اي ازفهميدن اين مطلب كه كدام وظيفه عامل و

.رشته ازاقدامات، آن را به يك هدف ميرساند

يك مسأله پيچيده مي باشد مسأله تصميم گيري . وشامل بده بستانهاي زياد ومطالعه دقيق است

يادگيري زبان : مقياسهاي متعدد كارايي عامل ...رومانيايي، لذت بردن، حفظ سالمتي، و

مسافرت به (دراين سطح ازجزئيات .عدم قطعيت زيادي وجود دارد) روماني

:(Formulation) تدوين مسأله فرآيندتصميم گيري درمورد اقدامات

.وحالتها براساس يك هدف خاص

Perception

Action

تدوين مسأله

عامل نخواهددانست كه كداميك ازاقدامات ممكن است بهترين باشد، زيرا كامال اگرعامل هيچ اطالعات . نمي داند كه ازانجام هراقدام، چه حالتي حاصل مي شود

.اضافه اي نداشته باشد، گيرافتاده است وبهتراست تصادفي انتخاب كنداستفاده از نقشه

(Searching Algorithms) الگوريتم هاي جستجو

.می ناميم جستجوفرآيند بررسی توالی های مختلف ممکن ازاقدامات وسپس انتخاب بهترين آنها را .را به شکل يک رشته اقدام برمی گرداندراه حل يک مسأله را بعنوان ورودی می پذيرد ويک الگوريتم جستجو

.می گردد اجراسپس اقدام کانديدشده .ی را تدوين می کندهدف جديدمی شود وعامل حذفنهايتا، آن مرحله ازرشته اقدامات

“ تدوين،جستجو،اجرا“ عامل بصورت .طراحی می شود

فرضيات درطراحي عامل.محيط ايستا، گسسته، و قطعي است

.حالت ابتدايي شناخته شده است.راه حلها بدون توجه به ادراكات اجرا ميشوند

ساده ترين نوع محيط

.، بصورت رسمي با چهارمولفه تعريف ميشودمسأله يكIn(Arad) مانند. شروع بكار عامل : حالت ابتدايي) 1

(Successor Function) تابع پسين. تعريف اقدامات ممكن : اقدامات) 2 Successor Function پسين،اقدام<يك مجموعه از زوجهاي مرتب<

In(Arad) {<Go(Sibiu),In(Sibiu)>, <Go(Timisoara),In(Timisoara)>,<Go(Zerind),In(Zerind)>} ، فضاي تابع پسينو حالت ابتدايي

.حالت مسأله را تعريف ميكند، گرافي را تشكيل ميدهد فضاي حالت

هاي بين كمانوحالتها آن هايگره كه آيا يك حالت خاص، حالت هدف است؟: آزمون هدف) 3نقشه روماني. هستند اقداماتگره ها،

) ويژگي(درمثال روماني، و حالت {In(Bucharest)} مانندكيش ومات دربازي شطرنج

تخصيص يك هزينه عددي به : تابع هزينه مسير) 4.هزينه مسير، طول مسيربرحسب كيلومتر. هرمسير

چهارعنصرفوق الذكر را ميتوان دريك ساختارداده منفرد گردآوري كرد وبعنوان

.ورودي الگوريتم مسأله ارائه كردكيفيت راه حل را با تابع هزينه مسير

اندازه گيري ميكنند و يك راه حل بهينه .كمترين هزينه مسير رادارد

.گويند تجريدفرآيند حذف جزئيات ازيك بازنمايي را مانند حدف همراهان سفر،منظره بيرون،آب وهوا در : تجريد حالتها

.مثال روماني مانند حذف اثر كندكردن سرعت خودرو با ديدن : تجريد اقدامات

.پليس در مثال راننده تاكسي انتخاب يك تجريدمناسب، شامل حذف جزئيات تا حدامكان به شرط .حفظ اعتبار و اطمينان ازاينكه اجراي اقدامات مجرد ساده تر هستند

(مسائل اسباب بازی)

(مسائل اسباب بازی)

(مسائل اسباب بازی)

(Successor Function )

دنياي واقعي جاروبرقيمحلهاي گسسته، آشغال

گسسته، تميزي قابل اعتماد، .تميزشدن بايكبار مكش

محل داشته باشد، n محيطي كه.حالت خواهد داشت n*2^n

.هرحالتی می تواند حالت شروع باشد. 2*2^2= 8تعداد کل حاالت . محل که می تواند تميز يا کثيف باشد، قراردارد 2عامل در

Left (L) , Right (R), Suck (S)

).عدم وجود گردوغبار(تميز بودن تمامی مربع ها

.بنابراين، هزينه مسير، تعداد گامهای مسيراست. واحد هزينه دارد 1هرگام

پازل هشت تايي كاشي شماره دار 8با 3*3تخته

ويك فضاي خالي

دنياي واقعي پازل هشت تايي تجريدهاي تكان دادن تخته، درآوردن .قطعات با چاقو و جاگذاري دوباره آنها181440 = 9 ! / 2 = تعداد حاالت

(خانواده پازل های بلوک لغزنده)

(خانواده پازل های بلوک لغزنده)

يك حالت= وزير روي صفحه شطرنج 8تا 0هر چيدماني از : حالت ها .هيچ وزير روي صفحه شطرنج نباشد: حالت ابتدايي

.افزودن يك وزير به هرخانه خالي: تابع پسين .عدم حمله هشت وزير به يكديگر: آزمون هدف ).تنها حالت نهايي مهم است(صفر : هزينه مسير

.هراقدام يك وزير به حالت اضافه ميكند: تدوين افزايشي

( وزير n خانواده)

يك راه حل تقريبيتعداد توالي هاي ممكن دراين تدوين

14^10 *3 =57 * ... *63 *64

يك راه حل تقريبي

.عدم قرارگرفتن وزير درخانه ي تحت حمله: تدوين كامل

)تنها حالت نهايي مهم است(

( وزير n تعداد توالي هاي ممكن (خانوادهدراين تدوين

2057

(Real-World Problem) مسائل دنيای واقعیبرنامه ،مسيريابي درشبكه هاي كامپيوتريكاربردهاي مختلفي ازقبيل الگوريتم هاي مسيريابي

.دارندسيستم هاي برنامه ريزي خطوط هوايي ،ريزي عمليات نظامي

مسأله سفرهوايي.يك فرودگاه و زمان جاري: حالت ها ).مقصد شروع پرواز(مشخص شدن توسط مسأله : حالت ابتدايي داراي توضيحات بيشتر مانند (برگرداندن حالتهايي كه از انجام يك پرواز زمان بندي شده : تابع پسين ، حركت ديرتر اززمان فعلي بعالوه زمان جابجايي بين فرودگاهها، )كالس صندلي، شماره صندلي .ازفرودگاه فعلي به فرودگاه ديگري، نتيجه مي شود .رسيدن به مقصد سرزمان تعيين شده: آزمون هدف هزينه مالي، زمان انتظار، زمان پرواز، گمرك، روالهاي مهاجرت، كيفيت صندلي، زمان روز، : هزينه مسير

.نوع هواپيما و غيره

(Traveling Salesperson Problem) TSP مسأله فروشنده دورگرد .است كه درآن هرشهر دقيقا يكبار بايد ديده شود) مسيريابي(مسأله تورينگ يك .كوتاهترين گردش مي باشد هدف

. است NP-hard يك مسأله

VLSI مسأله چيدمان جهت يابي روبات

تعيين خودكار ترتيب مونتاژ )طراحي پروتئين(

يك توصيف غيررسمي الگوريتم كلي جستجوي درختي

درفضاي حالت . متفاوت استدرخت جستجو و فضاي حالت مسأله مسيريابي، 20 حالت وجود دارد كه به هرشهر يكي

اما تعداد بي شماري مسير دراين فضاي حالت . اختصاص مييابد.وجود دارد ودرنتيجه درخت جستجو تعداد بي نهايت گره دارد

، الگوريتم جستجوي خوبيك ازدنبال كردن چنين مسيرهاي

.تكراري اجتناب مي كند

گره جستجوييSearch Node

گره جستجوييSearch Node

گسترشExpansion

تابع پسين

تست هدف درهر حالت مالقات شده

(Parent)

(Child)(Depth)

، گره برگي است عنصر حاشيههر .كه هيچ پسيني دردرخت ندارد

بعنوان صفاستفاده از :حاشيه مكاني براي ذخيره كردن گره ها

اضافه كردن گره به صف : Insert (element,fringe)حدف كردن گره از صف : Remove (element,fringe)

توالي اقداماتي كه با دنبال كردن : Solution.اشاره گرهاي والد تا ريشه بدست مي آيد

Completeness

Optimality

Time Complexity

Space Complexity

(Uninformed)

(Breadth-First Search)

(Uniform-Cost Search)

(Depth-First Search)

(Depth-Limited Search)

(Iterative Deepening Search)

(Blind Search)

عدم وجود اطالعات اضافي روي حالتهاتنها قادر به توليد پسين ها و تشخيص يك

.حالت هدف ازيك حالت غيرهدف

استرتژيهاي كه ميدانند يك حالت غيرهدف، اميدواركننده تر ازديگري .گويند (Informed / Heuristic Search) است را استراتژيهاي آگاهانه

(BFS)

TREE-SEARCH با فراخوانی تابع

.گرههايی که اول ازهمه ديده شده اند، گسترش خواهند يافت FIFO TREE-SEARCH در (Problem, FIFO-QUEUE ())

کم عمق زودتر تمام پسين هايی تازه توليد شده را درانتهای صف قرارمی دهد، بدين معنی که گره های FIFO صف.ازگره های عميق تر گسترش می يابند

(BFS)

(BFS)

.پسين دارد b هرحالت گره b ريشه درخت جستجو درسطح اول

... گره توليد ميكند و b^2 ودرسطح دوم . ميباشد d راه حل درعمق

(BFS)O ( b^d+1)O ( b^d+1) dNode

b = 100

(UCS)

هنگامي بهينه است كه هزينه تمام مراحل يكسان باشد، زيرا BFS.هميشه كم عمقترين گرهي كه گسترش نيافته است را گسترش مي دهد

را كه n بجاي گسترش كم عمقترين گره، گره جستجوي هزينه يكنواخت .كمترين هزينه مسير رادارد، گسترش مي دهد

با جلو رفتن درمسير، : ترتيب صعودي .هزينه مسير هميشه افزايش مي يابد

به تعداد مراحل مسير اهميت نمي دهد، بلكه فقط UCSدرنتيجه، اگر گرهي را . هزينه كل مسير را درنظر مي كيرد

گسترش دهد كه داراي اقدامي با هزينه صفر باشد وبه همان حالت بركردد، اين جستجو دريك حلقه بي نهايت مي

...كامل بودن را درصورتي ميتوان تضمين كرد كه. افتد

هزينه هراقدامهزينه راه حل بهينه

b^d كه ميتواند بسيار بزرگتر از و معادلند اگر هزينه . باشد

.تمام مراحل يكسان باشد

(UCS)

(DFS)

.تا حدي كاهش مي يابد l مشكل درختان نامحدود با درنظرگرفتن يك محدوديت عمق مانند . نامندجستجوي عمق محدود هستند، گويي هيچ پسيني ندارند كه l گرههايي كه درعمق

l = 3

IF l < d : كم عمقترين هدف، پايين تر ازمحدوده عمق قرار مي گيرد.IF l > d : .جستجوي عمق محدود غيربهينه خواهد بود

(DFS)

.تا حدي كاهش مي يابد l مشكل درختان نامحدود با درنظرگرفتن يك محدوديت عمق مانند . نامندجستجوي عمق محدود هستند، گويي هيچ پسيني ندارند كه l گرههايي كه درعمق

IF l < d : كم عمقترين هدف، پايين تر ازمحدوده عمق قرار مي گيرد.IF l > d : .جستجوي عمق محدود غيربهينه خواهد بود

l = 3

(DFS)

(DFS)

جستجوي اول عمق را ميتوان موردخاصي∞ = l .درنطرگرفت ازجستجوي عمق محدود با

(DLS)

.مرحله قابل دسترسي ازشهر ديكر است9، هرشهر درحداكثر رومانيدرمثال ، محدوديت عمق بهتري فراهم ميكند قطرفضاي حالتاين عدد بعنوان

.كه به جستجوي اول عمق موثرتري منجر ميشود

(DLS)

(DLS)

خاتمه مي يابددو نوع عدم موفقيت جستجوي عمق محدود بخاطر نشانگر عدم وجود راه حل : استاندارد failure مقدار

نشانگر عدم وجود راه حل درآن محدوده عمق : cutoff مقدار

(IDS)

(IDS)

كه بطور مكرر الگوريتم جستجوي عميق شونده تكراري جستجوي عمق محدود را با محدوديتهاي درحال افزايش

بكار مي برد، هنگامي كه راه حلي پيدا نكند يا اگر جستجوي عمق محدود عدم موفقيت را برگرداند كه به

.معني عدم وجود راه حل است، به اتمام مي رسد

(IDS)

ازحافظه جستجوي عمقي همانند .نسبتا كمي استفاده مي كند

كامل است، جستجوي سطحي همانند .اگر فاكتور انشعاب محدود باشد

چهار تكرار از جستجوي عميق شونده .تكراري دريك درخت دودويي

(IDS)

N (IDS) = (d)b^1 + (d-1)b^2 + … + (1)b^d = O(b^d)

دريك درخت جستجو كه درتمام سطوحش، فاكتورانشعاب است، اكثر گرهها درسطوح پايين تر ) يا تقريبا يكسان(يكسان

بنابراين، چندان اهميت ندارد كه سطوح باالتر چندين . مي باشندتنها يكبار ) d عمق (گرههاي سطوح پايين تر . بار توليد شوند

توليد ميشوند، گرههاي موجود دريك سطح باالتر، دوبار توليد تا بچه هاي ريشه كه.... توليد مي شوند و dمرتبه توليد

.ميشوند

تعداد كل گرههاي توليدي

بطوركلي، زماني كه فضاي جستجو بزرگ و عمق راه جستجوي عميق شونده تكراري حل نامعلوم است،

.روش جستجوي ناآگاهانه مطلوب مي باشد

بجاي : جستجوي طوالني كننده تكراري محدوديتهاي عمق درحال افزايش، ازمحدوديتهاي

.هزينه مسير درحال افزايش استفاده مي شود

(Bidirectional Search)

يکی يا هردو جستجوها، قبل ازگسترش هرگره بررسی ميکند که آيا آن گره درلبه .اگرچنين بود، يک راه حل پيدا شده است. درخت جستجوی ديگر قراردارد يا خير

O(b^d+1) (10^1)+…+(10^7)

2*[(10^1)+(10^2)+(10^3)]

هنگامي به موفقيت نزديك است كه يك شاخه ازگره جستجوي دوطرفه .برسد Goal به يك شاخه ازگره Start

(Bidirectional Search)

چگونگي جستجوي روبه عقبتمام آن (Pred(n) يعني ) n پيشين هاي گره: فرض

. پسين آنهاست n گرههايي باشند كه گره جستجوي دوطرفه نيازمند قابل محاسبه بودن

.بطورموثر است Pred(n)

.جذابيت جستجوي دوطرفه، پيچيدگي زماني آن است

، هنگامي است جستجوي دوطرفه براي مشكل ترين حالت كه آزمون هدف تنها يك توصيف ضمني ازمجموعه

.احتماال بزرگي ازحالتهاي هدف را ارائه مي كندمانند حالت كيش ومات درشطرنج

اول سطحي هزينه يكنواخت اول عمقي عمق محدود عميق شونده تكراري

كاملزمانفضا

بهينگي

جستجوي دوطرفه

چهار معيار ارزيابي

ارزيابی راهبردهای جستجو.حدعمق می باشد l و حداکثر عمق درخت جستجو، m عمق کم عمقترين راه حل، d فاکتورانشعاب، b

.باشد ε کامل به شرطی که هزينه مرحله بزرگتراز b متناهی باشد، و b کامل به شرطی که a.بهينه درصورتيکه هزينه های همگی يکسان باشند c

. اگر درهردو جهت ازجستجوی اول سطح استفاده شود d

تمام مسائل داراي اقدامات معكوس پذير داراي درختان جستجوي نامتناهي

مانند مسائل مسيريابي وبالكهاي لغزنده

شناسايي حالت تكراري مقايسه گره درشرف گسترش با گرههايي

.كه پيش ازاين گسترش يافته اند

.فضاهای حالتی که درخت جستجوی بطورنمايی بزرگتری را توليد می کنند. d d+1 حالت با عمق حداکثر دارای . ، وغيره وجود دارد C به B B، دواقدام از به A فضاهای حالتی که دو اقدام ممکن از : (a)

.مسير درون فضا دارد 2^d شاخه متناظر با 2^d درخت جستجوی متناظراست که : (b) . A يک فضای شبکه ای مستطيل شکل حالتهايی که درفاصله دو مرحله ای حالت اوليه : (c)

فضاي حالت در شديدترين حالت برگ 2^d

فضاي حالتبرگ 4^d

فضاي حالتبرگ 2^d

اگر الگوريتمي تمام حالتهايي كه ازآنها گذشته است را

بخاطر داشته باشد، آنگاه اين گراف فضاي حالت الگوريتم

.را مستقيما كاوش مي كند

فهرست تمام گرههاي گسترش يافتهHash قابل پياده سازي توسط يك جدول

براي بررسي موثر حالتهاي تكراريOpen ساختار

وجود Closed اگر گره فعلي درفهرست. داشته باشد، گره فعلي گسترش نمي يابد

نيست، چراكه بهينهالگوريتم جستجوي گراف و شايد (هميشه مسيرجديدي كه كشف شده است

.را دور مي اندازد) كوتاهتر از مسير اصلي باشداستفاده از جستجوي هزينه يكنواخت يا اول سطحي با

هزينه مرحله ثابت

(Partial Information)جستجو با اطالعات ناقص

:انواع مختلف ناقص بودن اطالعات به سه مسأله منجر می شود (Sensorless Problems) مسائل منطبق(مسائل بدون حسگر(

پذير رويت کامال محيط که درزمانی .ممکن پسين حالت ازچند يکی به اقدام يک انجام شدن منجرBelief-State( ممکن حالتهای مجموعه حالت، يک بجای بايد عامل نيست، Space مجموعه يا درنظرگرفته را ).است ممکن فيزيکی حالتهای درباره عامل باورفعلی نشاندهنده باور حالت

.نمايد واستدالل (Contingency Problems) مسائل اقتضائی

ادراکات هراقدام، ازانجام پس آنگاه باشند، غيرقطعی اگراقدامات يا پذير رويت نيمه اگرمحيط برنامه بايد که کند می تعريف را اقتضائی ممکن،هرادراک .کند می فراهم جديدی اطالعات عامل، مسأله يک را مسأله آن باشد، ديگر عامل يک اقدامات از ناشی قطعيت عدم اگر .شود ريزی

Adversarial) تخاصمی Problem)هرشاخه که است درخت شکل به اغلب حل راه .ناميم می .شود انتخاب است، شده دريافت درخت نقطه آن تا که ادراکاتی براساس است ممکن درخت

(Exploration Problems) مسائل اکتشافیمسائل . هنگامی که حالتها واقدامات محيط ناشناخته است، عامل بايد برای کشف آنها اقدام نمايد

. اکتشافی را می توان حدنهايی مسائل اقتضائی دانست

(Sensorless Problems)مسائل بدون حسگر

دنياي جاروبرقي

حالت 8هر : حالت اوليه Right Action حالت بعدي

{2,4,6,8}

فصل چهارمروشهای جستجو و اکتشاف آگاهانه

راهبردهای جستجوی آگاهانهInformed (Heuristic) Search Strategies

(Best-First Search) جستجوي اول بهترين TREE-SEARCHاست كه در آنها يا GRAPH-SEARCH نمونه اي از الگوريتم عمومي

.جهت گسترش انتخاب مي شود f(n) يك گره براساس يك تابع ارزياب

ازدانش خاص مسأله، فراتر از .تعريف مسأله، استفاده مي كند

(BFS)

.اگرتابع ارزياب كامال دقيق باشد، آنگاه گره بدست آمده بهترين است.اگرتابع ارزياب نادرست تعريف شود، جستجو را به بي راهه مي كشاند

. يک خانواده کامل است BFS الگوريتم های (Heuristic)

تابع هيوريستيک h(n) : تا گره هدف n هزينه تخمينی ارزانترين مسير ازگره

مسافتهای مستقيم به بخارست

Greedy Best-First Search (GBFS)

hSLD(In(Arad)) = 366 & hSLD(In(Bucharest)) = 0

366

ExpandhSLD(In(Arad)) = 366

Zerind و Timisoara چون از . نزديكتر است Bucharest به

چون از سه شهر ديگر به . نزديكتر است Bucharest

.چون مبدا شروع حركت است

ExpandhSLD(In(Sibiu)) = 253

ExpandhSLD(In(Faragas)) = 176

با استفاده از GBFS درمورد اين مسأله خاص، ، راه حل را بدون گسترش حتي يك گره hSLD

.خارج ازمسير راه حل ، پيدا مي كندحداقل بودن هزينه جستجو

مسيري كه از طريق. اما بهينه نيستBucharest و Sibiu به Fagaras

كيلومتر طوالني تر ازمسيري 32مي رسد ، RimnicuVilcea Pitesti و است كه از

.مي گذرد

(GBFS)

ممکن است يک مسير بی انتها را آغاز کند .وهرگز هيچ امکان ديگری را امتحان نکند

(GBFS)

شبيه جستجوي اول عمق است، چراكه تمايل .به دنبال كردن يك مسير درتمام طول راه دارد .برگشت به عقب درصورت برخورد به بن بست

)کمينه کردن کل هزينه تخمينی راه حل(

اولين کار معقول، امتحان گرهی است که که کمترين مقدارg(n)+h(n) را داراست.

A* اگر بهينه است ،h(n) بعبارتی ديگر، . يک هيوريستيک قابل قبول باشدh(n) هرگز رسيدن به.هدف را بيش ازاندازه واقعی برآورد نکند

f :برچسب گره ها = g + hExpandhSLD(In(Arad)) = 366g(In(Arad)) = 0

f = g + h = 0 + 366 = 366

ExpandhSLD(In(Sibiu)) = 253g(In(Sibiu)) = 140

f = g + h = 140 + 253 = 393

Sibiu انتخاب مي شود، چراكه. را دارد fكمترين هزينه

f = g + h = 220 + 193 = 413

f = g + h = 317 + 100 = 417

Expa

nd

f = g + h = 293 + 176 = 415

Admissible Heuristic

nهزينه رسيدن به g(n)زيرا .را بطور دقيق نشان مي دهد

جستجوی که دريافت توان می دهد، می توسعه است،f هزينه کمترين دارای که را ای لبه گره *A که علت اين بهA* هزينه که مرکز هم درنوارهای را هايی گره و کند می حرکت آغازين ازگره f کند می اضافه دارند، افزايشی.

380

400

420

(Arad)حالت اوليه

f = 380 , fترازهاي = 400 , f = 420گره هايي كه داخل يك تراز خاص

كوچكتر يامساوي fقراردارند، هزينه .مقدار تراز دارند

درهرحال، استفاده ازيک هيوريستيک خوب بازهم درمقايسه با استفاده .می شودصرفه جويی قابل توجهی ازيک جستجوی ناآگاهانه، باعث

A* براي هرتابع هيوريستيكي بطور بهينه موثراست .يعني هيچ الگوريتم بهينه ديگري تضمين نمي كند كه

.كمتر باشد *Aتعداد گره هايي كه توسعه مي دهد از

A* نيست عملی بزرگ، ازمسائل بسياری درمورد.

top related