نام درس: مباحث ويژه درپايگاه داده ها شماره مهارت : 03

57
يص ص خ ت گان واژ دي ي ل ک مات ل ک ون م ژ ا امه ي ب ا ي ک ت س ر ه ف ب ل مطا ل ي ق حه ف ص عد ب حه ف ص هاه داده گا اي: ه دژپ ژ ي و ت ح ا ي م ام دژس: پ: هاژت م ماژه ش03

Upload: csilla

Post on 21-Mar-2016

43 views

Category:

Documents


2 download

DESCRIPTION

نام درس: مباحث ويژه درپايگاه داده ها شماره مهارت : 03. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

نام درس: مباحث ويژه درپايگاه داده ها 03شماره مهارت :

Page 2: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: مباحث ويژه در پايگاه داده ها نام درسنام منبع : جزوه درسي دانشگاه پيام نور

نام مولف : دکتر احمد فراهيانتشارات : دانشگاه پيام نور

3تعداد واحد : رشته : مهندسي کامپيوتر گرايش نرم افزار

مقطع : کارشناسي ارشدنام استاد محتوا : دکتر احمد فراهي11/03شماره مهارت/ تعداد کل مهارت :

1390/11/07تاريخ توليد :

Page 3: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: روشها و الگوريتم های نام مهارت داده کاوی

آشنايي با تکنيک ها، روشها، الگوريتم : مهارتاهداف ها و فنون هاي مرتبط با داده کاوي

: تکنيک های روش 1زير مهارت : تکنيک های 2زير مهارت پيشگويی

: الگوريتم های 3زير مهارت روش توصيفیخوشه بندی

-K الگوريتم : 5زير مهارت Means

: الگوريتم 4زير مهارت Apriori

Page 4: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

اهداف مهارت فنون داده کاوي،- گروه نامتجانسي از علوم مختلف را شکل

مي دهند هر تکنيکي که بتواند بينش جديدي از داده ها را استخراج کند مي تواند داده کاوي به حساب آيد. به طور

داده کاوي پل ارتباطي ميان علم آمار،علم خالصه،گيري ماشين و يادکامپيوتر،هوش مصنوعي، الگو شناسي،

مي توان گفت در داده کاوي، بازنمايي بصري داده مي باشد. تئوري هاي پايگاه داده ها، هوش مصنوعي، يادگيري ماشين و علم آمار را در هم مي آميزند تا زمينه کاربردي فراهم شود.

Page 5: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش پيشگويی1زير مهارت روش هاي اصلي داده کاوي به دو دسته کلي تقسيم مي شوند:

توصيفي و پيشگويي. اين دو گروه، بيانگر اهداف و عملکرد روش هاي داده کاوي نيز هستند.

روش های داده کاوی

توصيفی

خوشه بندی

قوانين انجمنی

مدلسازی وابستگی

خالصه سازی

پيشگويی

دسته بندی

رگرسيون

پيش بينی

سر-ی های زمانی

Page 6: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش پيشگويی 1زير مهارت دسته بندی

دسته بندي يا طبقه بندي در واقع ارزشيابي ويژگي هاي مجموعه اي از داده ها و سپس اختصاص دادن آن ها به مجموعه اي از گروه هاي

از پيش تعريف شده است. اين متداول ترين قابليت داده كاوي مي باشد. در دسته بندي، به دنبال مدلي هستيم که با تشخيص

دسته ها مي تواند دسته ناشناخته اشياء ديگر را پيش بيني کند. دسته بندي جهت پيشگويي مقادير گسسته و اسمي مورد استفاده قرار

.مي گيرددسته بندي نوعي يادگيري است که به کمک نمونه ها صورت

مي گيرد و طبقه بندي بر اساس مجموعه هاي از پيش تعريف شده انجام مي شود لذا مي توان گفت دسته بندي يادگيري با نظارت

)هدايت شده( است. دسته بندي فرآيندي دو مرحله اي مي باشد. در گام اول، يک مدل بر اساس مجموعه داده هاي آموزشي موجود در پايگاه داده ها ساخته مي شود. اين مدل ها به فرم هايي از درخت

تصميم، يا فرمول هاي رياضي نمايش داده مي شود. مجموعه داده هاي آموزشي از رکوردها، نمونه ها، مثال ها و يا اشيائي که

شامل مجموعه اي از صفات يا جنبه ها مي باشد، تشکيل شده اند.

Page 7: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش پيشگويی 1زير مهارت دسته بندی

سيستم بر اساس اين مجموعه آموزشي به خود آموزش مي دهد يا به عبارتي پارامترهاي دسته بندي را براي خود مهيا مي کند. هر

نمونه يک برچسب کالس معلوم دارد، که به طور تصادفي از . گام بعدي پس از مرحله آموزش، مجموعه داده ها انتخاب مي شود

براي پيش بيني و تعيين دسته مي باشد. توسط قوانين صورت مي گيرد، آنگاه مدل مي تواند، جهت پيشگويي برچسب هاي کالس براي

داده هاي جديد -که داراي برچسب کالس نامعلوم هستند- مورد استفاده قرار گيرد.

تکنيک هاي داده كاوي كه براي دسته بندي به كار مي آيند عموماً شامل تکنيک هاي شبكه عصبي و درخت تصميم گيري هستند. دسته بندي کاربردهاي زيادي در بازرگاني، بانکداري، پزشکي، ارتباطات،

کشاورزي و غيره دارد. به عنوان مثال طبقه بندي در بازاريابي هدف، تصويب اعتبار و بررسي تقلب است. از جمله کاربردهاي

ديگر دسته بندي، متن کاوي مي باشد.

Page 8: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش پيشگويی 1زير مهارت رگرسيون

رگرسيون بهترين مدلي است که ميتواند متغيرهاي خروجي را با متغيرهاي ورودي متعدد ارتباط دهد. ساده ترين حالت آن، مدل به

ارزش خطي است، يعني ارتباط بين متغيرهاي ورودي و خروجي را به صورت خطي برقرار مي کند. از نقطه نظر کلي، دسته بندي و

رگرسيون دو نوع اصلي از مسائل پيشگويي هستند، که دسته بندي، جهت پيشگويي مقادير گسسته و اسمي مورد استفاده قرار

مي گيرد، در حالي که رگرسيون جهت پيشگويي مقادير پيوسته مورد استفاده قرار مي گيرد. انواع مدل هاي يكساني را مي توان هم

براي رگرسيون و هم براي دسته بندي استفاده کرد. براي مثال را مي توان هم براي ساخت CARTالگوريتم درخت تصميم

درخت هاي دسته بندي و هم درخت هاي رگرسيون استفاده کرد. شبکه هاي عصبي را نيز مي توان براي هر دو مورد استفاده كرد

Page 9: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش پيشگويی 1زير مهارت سري هاي زماني

تحليل سري هاي زماني تكنيكي ديگر در داده كاوي كه هدف از آن، يافتن خصوصيات جالب توجه و نظم هاي مشخص در حجم باالي

داده است. يکي از سري هاي زماني دنباله اي مرتب شده از مشاهدات است که،ارزش يک شيء را به عنوان تابعي از زمان در

مجموعه داده هاي جمع آوري شده توصيف مي کند. رخداد وقايع متوالي در اصل مجموعه ي وقايعي است كه بعد از يك واقعه ي

مشخص به وقوع مي پيوندند.پيش بيني

پيش بيني يکي از تكنيك داده كاوي است که در اين تكنيك مقادير ممكن براي متغيرهاي نامعلوم پيش بيني مي شود. از شبكه هاي

عصبي و الگوريتم ژنتيك براي پيش بيني استفاده مي شود.

Page 10: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت در روش هاي توصيفي، خواص عمومي داده ها بيان مي شود. هدف

از توصيف، يافتن الگوهايي در مورد داده هاست که براي انسان قابل تفسير باشد. روش توصيفي نيز شامل تکنيک هاي: خوشه

بندي، خالصه سازي، کشف توالي )تحليل دنباله( ، قوانين انجمني مي باشد.

خوشه بندي داده با هم، در يک حجم خوشه بندي، گروه بندي نمونه هاي مشابه

مي باشد. خوشه بندي يک دسته بندي بدون نظارت )هدايت نشده( است که دسته ها از قبل تعريف نشده اند. در خوشه بندي -بر خالف طبقه بندي که هر داده به يک طبقه ي )کالس( از پيش مشخص شده

تخصيص مي يابد- هيچ اطالعي از کالس هاي موجود درون داده ها وجود ندارد و به عبارتي خود خوشه ها نيز از داده ها استخراج

مي شوند.

Page 11: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت هدف از خوشه بندي اين است که داده هاي موجود، به چند گروه 

تقسيم  شوند و در اين تقسيم بندي داده هاي گروه هاي مختلف حداکثر تفاوت ممکن را به هم داشته باشند و داده هاي موجود در يک گروه بايد بسيار به هم شبيه باشند. )تشابه يا عدم تشابه بر

اساس معيارهاي اندازه گيري فاصله تعريف مي شود.( پس از اينکه داده ها به چند گروه منطقي و توجيه پذير تقسيم شدند از اين تقسيم بندي مي توان براي کسب اطالعات در مورد داده ها يا

تقسيم داده ها جديد استفاده کنيم.خوشه بندي کاربردهاي متعددي دارد. اغلب از خوشه بندي به

عنوان اولين گام در فرايندهاي داده كاوي ياد مي شود كه قبل از ساير فرايندها براي شناسايي گروهي از ركوردهاي مرتبط با هم كه

بعداً بتوانند نقطه آغاز تحليل ها باشند، بر روي ركوردها اعمال مي شود. در برخي موارد براي تشخيص داده هاي پرت که با ساير داده ها تفاوت چشمگير دارند )مورد کاربرد در کشف وقوع جرم و

تخلف در عمليات بانکي يا در وب(، استفاده مي شود

Page 12: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت قوانين انجمني

استخراج قواعد انجمني، نوعي عمليات داده کاوي است که به جستجو براي يافتن ارتباط بين ويژگي ها در مجموعه داده ها

مي پردازد. نام ديگر اين روش، تحليل سبد بازار است. اين روش به دنبال استخراج قواعد، به منظور کمي کردن ارتباط ميان دو يا چند خصوصيت مي باشد. قواعد انجمني ماهيتي احتمالي دارد و به شکل

اگر و آنگاه و به همراه دو معيار پشتيبان و اطمينان تعريف مي شوند. اين دو شاخص به ترتيب مفيد بودن و اطمينان از قواعد

مکشوفه را نشان مي دهند.معيار اطمينان: ميزان وابستگي يک کاالي خاص را به ديگري بيان

را محاسبه Y و Xمي کند. يعني درجه وابستگي بين دو مجموعه مي کند و به عنوان شاخصي براي اندازه گيري توان يک قاعده در

نظر گرفته مي شود.(: نشان دهنده درصد يا تعداد تراکنش هايي X,Yمعيار پشتيبان )

)زيرمجموعه هايي از اقالم خريداري شده( است که شامل هر دوي باشند.Y و Xاقالم )مجموعه اقالم(

Page 13: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت قوانين انجمني

مثال هايي از کاربرد قوانين انجمني مي تواند اين گونه باشد:بررسي اينکه چه اقالمي در يک فروشگاه با هم خريداري مي شوند

و اينکه چه اقالمي هيچ گاه خريداري نمي شوند.بررسي ارتباط بين توانايي خواندن کودکان با خواندن داستان

توسط والدين براي آن ها.اگر مجموعه اي از عناصر، حداقل پشتيباني را داشته باشند،

"مکرر" خوانده مي شوند. "قواعد قوي" قواعدي هستند که به طور توامان داراي مقدار

پشتيبان و اطمينان بيش از آستانه باشند. با استفاده از اين مفاهيم پيدا کردن قواعد انجمني در دو گام

خالصه مي شود،: پيدا کردن مجموعه هاي مکرر و استخراج قواعد قوي.

Page 14: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت خالصه سازي )تلخيص(

در برگيرنده روش هايي براي يافتن يک توصيف فشرده از زير مجموعه اي از داده ها است. به عنوان مثالي ساده مي توان اشاره

داشت به: تهيه ي جدول ميانگين و انحراف معيار براي تمام فيلدها. روش هاي پيچيده تر شامل استنتاج قواعد خالصه، فنون مصورسازي

چند متغيره و کشف رابطه تابعي بين متغيرهاست. کاربرد فنون تلخيص معموالً در تحليل اکتشافي داده ها و توليد گزارش خودکار به

کار برده مي شوند.

Page 15: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: تکنيک های روش توصيفی2زير مهارت مدل سازي وابستگي )تحليل لينک(

شامل يافتن مدلي براي توصيف وابستگي هاي معني دار بين متغيرهاست. مدل هاي وابستگي در دو سطح وجود دارند: سطح ساختاري و سطح کّمي. در سطح ساختاري، مدل از طريق رسم شکل مشخص مي کند که کدام متغيرها به طور محلي به ديگري وابسته اند. در سطح کّمي، مدل قدرت وابستگي ها را با مقياس

عددي مشخص مي کند. مقدم و A نمايش داده مي شوند كه به A->Bوابستگي ها به صورت

موخر يا نتيجه گفته مي شود. مثالً اگر يك قانون به صورت زير Bبه داشته باشيم:

"اگر افراد چكش بخرند، آنگاه آن ها ميخ خواهند خريد" در اين قانون مقدم، خريد چكش و نتيجه، خريد ميخ مي باشد.

Page 16: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: الگوريتم های خوشه بندی3زير مهارت بندي بر خالف طبقه بندي که هر داده به يک طبقه )کالس( در خوشه

از پيش مشخص شده تخصيص مي يابد هيچ اطالعي از کالس هاي موجود درون داده ها وجود ندارد و به عبارتي خود خوشه ها نيز از داده ها استخراج مي شوند. لذا مي توان گفت خوشه بندي نوعي يادگيري بدون نظارت )هدايت نشده( است يعني نوعي يادگيري

است که به وسيله ي مشاهدات انجام مي شود نه با مثال ها.خوشه بندي در انجام فعاليت داده کاوي در موارد زير استفاده

مي شود:تجزيه و تحليل شباهت يا عدم شباهت: تحليل اينکه کدام نقاط داده

در يک نمونه به يکديگر شبيه هستند.تشخيص داده هاي پرت: تشخيص داده هايي که با ساير داده ها

تفاوت چشمگيري دارند.کاهش بُعد )حجم(: به عنوان پيش پردازش داده ها قبل از

فعاليت هاي داده کاوي، مي توان حجم يا بُعد داده ها را به وسيله ي تکنيک هاي خوشه بندي، کاهش داد.

Page 17: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: الگوريتم های خوشه بندی3زير مهارتمعيارهاي ارزيابي الگوريتم هاي خوشه بندي

براي ارزيابي و سنجش انواع الگوريتم هاي خوشه بندي، معيارهاي متعددي مطرح مي شود:

- امکان اعمال بر روي تعداد نمونه هاي زياد1- توانايي پردازش انواع متفاوت خصيصه2- اداره ي داده هاي بعد باال3- توانايي اداره کردن داده هاي پويا4- توانايي پردازش داده هاي پرت و اغتشاش5- کشف خوشه ها با اشکال دلخواه6- ميزان وابستگي به پارامترهاي ورودي7- حساسيت به ترتيب رکوردهاي ورودي8

Page 18: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

: الگوريتم های خوشه بندی3زير مهارتطبقه بندي روش هاي خوشه بندي

خوشه بندي انحصاري و خوشه بندي باهمپوشي در روش خوشه بندي انحصاري پس از خوشه بندي، هر داده دقيقأ به

. ولي در K-Meansيک خوشه تعلق مي گيرد مانند روش خوشه بندي خوشه بندي باهمپوشي پس از خوشه بندي، به هر داده يک درجه ي تعلق به ازای هر خوشه نسبت داده مي شود. به عبارتي يک داده

مي تواند با نسبت هاي متفاوتي به چندين خوشه تعلق داشته باشد. نمونه اي از آن خوشه بندي فازي است. 

خوشه بندي سلسله مراتبي و خوشه بندي مسطح با توجه با اينکه روش هاي خوشه بندي سلسله مراتبي اطالعات بيشتر و دقيق تري توليد مي کنند براي تحليل داده هاي با جزئيات پيشنهاد مي شوند ولي از طرفي چون پيچيدگي محاسباتي بااليي

دارند براي مجموعه داده هاي بزرگ روش هاي خوشه بندي مسطح پيشنهاد مي شوند.

Page 19: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت Apriori.يک الگوريتم کالسيک براي قوانين انجمني است

اين الگوريتم به صورت تکراري مجموعه آيتم هاي 2( را در پايگاه داده ها مشخص مي کند.هر تکرار iterativeتکراري)

مرحله دارد: توليد کانديد، شماره و انتخاب کانديد. مجموعه آيتمي تايي مي i نمونه از آيتم هاست را مجموعه آيتم Iکه شامل

( i-itemsetنامند.) تايي محاسبه مي i همه تکرار هاي مجموعه آيتم iدر تکرار

شوند.)شمرده مي شوند(در مجموعه تراکنش هاي پايگا ه داده ها با اطمينان X=>Yقانون

(Confidence )c برقرار است، اگر c از تراکنش هايي که شامل %X هستند،- شامل Y.هستند

در مجموعه تراکنش هاي پايگا ه داده ها داراي X=>Yقانون % از تراکنش ها در پايگاه داده s است، اگر s( Supportپشتيبان )

باشند. XUYها شامل

Page 20: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت Apriori.يک الگوريتم کالسيک براي قوانين انجمني است

( itrativeاين الگوريتم به صورت تکراري مجموعه آيتم هاي تکراري) مرحله دارد: توليد 2را در پايگاه داده ها مشخص مي کند.هر تکرار

نمونه Iکانديد، شماره و انتخاب کانديد. مجموعه آيتمي که شامل ( i-itemset تايي مي نامند.)iاز آيتم هاست را مجموعه آيتم

تايي محاسبه مي i همه تکرار هاي مجموعه آيتم iدر تکرار شوند.)شمرده مي شوند(

در مجموعه تراکنش هاي پايگا ه داده ها با اطمينان X=>Yقانون (Confidence )c برقرار است، اگر c از تراکنش هايي که شامل %X هستند،- شامل Y.هستند

در مجموعه تراکنش هاي پايگا ه داده ها داراي X=>Yقانون % از تراکنش ها در پايگاه داده s است، اگر s( Supportپشتيبان )

باشند. XUYها شامل

Page 21: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت به عنوان مثال پايگاه داده زير را در نظر بگيريد،فرض کنيد حداقل

باشد.s=50%مقدار پشتيبان ITEMS TIDACD

BCE

ABCE

BE

001

002

003

004

در مرحله اول از اولين تکرار)توليد کانديد( همه آيتم ها به عنوان -1 تايي)1 مجموعه آيتم 5کانديد در نظر گرفته مي شوند.بنابراين

items ،مجموعه 4( تشکيل مي شود.در مرحله دوم از اولين تکرار انتخاب مي L1( به عنوان مجموعه items-1 تايي )1از آيتم

يا بيشتر مي باشد.50شوند، چرا که مقدار پشتيباني آنها %

Page 22: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت در تکرار اول در شکل زير Aprioriنتايج حاصل از تکرار الگوريتم

آمده است: S]%[ Counts Larg 2-itemsets L2 S]%[ Counts 1-items C1 1-itemset C1

50 2 {A} 50 2{A}

{A}

75 3 {C} 75 3{C}

{C}

25 1{D}

{D}

75 3 {B} 75 3{B}

{B}

75 3 {E} 75 3{E}

{E}

B1) count phase B2) select phasea) Generate phase

Page 23: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت از نتايج مرحله L2 وC2در تکرار دوم براي توليد مجموعه هاي

قبلي استفاده مي شود.همه ي زير مجموعه هاي يک مجموعه آيتم بزرگ نيز بايد شرط

براي توليد Aprioriحداقل پشتيبان را برآورده کنند.الگوريتم استفاده مي کند، که عملگر * به L1*L2 از C2مجموعه کانديد

صورت زير توصيف مي گردد:Lk * Lk ={ XUY where X,Y ɛ Lk ,|X∩Y=K-1 }

در تکرار Apriori نتايج حاصل از اجراي عملگر* توسط الگوريتم دوم در اساليد بعدی آمده است.

Page 24: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت

S]%[ Counts Larg 2-itemsets L2 S]%[ Counts 2-itemset 2-itemset C2

{A,B} 25 1 {A,B} {A,B}

50 2 {A,C} 50 2 {A,C} {A,C}

{A,E} 25 1 {A,E} {A,E}

50 2 {B,C} 50 2 {B,C} {B,C}

75 3 {B,E} 75 3 {B,E} {B,E}

50 2 {C,E} 50 2 {C,E} {C,E}

Page 25: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

Apriori : الگوريتم 4زير مهارت تايي که شرط حداقل پشتيباني را برآورده 2مجموعه آيتم هاي

مي کنند، مالحظه مي فرماييد.به همين ترتيب در تکرار سوم ، توليد مي شود. مجموعه L2 * L2 توسط L2 از روي C3مجموعه

آيتم هاي دو تايي که داراي عضو اول يکسان هستند، همان ابتدا { سپس الگوريتم بررسي مي کند B,E{و }B,Cانتخاب مي شوند: }

تايي هست يا 2{ خودش يک مجموعه آيتم C,Eکه آيا مجموعه } تايي 2{ خودش يک مجموعه آيتم C,Eخير، با توجه به شرط اينکه }

{ نيز B,C,Eهست، معلوم مي شود که همه زير مجموعه هاي }{ يک B,C,Eشرط حداقل پشتيبان را فراهم مي نمايند. بنابراين }

سپس تمام تراکنش Apriori است.itemset-3کانديد يک کانديد را بصورت ذيل تعريف L3هاي پايگاه داده را بررسي مي کند و

مي نمايد:

S]%[ Counts Larg 3-itemsets L3 S]%[ Counts 3-itemset C3 3 -itemset C3

50 2 {B,C,E} 50 2 {B,C,E} {B,C,E}

Page 26: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت اين الگوريتم يک متد ساده تکرار شونده است، و براي خوشه بندي

( Kمجموعه اي از داده ها ي در اختيار در تعداد مشخصي خوشه ) توسط K_Meansکه کاربر تعيين مي کند کاربرد دارد.الگوريتم

محققين متعدد و به روش هاي مختلفي بيان شده است. بيشترين استفاده در عمل تقسيم بندي خوشه K_Meansالگوريتم

ها را دارد و الگوريتمي بسيار ساده، قابل فهم و بطور منطقي قابل مقياس بندي است و مي توان آن را به سادگي اصالح کرد تا

با سناريوهاي مختلف مانند يادگيري شبه مشاوره يا داده هاي جاري سروکار داشته باشد. پيشرفت ها و کليت هاي مداوم الگوريتم پايه،

ارتباط مداوم آن را تضمين مي کند و به تدريج بر تأثير گزاري آن افزوده است.

n را به عنوان ورودي گرفته و مجموعه ي kاين الگوريتم پارامتر خوشه افراز مي کند به طوري که سطح شباهت kشيء را به

داخلي خوشه ها باال و سطح شباهت اشياء بيرون خوشه ها پايين باشد. شباهت هر خوشه نسبت به متوسط اشياء آن خوشه -که

مرکز خوشه ناميده مي شود- سنجيده مي شود.

Page 27: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت k-meansگام هاي الگوريتم

نقطه ي دلخواه به عنوان مراکز خوشه هاي k: انتخاب 1گام   نقطه ي موجود n نقطه از kابتدايي به صورت تصادفي )بهتر است

انتخاب شود.(: تخصيص هرشي به خوشه ها با توجه به بيشترين شباهت آن 2گام

به مراکز خوشه ها. : به روز کردن مراکز خوشه ها به اين معني که براي هر 3گام

خوشه، ميانگين اشياء آن خوشه،- محاسبه مي شود.با توجه به مراکز جديد خوشه ها، تا 2: بازگشت به قدم 4گام

هنگامي که هيچ تغييري در خوشه ها رخ ندهد. )در اين حالت الگوريتم پايان يافته است(

Page 28: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت

Page 29: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت k-meansويژگي هاي الگوريتم

.O(tkn)پيچيدگي محاسباتي الگوريتم:   ( n ،تعداد کل اشيا : k ،تعداد خوشه ها :t تعداد تکرارهاي :

الگوريتم(.( توسط کاربر بايد تعيين شود و kپارامتر ورودي: تعداد خوشه ها )

kراه خاصي براي تعيين آن مشخص نشده است. )يک راه، امتحان مي باشد(kهاي مختلف و بررسي معيار مربع خطا براي هر

نوع داده ي ورودي: اين الگوريتم با داده هاي از نوع عددي، انجام پذير است.

مقياس پذيري: اين الگوريتم براي پايگاه داده هاي بزرگ، کارا نيست و نياز به توسعه دارد.

مواجهه با اغتشاش: از مهم ترين نقاط ضعف اين روش، حساسيت در برابر اغتشاشات و نقاط پرت است زيرا در اين روش از

ميانگين داده ها استفاده شده که به راحتي تحت تأثير داده هاي پرت قرار مي گيرد.

Page 30: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت k-meansويژگي هاي الگوريتم

شکل خوشه: اين الگوريتم هنگامي که خوشه ها به صورت ابرهاي  فشرده هستند و اين ابرها نيز خودشان از يکديگر مجزا هستند، به

خوبي عمل مي کند لذا اين روش تنها خوشه هاي کروي شکل را تشخيص داده و براي کشف خوشه هايي با شکل هاي پيچيده به

خصوص غير محدب، مناسب نيست. اين روش اغلب به يک بهينه محلي ختم مي شود نه يک بهينه ي

سراسري.

Page 31: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

K-Means : الگوريتم 5زير مهارت : براي رفع اشکاالت الگوريتم k-meansرفع اشکاالت الگوريتم

k-means روش هايي توسعه يافته که در انتخاب k ،مرکز اوليه محاسبه ي عدم شباهت و استراتژي هاي محاسبه مراکز خوشه ها با يکديگر متفاوتند. يکي از اين تغييرات اين است که ابتدا روي پايگاه

داده، توسط الگوريتم تجميع سلسله مراتبي، تعداد خوشه هاي مطلوب را پيدا کرده و سپس از خوشه هاي بدست آمده،- به عنوان

استفاده مي شود.k-meansمرحله اول الگوريتم مي باشد. k-modes روش k-means يکي ديگر از روش هاي مشابه

براي استفاده از داده هاي طبقه اي k-meansکه توسعه يافته ي است و به جاي استفاده از مراکز خوشه ها،- از مدهاي خوشه ها )روش مبتني بر فراواني( استفاده مي کند. لذا از يک رابطه ي

اندازه گيري عدم شباهت جديد براي داده هاي اسمي يا طبقه اي استفاده مي کند. از مزاياي روش فوق، جبران نقص حساسيت

نسبت به داده هاي دور از مرکز مي باشد زيرا ميانه )مد( از مقادير بزرگ تأثير نمي پذيرد. اما ايراد روش اين است که بعضاً نماينده

خوشه ها از ميان اشيا انتخاب نمي شود.

Page 32: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

خالصه مهارتفنون داده کاوي، گروه نامتجانسي از علوم مختلف را شکل

مي دهند هر تکنيکي که بتواند بينش جديدي از داده ها را استخراج داده کند مي تواند داده کاوي به حساب آيد. به طور خالصه،

کاوي پل ارتباطي ميان علم آمار،علم کامپيوتر،هوش مصنوعي، الگو شناسي، فراگيري ماشين و بازنمايي بصري داده مي باشد.

مي توان گفت در داده کاوي، تئوري هاي پايگاه داده ها، هوش مصنوعي، يادگيري ماشين و علم آمار را در هم مي آميزند تا

زمينه کاربردي فراهم شود.داده کاوي يکي از پيشرفت هاي اخير در صنعت مديريت داده ها

است.در اصل داده کاوي مجموعه اي از فنون مي باشد که به شخص اين امکان را مي دهد تا وراي داده پردازي معمولي

حرکت کند و به استخراج اطالعاتي درانبوه داده هاي مخفي يا پنهان دست پيدا کند.براي داده کاوي الگوريتم ها و روش هاي

بسياري معرفي شده است ولي موضوع مورد نظر انتخاب تعدادي از اين الگوريتم ها و توضيح مختصر در مورد آنها مي

باشد.

Page 33: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

کلمات کليدي مهارتAssociation rules-Classification-Cluster Analysis

Genetic algorithms-High Dimension-Market Basket AnalysisPredict-Time series

Page 34: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

واژگان تخصصي مهارتواژه التين ترجمه

واژهArbitrary Shape

اشکال دلخواه

Artificial Intelligenceهوش

مصنوعيAssociation rules

قوانين انجمني

Classification دسته بندي

واژه التين ترجمه واژه

Cluster خوشه

Cluster Analysis تحليل خوشه اي

Confidence اطمينان

Datasetداده ها ي در

اختيارDendogram دندوگرام

Discovery Sequence کشف توالي

Dissimilaty عدم تشابه

Distance Function تابع فاصله

E-Mailنامه هاي

الكترونيكيExclusive or Hard Clustering

خوشه بندي انحصاري

واژه التين ترجمه واژه

Flat مسطح

Frequent مکرر

Genetic algorithmsالگوريتم

ژنتيکGlobal Optimum

بهينه ي سراسري

Heuristicsروش

هيورستيکيHierarchical

خوشه بندي سلسله مراتبي

High Dimensionداده هاي بعد

باالImage Processing پردازش تصوير

Label برچسب

Linear fitness ارزش خطي

Page 35: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

واژگان تخصصي مهارتواژه التين ترجمه

واژهTime series

سري هاي زماني

Transaction تراکنش

Virtual مجازي 

واژه التين ترجمه واژه

local Optimum بهينه محلي

Market Basket Analysisتحليل سبد

بازارMode مد

Non-Convex غير محدب

Object ءشي

On-Line Analytical Processing(OLAP)

پردازش تحليلي پيوسته

Overlapping or Soft Clustering

خوشه بندي باهمپوشي

Partition Around Medoids

PAM

Predict پيش بيني

Property ويژگي

واژه التين ترجمه واژه

Random تصادفي

Real-time بالدرنگ

Record رکوردها

Sequence Analysis تحليل دنباله

Similarity تشابه

Similarity Analysisتجزيه و تحليل

شباهتStrong قوي

Summarization خالصه سازي

Supervised هدايت شده

Support پشتيبان

Page 36: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون تشريحي

آزمون مهارت

آزمون چهار گزينه اي

Page 37: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي . تکنيک هاي » رگرسيون « و » قوانين انجمن « به 1

ترتيب جزء کداميک از روش هاي اصلي مي باشند؟الف( توصيفي - پيشگويي

ب( هردو پيشگويي ج( هر دو توصيفي

د( پيشگويي- توصيفي

Page 38: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي . تعريف زير بيان کننده کداميک از روش هاي داده 2

کاوي مي باشد؟» ارزشيابي ويژگي هاي مجموعه اي از داده ها و سپس اختصاص

دادن آن ها به مجموعه اي از گروه هاي از پيش تعريف شده است و جهت پيشگويي مقادير گسسته و اسمي مورد استفاده قرار

«.مي گيردالف( رگرسيونب( دسته بندي

ج( قوانين انجمنيد( موارد الف و ج

Page 39: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي .کداميک از موارد زير صحيح نمي باشد؟3

الف( رگرسيون بهترين مدلي است که ميتواند متغيرهاي خروجي را با متغيرهاي ورودي متعدد ارتباط دهد.

ب( دسته بندي، جهت پيشگويي مقادير گسسته و اسمي، و رگرسيون جهت پيشگويي مقادير پيوسته مورد استفاده قرار مي گيرد.

فقط براي ساخت درخت هاي دسته CARTج( الگوريتم درخت تصميم بندي استفاده مي شود.

د( روش توصيفي شامل تکنيک هاي خوشه بندي، خالصه سازي، کشف توالي )تحليل دنباله( ، قوانين انجمني مي باشد.

Page 40: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي . به ساختار سلسله مراتبي حاصل از روش هاي 4

بندي سلسله مراتبي .......... گفته مي شود.خوشهClusterالف(

Dendogramب( Datalogج(Datasetد(

Page 41: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي . کداميک از موارد زير جزء ويژگي هاي ارزيابي 5

الگوريتم خوشه بندي نيست؟الف( امکان اعمال بر روي تعداد نمونه هاي زياد

ب( اداره ي داده هاي بعد باالج( عدم توانايي پردازش داده هاي پرت و اغتشاش

د( توانايي پردازش انواع متفاوت خصيصه

Page 42: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

. کداميک از موارد زير صحيح نمي باشد؟6آزمون چهار گزينه اي بندي انحصاري پس از خوشه بندي، هر داده الف( در روش خوشه

-Kدقيقا به يک خوشه تعلق مي گيرد مانند روش خوشه بندي Means.

ب( در خوشه بندي باهمپوشي پس از خوشه بندي، به هر داده يک درجه ي تعلق به ازاء هر خوشه نسبت داده مي شود.

روش خوشه بندي سلسله مراتبي داراي پيچيدگي محاسباتي کم مي باشد.

د( مجموعه داده هاي بزرگ روش هاي خوشه بندي مسطح پيشنهاد مي شوند.

Page 43: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

صحيح نمي Apriori. کدام گزينه در مورد الگوريتم 7آزمون چهار گزينه اي باشد؟ يک الگوريتم کالسيک براي قوانين انجمني است.Aprioriالف(

ب( اين الگوريتم به صورت تکراري مجموعه آيتم هاي 2( را در پايگاه داده ها مشخص مي کند.هر تکرار itrativeتکراري)

مرحله دارد: توليد کانديد، شماره و انتخاب کانديد. يک الگوريتم پر کاربرد در خوشه بندي است.Aprioriج(

د( موارد الف و ب.

Page 44: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي . کداميک از گزينه هاي زير صحيح است؟8

بيشترين استفاده در عمل تقسيم بندي k_Meansالف( الگوريتمخوشه ها را دارد.

.k-means: O(tkn)ب( پيچيدگي محاسباتي الگوريتمج( نوع داده هاي ورودي اين الگوريتم از نوع عددي مي باشد.

د( همه موارد.

Page 45: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

آزمون چهار گزينه اي است که براي k-means. اين روش توسعه يافته ي 9

استفاده از داده هاي طبقه اي، به جاي استفاده از مراکز خوشه ها، از مدهاي خوشه ها )روش مبتني بر

فراواني( استفاده مي کند.k-modesالگوريتم الف(

EM ب( الگوريتم CARTج( الگوريتم Aprioriد( الگوريتم

Page 46: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

1پاسخنامه آزمون چهارگزينه اي

گزينه صحيح شماره سوال

د 1ب 2ج 3ب 4ج 5ج 6د 7د 8

الف 9

Page 47: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

آزمون تشريحي

صفحه قبل

صفحه بعد

داده کاوي را در يک جمله تعريف کرده و ارتباط آن را با 1.کشف دانش ذکر نماييد.

هدف از انجام داده کاوي پيشگويانه چيست؟2.

هدف از انجام داده کاوي توصيفي چيست؟3.

تفاوت هاي بين علم آمار و داده کاوي را بيان نماييد.4.

چرخه عمر يک پروژه داده کاوي را نام ببريد.5.

گام درک داده ها در داده کاوي چند بخش است؟ آنها را نام 6.ببريد.

راهبردهاي برخورد با مقادير مفقودشده را نام ببريد.7.

تکنيک هاي تلخيص داده ها را نام ببريد.8.

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

Page 48: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

1پاسخنامه سوال تشريحي داده کاوي فرآيندي تکراری است که پيشرفت آن در کشف

دانش ، هم به روش دستي و هم به روش خودکار امکان پذير است. درحقيقت ، داده کاوي ، تالش مشترک بين

انسان ها وکامپيوترهاست که در آن، جستجوي الزم براي کشف اطالعات جديد وارزشمند ازميان حجم بسيار زياد

داده ها صورت مي گيرد.

Page 49: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

2پاسخنامه سوال تشريحي در انتهاي طيف پيشگويي، هدف داده کاوي ايجاد مدلي

است که به صورت يک برنامه و کداجرايي مي باشد و مي تواند براي دسته بندي ، پيشگويي ، برآورد و ديگر اعمال

مشابه مورد استفاده قرارگيرد

Page 50: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

3پاسخنامه سوال تشريحي در انتهاي طيف توصيف ، هدف ، بدست آوردن يک درک و

شناخت از سيستم تحليل شده از طريق کشف الگوها و روابط آشکار در مجموعه داده هاي بزرگ مي باشد

Page 51: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

4پاسخنامه سوال تشريحي آمار يک علم تاييدي است؛ يعني کوشش دارد مفروضاتي را با استفاده از تکنيک هاي مختلف تصديق يا رد کند، درحاليکه

است، بدين معني که سعي داده کاوي يک علم اکتشافيدر کشف الگوهاي دانشي از داده هاي موجود دارد. از

سوي ديگر آمار استنتاجي از نمونه هاي کوچک و بسط آنها به جامعه استفاده مي کند و ماهيتا توان پردازش نمونه هاي بزرگ را ندارد در حاليکه در داده کاوي از نمونه هاي بسيار

بزرگ و حتي خود جامعه استفاده مي شود

Page 52: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

4پاسخنامه سوال تشريحي آمار يک علم تاييدي است؛ يعني کوشش دارد مفروضاتي را با استفاده از تکنيک هاي مختلف تصديق يا رد کند، درحاليکه

است، بدين معني که سعي داده کاوي يک علم اکتشافيدر کشف الگوهاي دانشي از داده هاي موجود دارد. از

سوي ديگر آمار استنتاجي از نمونه هاي کوچک و بسط آنها به جامعه استفاده مي کند و ماهيتا توان پردازش نمونه هاي بزرگ را ندارد در حاليکه در داده کاوي از نمونه هاي بسيار

بزرگ و حتي خود جامعه استفاده مي شود

Page 53: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

5پاسخنامه سوال تشريحي گام درك موقعيت کسب و کار- 1گام درك داده ها - 2گام پيش پردازش داده ها - 3گام مدلسازي - 4گام ارزيابي مدل و استنتاج مدل- 5گام به کارگيري - 6

Page 54: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

6پاسخنامه سوال تشريحي - جمع آوري داده ها1بکارگيري تحليل اکتشافي داده ها براي دستيابي به يک - 2

ديد اوليهارزيابي کيفيت داده ها- 3

Page 55: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

7پاسخنامه سوال تشريحي رکردن مقدار مفقوده بصورت دستي- پ1حذف رکورد مربوطه - 2استفاده از مقدار ثابت جهت پرکردن داده هاي مفقود - 3استفاده از ميانگين مقادير خصيصه مورد نظر- 4استفاده از ميانگين نمونه هاي مشابه يا استفاده از - 5

محتمل ترين مقدار جايگزين. اين جايگذاري ممكن است با استفاده از رگرسيون يا ساير روشهاي مدلسازي انجام

شود.

Page 56: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

8پاسخنامه سوال تشريحي - کاهش بعد1- فشرده سازي داده ها2- مجزا سازي داده ها 3

Page 57: نام  درس: مباحث ويژه درپايگاه داده ها  شماره  مهارت : 03

واژگان تخصصي

کلمات کليدي

آزمون

کتابنامه

فهرست مطالب

صفحه قبل

صفحه بعد

کتابنامه

Mehmed Kantardzic ,Data Mining: Concepts, Models, Methods, and Algorithms, John Wiley & Sons , 2003 .