clusterin k means

Post on 12-Jan-2017

348 Views

Category:

Technology

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Clustering

فهرست

؟ چیست کالسترینگ ؟ چیست در بندی طبقه با کالسترینگ تفاوت ) ( بندی خوشه کردن کالستر در موجود مشکالت بندی خوشه های روش انواع الگوریتم k-means شرح الگوریتم k-nearest شرح کاربردی مثال چند

؟ چیست بندی خوشه

  باشند داشته شباهت هم به که مي‌شود گفته داده‌ها از مجموعه‌اي به .خوشه‌

طبقه‌‌بندي مقابل در خوشه‌بندي. داریم شده تعیین پيش از کالس سری یک بندی طبقه در

ها داده در موجود های کالس از اطالعی هیچ بندی خوشه درنداریم .

خوشه‌بندي روش‌هاي

( انحصاري مقابل( Exclusive‌or‌Hard‌Clusteringخوشه‌بندي درهم‌پوشي ) با ( Overlapping‌or‌Soft‌Clusteringخوشه‌بندي

( مراتبي سلسله مقابل( Hierarchicalخوشه‌بندي درمسطح ) (Flatخوشه‌بندي

مراتبي سلسله خوشه‌بندي روشهاي

پايين به (Top-Down )باالکننده ) تقسيم ( :Divisiveيا

( باال به ( Bottom-Upپايينشونده ) متراکم ( :Agglomerativeيا

روش با Single-Linkخوشه‌بندي

dAB=‌min‌dij‌‌A‌j‌‌B

مي‌شود استفاده زير معيار از خوشه دو بين شباهت محاسبه براي روش اين :در

برای single-linkمثالداشتن  فرض جدول 6با در که آنها بين فاصله ماتريس و داده ، 1نمونه نشان‌داده

الگوریتم عملکرد دهیم :single-linkنحوه می نشان را

روش با Complete-Linkخوشه‌بنديخالف • بر الگوریتم این کنیم : single-linkدر می استفاده زیر شباهت معیار از

روش با Average-Linkخوشه‌بنديکاهش میکنیم : noiseبرای استفاده زیر معیار از که شود می استفاده روش این از

k-meansالگوریتم

مي‌شود محسوب مسطح و انحصاري روشي روش . اين

عملکرد : نحوه1: اولیه- دهی مقدار k. گیرد می نظر در اولیه مراکز عنوان به را نقطه

2-K. دهد می تشکیل مرکز ترین نزدیک به نقاط تمام تخصیص با را خوشه3. شوند- می محاسبه دوباره خوشه هر مراکز

4. نکنند- تغییر مراکز که زمانی تا تکرار

k-nearestالگوریتم

. موجود های خوشه در جدید عضو یک بندی خوشه برای است الگوریتمیtell‌me‌who‌your‌neighbors‌are,‌and‌I’ll‌tell‌you‌who‌you‌are

K=32 ، آال قزل کپور 1تا. میشود محسوب آال قزل ماهی نتیجه در

به ماهی های گونه تعداد اگر قبل مثال و 3در یابد تغییر k برابر ؟؟ 5نیز افتد می اتفاقی چه گردد

k=5 3 ، آال قزل ، 1تا مارماهی 1کپور. باشد می آال قزل جدید نمونه نتیجه در

مقدار الگوریتم :kتاثیر در

چقدر هر نامحدود ی مجموعه در تئوری شود .kدر می حاصل بهتری نتیجه باشد بزرگتر

ولیk شود رعایت محلیت اصل که گردد انتخاب طوری باید زیراk. شود می محلیت رفتن بین از باعث بزرگ

مقدار kبهترین برای مقدار باشد . kبهترین می موجود های نمونه کل تعداد جذر غالبا

K=1 افزایش باعث ولی دهد افزایش را کارایی تواند می کمتر محاسبات دلیل noiseبهمیگردد .

مختلف مقادیر kمقایسه

کاربردی : های مثال بازاريابي نيازهاي( marketing: )در و رفتارها حسب بر دسته‌هايي به مشتري‌ها دسته‌‌بندي

. آنها خريد‌هاي آخرين و ويژگي‌ها از زيادي مجموعه طريق از آنها

( :زيست‌‌‌شناسيbiology )آنها ويژگي‌هاي روي از گياهان و حيوانات دسته‌بندي

: کتابها دسته‌بندي کتابداري

( : زلزله‌نگاري اساس( earth‌quake‌studiesمطالعات بر حادثه‌خيز مناطق تشخيصقبلي مشاهدات

( : کاوي موجود( data‌mininigداده داده‌هاي از جديد ساختار و اطالعات کشف

منابع :

The‌k-means‌algorithm‌,Tan,‌Steinbach,‌Kumar‌+‌Ghosh K-means‌and‌Hierarchical‌Clustering‌Andrew‌W.‌Moore‌Professor‌School‌

of‌Computer‌Science‌Carnegie‌Mellon‌University

top related