clusterin k means
TRANSCRIPT
Clustering
فهرست
؟ چیست کالسترینگ ؟ چیست در بندی طبقه با کالسترینگ تفاوت ) ( بندی خوشه کردن کالستر در موجود مشکالت بندی خوشه های روش انواع الگوریتم k-means شرح الگوریتم k-nearest شرح کاربردی مثال چند
؟ چیست بندی خوشه
باشند داشته شباهت هم به که ميشود گفته دادهها از مجموعهاي به .خوشه
طبقهبندي مقابل در خوشهبندي. داریم شده تعیین پيش از کالس سری یک بندی طبقه در
ها داده در موجود های کالس از اطالعی هیچ بندی خوشه درنداریم .
خوشهبندي روشهاي
( انحصاري مقابل( ExclusiveorHardClusteringخوشهبندي درهمپوشي ) با ( OverlappingorSoftClusteringخوشهبندي
( مراتبي سلسله مقابل( Hierarchicalخوشهبندي درمسطح ) (Flatخوشهبندي
مراتبي سلسله خوشهبندي روشهاي
پايين به (Top-Down )باالکننده ) تقسيم ( :Divisiveيا
( باال به ( Bottom-Upپايينشونده ) متراکم ( :Agglomerativeيا
روش با Single-Linkخوشهبندي
dAB=mindijAjB
ميشود استفاده زير معيار از خوشه دو بين شباهت محاسبه براي روش اين :در
برای single-linkمثالداشتن فرض جدول 6با در که آنها بين فاصله ماتريس و داده ، 1نمونه نشانداده
الگوریتم عملکرد دهیم :single-linkنحوه می نشان را
روش با Complete-Linkخوشهبنديخالف • بر الگوریتم این کنیم : single-linkدر می استفاده زیر شباهت معیار از
روش با Average-Linkخوشهبنديکاهش میکنیم : noiseبرای استفاده زیر معیار از که شود می استفاده روش این از
k-meansالگوریتم
ميشود محسوب مسطح و انحصاري روشي روش . اين
عملکرد : نحوه1: اولیه- دهی مقدار k. گیرد می نظر در اولیه مراکز عنوان به را نقطه
2-K. دهد می تشکیل مرکز ترین نزدیک به نقاط تمام تخصیص با را خوشه3. شوند- می محاسبه دوباره خوشه هر مراکز
4. نکنند- تغییر مراکز که زمانی تا تکرار
k-nearestالگوریتم
. موجود های خوشه در جدید عضو یک بندی خوشه برای است الگوریتمیtellmewhoyourneighborsare,andI’lltellyouwhoyouare
K=32 ، آال قزل کپور 1تا. میشود محسوب آال قزل ماهی نتیجه در
به ماهی های گونه تعداد اگر قبل مثال و 3در یابد تغییر k برابر ؟؟ 5نیز افتد می اتفاقی چه گردد
k=5 3 ، آال قزل ، 1تا مارماهی 1کپور. باشد می آال قزل جدید نمونه نتیجه در
مقدار الگوریتم :kتاثیر در
چقدر هر نامحدود ی مجموعه در تئوری شود .kدر می حاصل بهتری نتیجه باشد بزرگتر
ولیk شود رعایت محلیت اصل که گردد انتخاب طوری باید زیراk. شود می محلیت رفتن بین از باعث بزرگ
مقدار kبهترین برای مقدار باشد . kبهترین می موجود های نمونه کل تعداد جذر غالبا
K=1 افزایش باعث ولی دهد افزایش را کارایی تواند می کمتر محاسبات دلیل noiseبهمیگردد .
مختلف مقادیر kمقایسه
کاربردی : های مثال بازاريابي نيازهاي( marketing: )در و رفتارها حسب بر دستههايي به مشتريها دستهبندي
. آنها خريدهاي آخرين و ويژگيها از زيادي مجموعه طريق از آنها
( :زيستشناسيbiology )آنها ويژگيهاي روي از گياهان و حيوانات دستهبندي
: کتابها دستهبندي کتابداري
( : زلزلهنگاري اساس( earthquakestudiesمطالعات بر حادثهخيز مناطق تشخيصقبلي مشاهدات
( : کاوي موجود( datamininigداده دادههاي از جديد ساختار و اطالعات کشف
منابع :
Thek-meansalgorithm,Tan,Steinbach,Kumar+Ghosh K-meansandHierarchicalClusteringAndrewW.MooreProfessorSchool
ofComputerScienceCarnegieMellonUniversity