فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca...

62
بعادهش ا کا سید ناصر رضوی[email protected] ۱۳۹۵

Upload: others

Post on 20-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

کاهش ابعاد[email protected]رضوی سید ناصر

۱۳۹۵

Page 2: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

کاهش ابعاد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

2

انگیزه.داده‌هانمایشداده‌هافشرده‌سازی

حافظهمصرفکاهشداده‌هامجموعهازآسان‌تراستفاده‌یالگوریتم‌هاازبسیاریمحاسباتیهزینه‌هایکاهشیادگیریالگوریتمدقتافزایشونویزحذفنتایجدرککردنساده‌تر

روش‌ها.اصلیمؤلفه‌هایتحلیلفاکتورهاتحلیل

مستقلمؤلفه‌هایتحلیل

Page 3: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

(PCA)تحلیل مؤلفه های اصلی

3

Page 4: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تحلیل مؤلفه های اصلی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

4

𝐵𝐴𝐶

Page 5: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

اصلیمؤلفه های تحلیل

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

5

Page 6: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بیان مسئله: تحلیل مؤلفه های اصلی6

Page 7: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بیان مسئله

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

7

𝑥2

𝑥1

تابشخطایمربعاتمجموعکمینه‌سازی.هدف

خطا

Page 8: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بیان مسئله

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

8

𝑥2

𝑥1

تابشخطایمربعاتمجموعکمینه‌سازی.هدف

Page 9: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بیان مسئله

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

9

مانندجهتیکیافتن.1به2ازابعادکاهش𝑢 1 ∈ ℝ𝑛مجموعجهت،آندرنقاطکردنتصویرباکهطوریبه.گرددکمینهخطامربعات

𝑥2

𝑥1

𝑢 1

Page 10: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بیان مسئله

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

10

آندرنقاطکردنتصویرباکهطوریبهمانندمتعامدبرداریافتن.بهازابعادکاهش.گرددکمینهخطامربعاتمجموعجهت‌ها،

𝑥2

𝑥1

𝑢 1

𝑢 1

𝑢 2

Page 11: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

PCAهمان رگرسیون است؟

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

11

𝑥1

𝑥2

اصلیمؤلفه‌های‌تحلیل‌

𝑥1

𝑦

رگرسیون‌خطی

Page 12: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

PCAالگوریتم

12

Page 13: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

پیش پردازش: PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

13

آموزشیمجموعه‌ی.

𝑥 1 , 𝑥 2 , 𝑥 3 ,⋯ , 𝑥 𝑚 , 𝑥 𝑖 ∈ ℝ𝑛

𝜇𝑗 =1

𝑚

𝑖=0

𝑚

𝑥𝑗𝑖 , 𝑥𝑗

𝑖 = 𝑥𝑗𝑖 − 𝜇𝑗

𝑥𝑗𝑖 =

𝑥𝑗𝑖 − 𝜇𝑗

𝑠𝑗𝑗انحراف معیار در ویژگی

پیش‌پردازش.

[نیازصورتدر].مقیاس‌بندی(2)

‌هاویژگی،(اتاق‌هاتعدادوخانهاندازه‌یویژگی‌هایمانند)هستندمختلفبازه‌هایدارایمختلفویژگی‌هایاگر.باشندبرابرتقریباًمختلفویژگی‌هایبازه‌یکهکنیدمقیاس‌بندیگونه‌ایبهرا

.میانگینحذف(1)

Page 14: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

PCAالگوریتم 14

بهازداده‌هاابعادکاهش.کوواریانسماتریس»محاسبه‌ی»:

کوواریانسماتریس«ویژهبردارهای»محاسبه‌ی:

ماتریسازاولبردارانتخاب:

Σ =1

𝑚𝑋𝑇𝑋 =

1

𝑚

𝑖=1

𝑛

𝑥(𝑖) 𝑥 𝑖 𝑇

𝑈, 𝑆, 𝑉 = 𝑠𝑣𝑑 Σ

𝑈 =

| | ⋯ |

𝑢 1 𝑢 2 ⋯ 𝑢 𝑛

| | ⋯ |𝑛×𝑛

𝑈𝑟𝑒𝑑𝑢𝑐𝑒𝑑 =

| | ⋯ |

𝑢 1 𝑢 2 ⋯ 𝑢 𝑘

| | ⋯ |𝑛×𝑘

Page 15: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

15

ابعادباجدیدداده‌هایمحاسبه‌ی𝑘.

𝑧𝑘×1𝑖

=

| | ⋯ |

𝑢 1 𝑢 2 ⋯ 𝑢 𝑘

| | ⋯ |

𝑇

× 𝑥𝑛×1𝑖

=

− 𝑢 1 −− 𝑢 2 −⋮ ⋮ ⋮− 𝑢 𝑘 − 𝑘×𝑛

× 𝑥𝑛×1𝑖

Page 16: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

پیاده سازی در اکتاو

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

16

function Z = PCA(X)

m = size(X, 1);

Sigma = (1/m) * X’ * X;

[U, S, V] = svd(Sigma);

U_reduced = U(:, 1:k);

Z = X * U_reduced;

end;

الگوریتمPCA.مقیاس‌بندینیازصورتدرومیانگینحذفازپس.

محاسبه ماتریس کوواریانس

محاسبه تجزیه مقادیر منفرد

اول مؤلفه 𝑘انتخاب

بعد𝑘محاسبه داده های جدید با

Page 17: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

کاهش ابعاد: مثال

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

17

(دو‌بعدی)داده‌های‌اولیه‌

𝑥1

𝑥2

(یک‌بعدی)داده‌های‌جدید‌

𝑧1

𝑍 = 𝑋 × 𝑈𝑟𝑒𝑑𝑢𝑐𝑒𝑑

Page 18: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

کاهش ابعاد: مثال

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

18

(دو‌بعدی)داده‌های‌اولیه‌

𝑥1

𝑥2

داده‌های‌بازسازی‌شده

𝑥1

𝑥2

𝑋𝑟𝑒𝑐𝑜𝑣𝑒𝑟𝑒𝑑 = 𝑍 ∗ 𝑈𝑟𝑒𝑑𝑢𝑐𝑒𝑑𝑇 +𝑚𝑒𝑎𝑛𝑠

Page 19: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

حذف میانگین: PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

19

>> X = [1 1 1 0 0; 2 2 2 0 0; 1 1 1 0 0; 5 5 5 0 0;

1 1 0 2 2; 0 0 0 3 3; 0 0 0 1 1];

>> meanVals = mean(X);

>> X_norm = zeros(size(X));

>> for i=1:size(X, 1)

> X_norm(i, :) = X(i, :) - meanVals;

>> X_norm

X_norm =

-0.42857 -0.42857 -0.28571 -0.85714 -0.85714

0.57143 0.57143 0.71429 -0.85714 -0.85714

-0.42857 -0.42857 -0.28571 -0.85714 -0.85714

3.57143 3.57143 3.71429 -0.85714 -0.85714

-0.42857 -0.42857 -1.28571 1.14286 1.14286

-1.42857 -1.42857 -1.28571 2.14286 2.14286

-1.42857 -1.42857 -1.28571 0.14286 0.14286

1 1 1 0 0

2 2 2 0 0

1 1 1 0 0

5 5 5 0 0

1 1 0 2 2

0 0 0 3 3

0 0 0 1 1

اولیهداده های

X_norm = bsxfun(@minus, X, mean(X))

Page 20: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

محاسبه ی بردارهای ویژه: PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

20

>> m = size(X, 1);

>> Sigma = (1/m) * X_nom’ * X_norm;

>> [U, S, V] = svd(Sigma);

>> S

S =

Diagonal Matrix

8.7173e+000 0 0 0 0

0 1.5832e+000 0 0 0

0 0 6.6876e-002 0 0

0 0 0 5.6022e-016 0

0 0 0 0 1.4144e-047

Page 21: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

کاهش ابعاد: PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

21

>> U_red = U(:, 1:3);

>> Z = X_norm * U_red;

Z =

0.1667425 1.3749474 -0.0091539

-1.4442884 0.7390287 -0.0228180

0.1667425 1.3749474 -0.0091539

-6.2773812 -1.1687275 -0.0638103

1.7595299 -1.1001502 0.5712943

3.3326043 -1.9204675 -0.3520239

2.2960504 0.7004216 -0.1143345

Page 22: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

بازسازی داده های اولیه: PCAالگوریتم

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

22

>> X_recovered = Z * U_red’;

>> for i = 1:m

> X_recovered(i, :) = X_recovered(i, :) + meanVals;

>> X_recovered

X_recovered =

1.00000 1.00000 1.00000 0.00000 0.00000

2.00000 2.00000 2.00000 0.00000 0.00000

1.00000 1.00000 1.00000 0.00000 0.00000

5.00000 5.00000 5.00000 -0.00000 -0.00000

1.00000 1.00000 0.00000 2.00000 2.00000

0.00000 -0.00000 0.00000 3.00000 3.00000

-0.00000 -0.00000 -0.00000 1.00000 1.00000

1 1 1 0 0

2 2 2 0 0

1 1 1 0 0

5 5 5 0 0

1 1 0 2 2

0 0 0 3 3

0 0 0 1 1

اولیهداده های

Page 23: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

انتخاب تعداد مؤلفه های اصلی23

Page 24: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

انتخاب تعداد مؤلفه های اصلی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

24

تابشخطایمربعاتمجموعمیانگین.

1𝑚σ𝑖=1𝑚 𝑥 𝑖 − 𝑥𝑎𝑝𝑝𝑟𝑜𝑥

𝑖2

1𝑚σ𝑖=1𝑚 𝑥 𝑖

2≤ 0.01

1𝑚σ𝑖=1𝑚 𝑥 𝑖 − 𝑥𝑎𝑝𝑝𝑟𝑜𝑥

𝑖2

1𝑚σ𝑖=1𝑚 𝑥 𝑖

2≤ 0.05

1𝑚σ𝑖=1𝑚 𝑥 𝑖 − 𝑥𝑎𝑝𝑝𝑟𝑜𝑥

𝑖2

1𝑚σ𝑖=1𝑚 𝑥 𝑖

2≤ 0.10

درصد واریانس99حفظ

درصد واریانس95حفظ

درصد واریانس90حفظ

Page 25: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

اصلیمؤلفه های انتخاب تعداد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

25

𝑘 = 0

repeat

{

𝑘 = 𝑘 + 1

try 𝑃𝐶𝐴(𝑋) with 𝑘 components

compute 𝑈𝑟𝑒𝑑𝑢𝑐𝑒𝑑, 𝑧1 , 𝑧 2 , … , 𝑧 𝑚 , 𝑥𝑎𝑝𝑝𝑟𝑜𝑥

1 , 𝑥𝑎𝑝𝑝𝑟𝑜𝑥2 , … , 𝑥𝑎𝑝𝑝𝑟𝑜𝑥

𝑚

} until

1

𝑚σ𝑖=1𝑚 𝑥 𝑖 −𝑥𝑎𝑝𝑝𝑟𝑜𝑥

𝑖 2

1

𝑚σ𝑖=1𝑚 𝑥 𝑖 2 ≤ 0.01

یک الگوریتم غیر کارا

Page 26: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

اصلیمؤلفه های انتخاب تعداد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

26

removemean from𝑋

𝑠𝑖𝑔𝑚𝑎 =1

𝑚(𝑋’ ∗ 𝑋);

[𝑈, 𝑆, 𝑉] = svd(𝑠𝑖𝑔𝑚𝑎);

pick smallest value of 𝑘 for which:

σ𝑖=1𝑘 𝑠𝑖𝑖

σ𝑖=1𝑛 𝑠𝑖𝑖

≥ 0.99

𝑆 =

𝑠11 0 ⋯ 00 𝑠22 ⋯ 0⋮ ⋮ ⋱ ⋮0 0 ⋯ 𝑠𝑛𝑛

Page 27: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

اصلیمؤلفه های انتخاب تعداد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

27

[ویژگی590]هادی‌هانیمه‌بهمربوطداده‌های.مثال

درصد‌تجمعی درصد‌واریانس تعداد‌مؤلفه‌ها59/2 59/2 1

83/4 24/1 2

92/5 9/2 3

94/8 2/3 4

96/3 1/5 5

96/8 0/5 6

97/1 0/3 7

99/3 0/08 20

http://archive.ics.uci.edu/ml/datasets/SECOM

Page 28: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

انتخاب تعداد مؤلفه های اصلی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

28

Page 29: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

انتخاب تعداد مؤلفه های اصلی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

29

Page 30: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

توصیه های عملی30

Page 31: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

افزایش سرعت یادگیری نظارت شده

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

31

اولیهآموزشیمجموعه‌ی.

ورودی‌هااستخراج.

اجرایPCA.

جدیدآموزشیمجموعه‌ی.

𝑥 1 , 𝑥 2 , 𝑥 3 ,⋯ , 𝑥 𝑚 , 𝑥 𝑖 ∈ ℝ10000

𝑥 1 , 𝑦 1 , 𝑥 2 , 𝑦 2 , 𝑥 3 , 𝑦 3 , ⋯ , 𝑥 𝑚 , 𝑦 𝑚

𝑧 1 , 𝑧 2 , 𝑧 3 ,⋯ , 𝑧 𝑚 , 𝑧 𝑖 ∈ ℝ1000

𝑧 1 , 𝑦 1 , 𝑧 2 , 𝑦 2 , 𝑧 3 , 𝑦 3 ,⋯ , 𝑧 𝑚 , 𝑦 𝑚

آموزشیمجموعه‌یدرموجودداده‌هایازاستفادهباتنهابایدبعدیفضایبهبعدیفضایازنگاشت.توجه.آیددستبه

Page 32: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

PCAکاربردهای

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

32

داده‌هافشرده‌سازی.داده‌هاذخیره‌سازیبراینیازموردحافظه‌یمصرفکاهش

یادگیریالگوریتماجرایسرعتافزایششدهحفظواریانسدرصداساسبر:مؤلفه‌هاتعدادانتخاب

داده‌هانمودنتصویر.مؤلفه‌هاتعدادانتخاب:𝑘 = 𝑘یا2 = 3

Page 33: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقابله با بیش برازش: PCAاستفاده نادرست از

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

33

نادرستروش.ازاستفاده𝑧 𝑖جایبه𝑥 𝑖ازویژگی‌هاتعدادکاهشباعث𝑛به𝑘می‌شود؛می‌یابدکاهشبیش‌برازشاحتمالکمتر،ویژگی‌هایداشتنبانتیجه،در.

min𝜃

1

𝑚

𝑖=1

𝑚

ℎ𝜃 𝑥 𝑖 − 𝑦 𝑖 2+

𝜆

2𝑚

𝑗=1

𝑛

𝜃𝑗2

درستروش.𝑃𝐶𝐴نمی‌کنداستفادهراخروجیبهمربوطاطالعاتابعاد،کاهشهنگاهدر.کنیداستفادهتنظیمازبیش‌برازشبامقابلهبرای.

Page 34: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

سخن آخر

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

34

ماشینیادگیریسیستمیکطراحی.صورتبهآموزشیمجموعه‌یایجاد𝑥 1 ,𝑦 1 , 𝑥 2 ,𝑦 2 , ⋯ , 𝑥 𝑚 ,𝑦 𝑚

ازاستفاده𝑃𝐶𝐴ابعادکاهشمنظوربه𝑥 𝑖آوردندستبهوها𝑧 𝑖ها

رویبرآموزشمرحله‌یاجرای𝑧 1 ,𝑦 1 , 𝑧 2 ,𝑦 2 , ⋯ , 𝑧 𝑚 ,𝑦 𝑚

نگاشت:آزمایشیمجموعه‌یازاستفادهبافرضیهآزمایش𝑥𝑡𝑒𝑠𝑡𝑖به𝑧𝑡𝑒𝑠𝑡

𝑖محاسبه‌یوℎ𝜃(𝑧)مجموعهداده‌هایازیکهربرای.آزمایشی

ازاستفادهبدونرافوقفرآینداگر.مهمپرسشیکPCAمی‌شود؟چهدهیمانجامازاستفادهبدونراباالفرآیندابتداهموارهPCAدهیدانجام.

ازاستفادهآنگاهنرسیدید،مطلوبپاسخبهاگرPCAکنیدآزمایشرا.

Page 35: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

فشرده سازی: کاربردها35

Page 36: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مجموعه ی آموزشی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

36

آموزشیمجموعه‌ی.5000(خاکستری)چهرهتصویر

تصاویرابعاد.32پیکسل32در

ویژگی‌هاتعداد.1024ویژگی

Page 37: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

K = 100با PCAاجرای

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

37

36اولمؤلفه‌ی.

Page 38: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

تصاویر بازسازی شده38

تصاویر‌اولیه تصاویر‌بازسازی‌شده

Page 39: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تصویر نمودن داده ها: کاربردها39

Page 40: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

k-meansفشرده سازی با استفاده از 40

(128در 128)تصویر اولیه شامل هزاران رنگ رنگ16تصویر فشرده شده شامل فقط 1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

Page 41: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

خوشه بندی پیکسل ها41

K-meansخوشه بندی پیکسل ها به وسیله الگوریتم 1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

Page 42: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

همان داده ها در فضای دو بعدی42

درک و تفسیر داده ها در فضای دو بعدی ساده تر است1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

Page 43: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تجزیه ی مقادیر منفرد43

Page 44: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تجزیه ی مقادیر منفرد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

44

انگیزه.داده‌هاساده‌سازیافزونگیونویزحذفالگوریتمنتایجبهبود

مثالیکاربردهای.[نهانمعناییگذاریشاخص]اطالعاتبازیابیوجستجوتوصیه‌گرسیستم‌های

Page 45: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقادیر منفردتجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

45

منفردمقادیرتجزیه‌ی.𝐷𝑎𝑡𝑎𝑚×𝑛 = 𝑈𝑚×𝑚Σ𝑚×𝑛𝑉𝑛×𝑛

𝑇

ماتریس مقادیر منفرد

منفردمقادیرماتریس.هستندمرتبکاهشیصورتبهمنفردمقادیرآندرکهقطریماتریسیک.

ماننداندیسیکازمنفردمقادیر𝑟هستندصفرمقداردارایبعدبه.ماتریسویژه‌یمقادیردومریشه‌یمنفردمقادیر𝐷𝑎𝑡𝑎 × 𝐷𝑎𝑡𝑎𝑇هستند.

Page 46: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مثال: منفردمقادیر تجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

46

>> Data = [1 1 1 0 0; 2 2 2 0 0; 1 1 1 0 0; 5 5 5 0 0;

1 1 0 2 2; 0 0 0 3 3; 0 0 0 1 1];

>> [U, Sigma, VT] = svd(Data);

>> Sigma

Sigma =

Diagonal Matrix

9.7214e+000 0 0 0 0

0 5.2940e+000 0 0 0

0 0 6.8423e-001 0 0

0 0 0 9.0541e-016 0

0 0 0 0 9.3837e-032

0 0 0 0 0

0 0 0 0 0

>>

𝐷𝑎𝑡𝑎𝑚×𝑛 ≈ 𝑈𝑚×3Σ3×3𝑉3×𝑛

Page 47: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مثال: مقادیر منفردتجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

47

𝐷𝑎𝑡𝑎𝑚×𝑛 ≈ 𝑈𝑚×3Σ3×3𝑉3×𝑛

𝐷𝑎𝑡𝑎 𝑈 𝑆𝑖𝑔𝑚𝑎 𝑉𝑇

=

Page 48: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مثال : مقادیر منفردتجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

48

>> Sigma1x1 = Sigma(1:1, 1:1)

Sigma1x1 = 9.72140

>> Data_approx = U(:, 1:1) * Sigma1x1 * VT’(1:1, :)

1.05 1.05 0.98 0.06 0.06

2.01 2.01 1.96 0.12 0.12

1.00 1.00 0.98 0.06 0.06

5.03 5.03 4.90 0.30 0.30

0.76 0.76 0.73 0.04 0.04

0.12 0.12 0.12 0.00 0.00

0.04 0.04 -0.09 0.00 0.00

𝑆𝑆𝐸 ≈ 28.494

1 1 1 0 0

2 2 2 0 0

1 1 1 0 0

5 5 5 0 0

1 1 0 2 2

0 0 0 3 3

0 0 0 1 1

داده های اولیه

Page 49: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مثال : مقادیر منفردتجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

49

>> Sigma2x2 = Sigma(1:2, 1:2)

Sigma2x2 =

Diagonal Matrix

9.72140 0

0 5.29398

>> Data_approx = U(:, 1:2) * Sigma2x2 * VT’(1:2, :)

1.00 1.00 0.99 -0.00 -0.00

2.00 2.00 1.98 -0.00 -0.00

1.00 1.00 0.99 -0.00 -0.00

5.02 5.02 4.94 -0.00 -0.00

0.77 0.77 0.00 2.03 2.03

0.14 0.14 -0.28 2.98 2.98

0.05 0.05 -0.09 0.99 0.99

𝑆𝑆𝐸 ≈ 0.46817

1 1 1 0 0

2 2 2 0 0

1 1 1 0 0

5 5 5 0 0

1 1 0 2 2

0 0 0 3 3

0 0 0 1 1

داده های اولیه

Page 50: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مثال : مقادیر منفردتجزیه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

50

>> Sigma3x3 = Sigma(1:3, 1:3)

Sigma3x3 =

Diagonal Matrix

9.72140 0 0

0 5.29398 0

0 0 0.68423

>> Data_approx = U(:, 1:3) * Sigma3x3 * VT’(1:3, :)

1. 1. 1. 0. 0.

2. 2. 2. 0. 0.

1. 1. 1. -0. -0.

5. 5. 5. 0. 0.

1. 1. 0. 2. 2.

-0. 0. -0. 3. 3.

-0. 0. -0. 1. 1.

𝑆𝑆𝐸 ≈ 1.2151𝑒 − 029

1 1 1 0 0

2 2 2 0 0

1 1 1 0 0

5 5 5 0 0

1 1 0 2 2

0 0 0 3 3

0 0 0 1 1

داده های اولیه

Page 51: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تعیین تعداد مقادیر منفرد

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

51

منفردمقادیربرایمناسبتعدادیکتعیین.اصلیمؤلفه‌هایتعدادتعیینبامشابه

کهطوریبهکوچک‌ترینانتخاب.تجربیروشیک:

σ𝑖=1𝑘 𝑠𝑖𝑖

2

σ𝑖=1𝑛 𝑠𝑖𝑖

2 ≥ 0.909.72 0 0 0 0

0 5.29 0 0 0

0 0 0.68 0 0

0 0 0 0 0

0 0 0 0 0

0 0 0 0 0

0 0 0 0 0

𝑘 = 1. 𝑒𝑛𝑒𝑟𝑔𝑦 = 0.768

𝑘 = 2. 𝑒𝑛𝑒𝑟𝑔𝑦 = 0.996

𝑘 = 3. 𝑒𝑛𝑒𝑟𝑔𝑦 = 1.000

Page 52: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

سیستم های توصیه گر

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

52

توصیه‌گرسیستم‌های.«می‌کندتوصیهراخاصیاجناسهاآنبهمشتریانگذشته‌یخریدهایاساسبر«آمازون.«می‌کندتوصیهراخاصیفیلم‌هایمشتریانشبهشده،تماشافیلم‌هایاساسبر«فلیکسنت.می‌کنندپیشنهادراخاصیاخبارخواندنخودکاربرانبهخبریوب‌سایت‌های.

گروهیپاالیش.شدهاستفادهرویکرددیگرکاربرانبهمربوطداده‌هایباکاربریکبهمربوطداده‌هایمقایسه‌یمشابهتاینمبنایبرآنهابهدادنتوصیهومشابهسلیقه‌هایباکاربرانیافتن

Page 53: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

شباهت مبتنی بر اقالم یا مبتنی بر کاربر؟

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

53

اقالمبرمبتنی.کاربرانسویازشدهدادهامتیازاتاساسبرمختلففیلمدوشباهتمحاسبه‌ی:مثال

کاربربرمبتنی.فمختلفیلم‌هایبهآنهاوسیله‌یبهشدهدادهامتیازاتاساسبرکاربرانمیانشباهتمحاسبه‌ی:مثال

کاربر؟برمبتنییااقالمبرمبتنیشباهتمحاسبه‌ییک؟کدامداردکاربرانتعدادواقالمتعدادبهبستگی.استبهتراقالمبرمبتنیشباهتمحاسبه‌یاست،اقالمتعدادازبیشتربسیارکاربرانتعداداگر.

Page 54: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقادیر ویژه و بردارهای ویژه: پیوست54

Page 55: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقادیر ویژه و بردارهای ویژه

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

55

مربعیماتریسحاصل‌ضرب𝐴برداردررا𝑥بگیریدنظردر:

ماتریس𝐴بردارتابعیکهمانند𝑥جدیدبرداربهرا𝑦می‌کندتبدیل.

بردار.ویژهبردار𝑥برداربااگراستویژهبرداریک𝐴𝑥باشدموازی:

باال،رابطه‌یدر.ویژهمقدار𝜆ویژه‌یبرداربامتناظرویژه‌یمقدار𝑥است.

𝐴𝑥 = 𝑦

𝐴𝑥 = 𝜆𝑥

مقدار ویژه مقدار ویژه

Page 56: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقادیر ویژه و بردارهای ویژه

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

56

اگر.مثال𝐴باشدزیرصورتبهجایگشتماتریسیک:

صورتایندر:

استبرابر(اثر)اصلیقطرعناصرمجموعباویژهمقادیرمجموع.توجه.

𝐴 =0 11 0

𝐴11

= 1 ×11

⇒ 𝜆 = 1

𝐴−11

= −1 ×−11

⇒ 𝜆 = −1

𝑡𝑟𝑎𝑐𝑒 𝐴 = 0 + 0 = 1 + متعامد1−

Page 57: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

محاسبه ی مقادیر ویژه و بردارهای ویژه

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

57

ویژهمقادیرمحاسبه‌ی.

ماتریسبنابراین𝐴 − 𝜆𝑥[داردپوچبردارزیرا].استمنفردماتریسیک

نتیجهدر:

ویژهمقادیرمحاسبه‌ی.مثال

𝐴𝑥 = 𝜆𝑥 ⇒ 𝐴 − 𝜆𝐼 𝑥 = 0

𝑑𝑒𝑡 𝐴 − 𝜆𝐼 = 0

𝐴 =3 11 3

det 𝐴 − 𝜆𝐼 = det3 − 𝜆 11 3 − 𝜆

= 𝜆2 − 6𝜆 + 8 = 0 ⇒ 𝜆 = 4,2

trace(A) det(A)

Page 58: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

مقادیر ویژه و بردارهای ویژهمحاسبه ی

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

58

ویژهبردارهایمحاسبه‌ی.

مثال.

مشاهده.

𝐴 =3 11 3

⇒ 𝜆1 = 4, 𝜆2 = 2

𝐴 − 4𝐼 𝑥1 =−1 11 −1

𝑥1 = 0 ⇒ 𝑥1 =11

𝐴 − 2𝐼 𝑥2 =1 11 1

𝑥2 = 0 ⇒ 𝑥2 =−11

𝐴𝑥 = 𝜆𝑥 ⇒ 𝐴 + 3𝐼 𝑥 = 𝐴𝑥 + 3𝑥 = 𝜆𝑥 + 3𝑥 = 𝜆 + 3 𝑥

Page 59: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

قطری سازی: Aتجزیه ی ماتریس

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

59

کنیدفرض𝑆ماتریسویژهبردارهایآنستون‌هایکهباشدماتریسی𝐴هستند.

𝐴𝑆 = 𝐴| | ⋯ |𝑥1 𝑥2 ⋯ 𝑥𝑛| | ⋯ |

=

| | ⋯ |𝜆1𝑥1 𝜆2𝑥2 ⋯ 𝜆𝑛𝑥𝑛| | ⋯ |

=| | ⋯ |𝑥1 𝑥2 ⋯ 𝑥𝑛| | ⋯ |

𝜆1 0 ⋯ 00 𝜆2 ⋯ 0⋮ ⋮ ⋱ ⋮0 0 ⋯ 𝜆𝑛

= 𝑆Λ

𝐴𝑆 = 𝑆Λ ⇒ 𝑆−1𝐴𝑆 = Λ

𝐴𝑆 = 𝑆Λ ⇒ 𝐴 = 𝑆Λ𝑆−1

Page 60: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

قطری سازی: Aتجزیه ماتریس

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

60

ژهویبردارهایومی‌رسنددوتوانبهویژهمقادیربرسانیم،دوتوانبهراماتریساگر.مشاهده.نمی‌کنندتغییر

کلیطوربه.

𝐴 = 𝑆Λ𝑆−1 ⇒ 𝐴2 = 𝑆Λ𝑆−1 𝑆Λ𝑆−1= 𝑆Λ2𝑆−1

𝐴 = 𝑆Λ𝑆−1 ⇒ 𝐴𝑘 = 𝑆Λ𝑘𝑆−1

Page 61: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

تجزیه ی ماتریس متقارن

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

61

حقیقیمتقارنماتریسیکدر:هستندحقیقیویژهمقادیر.

هستندنرمالمتعامدویژهبردارهای.

استمتعامدپروجکشنماتریس‌هایازمجموعهیکخطیترکیبمتقارنماتریسهر.مشاهده.

𝐴 = 𝑄Λ𝑄−1 = 𝑄Λ𝑄𝑇

𝐴 =| | ⋯ |𝑞1 𝑞2 ⋯ 𝑞𝑛| | ⋯ |

𝜆1 0 ⋯ 00 𝜆2 ⋯ 0⋮ ⋮ ⋱ ⋮0 0 ⋯ 𝜆𝑛

− 𝑞1𝑇 −

− 𝑞2𝑇 −

⋮ ⋮ ⋮− 𝑞𝑛

𝑇 −= 𝜆1𝑞1𝑞1

𝑇 + 𝜆2𝑞2𝑞2𝑇 +⋯+ 𝜆𝑛𝑞𝑛𝑞𝑛

𝑇

Page 62: فصل 24 کوتاه ترین مسیرهای تک مبدأ · نیگنایم فذح :pca متیروگلا 1395- {اعبا شهاک- نیشام یریگ{ای- یوضر رصان دیس

ماتریس های مثبت معین متقارن

1395-کاهش ابعاد -یادگیری ماشین -سید ناصر رضوی

62

مانندصفرغیربردارهرازایبهاگراستمعینمثبتماتریس.معینمثبتماتریس:

متقارنمعینمثبتماتریسیکدر:هستندمثبتهمگیویژهمقادیر.هستندمثبتهمگیمحورها.هستندمثبت(مقدمزیرماتریس‌هایدترمینان)همگیدترمینان‌ها.

مثال.𝐴 =

5 22 3

⇒ 𝜆 = 4 ± 5, 𝑝1 = 5, 𝑝2 =11

5, det 𝐴 = 11

𝑥𝑇𝐴𝑥 > 0