robust vision-based simultaneous multi-target tracking

46
شگاه صنعتي دان امیرکبیر)یک تهرانپلي تکن( انشکده د برقسي ارشد سمینار کارشنا گزارش گرایشجیتالک دی الکترونیوان عندگانه اهداف چنزمان همقاوم ردیابي م تصویر در نگارشحمودیا م نیم اس ا تی دهنما را دکتر کریم فائزمد احدیکتر سید مح دستاد ا مشاور دکتر رحمتي مهر94

Upload: nima-mahmoudi

Post on 12-Apr-2017

65 views

Category:

Documents


16 download

TRANSCRIPT

امیرکبیردانشگاه صنعتي

)پلي تکنیک تهران(

برقدانشکده

گزارش سمینار کارشناسي ارشد

الکترونیک دیجیتالگرایش

عنوان

در تصویر ردیابي مقاوم همزمان اهداف چندگانه

نگارش

نیما محمودی

راهنما دتیااس

دکتر کریم فائز

دکتر سید محمد احدی

مشاوراستاد

رحمتيدکتر

94مهر

به نام خدا

:تاريخ تعهدنامه اصالت اثر

شوم كه مطالب مندرج در اين ااينان نامنه لاكنر كنار ا ني متعهد مي یمحمود مایناينجانب

اينجانب تحت نظارت را نمايي اساتید دان گاه كنعتي امیركبیر بوده به دستا رد ای ديگران كنه در

ارجاع در فهرست منناب مخذن اي ا ش از آنها استفاده شده است مطابق مقررات ر ال متعارف

سطح يا باالتر ارائه نگرديده است.ذكر گرديده است. اي اايان نامه قبالً برای الراز یچ مدرك م

در كورت اثبات تخلف در ر زمان، مدرك تحصیلي كادر شده توسط دان گاه از درجه اعتبار سناقط

بوده دان گاه لق ایگیری قانوني ذوا د داشت.

باشند. رگوننه نتايج لقوق لاكر از اي اايان نامه متعلق به دان گاه كننعتي امیركبینر مني كلیه

بنرداری، ترجمنه استفاده از نتايج علمي عملي، اگ اری اطالعات به ديگران يا چاپ تكثینر، نخنخه

اقتبنناا از اينن اايننان نامننه بنند ن موافقننت كتبنني دان ننگاه كنننعتي امیركبیننر ممنننوع اسننت.

قر مطالب با ذكر مخذ بالمان است.ن

نیما محمودی

امضا

چكیده

أ

چکیده

-رديابي با استفاده از تصوير يكي از اعمال اساسي در بخیاری از كاربرد ای بینايي ماشی است در د ه

ای اذیر مورد بررسي دقیقي قرار گرفته است. با جود اين كنه بنرای اين مخناله ر شنهای متعنددی

ر د. در ردينابي ست، اما نوز رديابي مقا م با استفاده از تصوير چال ي بزرگ به شمار ميای نهاد شده ا

با استفاده از تصوير، ممك است در اثر لركت سري جخم، تغییر ضعیت ظا ری جخنم، سناذتار رینر

سخت، قرار گرفت مان در جلوی جخم دف لركت د ربی دچار م كر شود.

تصوير امری م كر در زمینه بینايي ماشی اسنت. ازديناد كامویوتر نايي بنا قندرت رديابي با استفاده از

اردازش باال، در دسترا قرار گرفت د ربی ايي يديويي با كیفیت باال جود نیاز ر ز افز ن به آنالیز

افنزايش يابند. ای رديابي با استفاده از تصويراند تا عالقه به الگوريتمذودكار تصا ير يديويي باعث شده

سال اذیر تغییرات شديدی كنرده اسنت. در لالنت كلني ردينابي بنا 30تكنولوژی ر ز در اي زمینه در

استفاده از تصوير در زمینه ای مختلفي مانند ت خیص با استفاده از لركت، نظارت ذودكنار، انندي

ر ... قابر استفاده ديابي ذو گ اری تصا ير يديويي، سیختمهای ارتباطي میان كامویوتر انخان، جهت

ختند. دف از اجرای اي ار ژه دست يابي به الگوريتمي برای رديابي مقا م ا داف چندگانه در تصا ير

يديويي است.

های کلیدی: واژه

نظارت يديويي رديابي ا داف چندگانه، اردازش تصوير، بینايي ماشی ، رديابي با استفاده از آشكارسازی،

فهرست عنا ي

ب

صفحه عناوینست فهر

1 ........................................................................................................................ مقدمه اول فصل 1

2 .................................................................................................. ريتصو از استفاده با يابيرد در موجود م كالت 1.1

3 ............................................................................................... كند؟يم عمر چگونه ريتصو از استفاده با يابيرد 1.2

5 .......................................................................................... ريتصو از استفاده با چندگانه ا داف مزمان يابيرد 1.3

6 .............................................................................................................................................................. مطالب رئوا 1.4

7 .................................................................................................... جسم یآشکارساز دوم فصل 2

8 ........................................................................................ یآشكارساز يابيرد یبرا جخم فیتوك ی اي گي 2.1

9 ........................................................................ انيگراد بر يمبتن ی اي گي اساا بر یآشكارساز ی ار ش 2.2

10............................................................................ رنگ بر يمبتن ی اي گي اساا بر یآشكارساز ی ار ش 2.3

11........................................................................... بافت بر يمبتن ی اي گي اساا بر یآشكارساز ی ار ش 2.4

13.............................................................................. يزمان-يمكان ی اي گي اساا بر یآشكارساز ی ار ش 2.5

14.................................................................................. ي گي چند از يبیترك اساا بر یآشكارساز ی ار ش 2.6

18 .......................................................................................................... جسم يابیرد سوم فصل 3

19.............................................................................................................................. جخم يآنال يابيرد ی ار ش 3.1

20 ............................................................................................................................... يآنال يابيرد یبرا مولد ی ار ش 3.1.1

21 ................................................................................................................... يآنال يابيرد یبرا گ ار تفا ت یا ر ش 3.1.2

25..................................................................................................................... نهیزم اطالعات بر يمبتن ی ار ش 3.2

26 .................................................................................................... كارلو مونته یبردارنمونه بر يمبتن ی ار ش 3.3

29......................................................................................................................... يابيرد گوناگون یر شها خهيمقا 3.4

32 ................................................................................................................................ مراجع و منابع

فهرست اشكال

ج

صفحه فهرست اشکال

5 ................................................................... [.1] ريتصو از استفاده با يابيرد ختمیس کي عملكرد فلوچارت 1.1 شكر

فهرست عالئم

د

صفحه فهرست جداول

16................................................................................................. .یريتصو یفگر ایتوك در ریاذ ی رفتهایا 2.1 جد ل

24 ............................................................................................. [.1] يآنال يابيرد یر شها ریاذ ی رفتهایا 3.1 جد ل

26............................................................ [.1] يابيرد یبرا نهیزم اطالعات از استفاده در ریاذ ی رفتهایا 3.2 جد ل

28 ................................................... [.1] كارلو مونته یبردارنمونه بر يمبتن یر شها در ریاذ ی رفتهایا 3.3 جد ل

29 ..................................................................................................... [.1] شده شناذته یر شها انیم خهيمقا 3.4 جد ل

فصر ا ل: مقدمه

1

1

فصل اول

مقدمه

فصر ا ل: مقدمه

2

مقدمه

از مخنائر يكن ي مچننان کين ر تي دف به طور مزمان بد ن گم كردن و ي مزمان چند بیتعق

ر ادهیا تیاز كاربرد ا مانند امن یاریدر بخ قیدق يابياست. رد یماش يينایب نهیدر زم زیچالش برانگ

یار در سنالها یبخ رفتیاست. با جود ا تیلائز ا م اریبخ ييويديلركت كحنه نظارت زی ا، آنال

كنه ي)در كنورت زنند يجلو من یماش يابياز قدرت رد يانخانها به سادگ يابيگ شته، مچنان قدرت رد

در رديابي با استفاده از تصنوير، ممكن اسنت در اثنر (.ردیقرار گ ی اریاردازش در اذت یبرا يزمان كاف

ن در جلنوی جخنم لركت سري جخم، تغییر ضعیت ظا ری جخم، ساذتار ریر سخت، قرار گرفت ما

لركت د ربی دچار م كر شود. 1 دف

ايي يديويي با كیفیت بناال اال، در دسترا قرار گرفت د ربی ازدياد كامویوتر ايي با قدرت اردازش ب

نای ردينابي بنا اند تا عالقه به الگوريتمديويي باعث شده جود نیاز ر ز افز ن به آنالیز ذودكار تصا ير ي

سال اذیر تغییرات شديدی كرده است 30تكنولوژی ر ز در اي زمینه در استفاده از تصوير افزايش يابد.

. در لالت كلي رديابي با استفاده از تصوير در زمینه ای مختلفي مانند ت خیص بنا اسنتفاده از [2-9]

كنامویوتر انخنان، ، سیختمهای ارتباطي مینان 2كار، اندي گ اری تصا ير يديوييلركت، نظارت ذود

.[1] ر ... قابر استفاده ختنددجهت يابي ذو

مشکالت موجود در ردیابي با استفاده از تصویر 1.1

3اثر منعك كنردن دنینای به طور كلي رديابي با استفاده از تصوير به دلیر از دست رفت اطالعات در

، لركت ایچیده جخم، موانن 3بعدی، نويز موجود در تصا ير، ا زمینه به م ريخته 2بعدی به تصوير

1 Occlusion

2 Video indexing

3 Cluttered-background

فصر ا ل: مقدمه

3

در ... امری بخیار چالش برانگیز است. 4 اقعي-جزئي يا كلي، تغییرات نور محیط، الزامات اردازش زمان

كردند كه لركنت جخنم ننرم تفاده از تصوير فرض ميسالهای ابتدايي، تقريبا تمام ر شهای رديابي با اس

البته در سالهای اذیر تغییرات شنديدی در اين گیرد. بوده تغییری ناگهاني در ظا ر جخم كورت نمي

ا توانايي لر مخاله تغییرات ناگهاني ظا ر جخنم ... زمینه ايجاد شده است. اكنون بخیاری از الگوريتم

یختم رديابي مقا م، برذي الزامات را بايد مد نظر داشت.برای ساذت يک س را دارند.

ت به اي معناست كه لتي در شرايط ایچیده، الگوريتم رديابي بايد بتوانند جخنم منورد ممقا مقاومت:

توانند ا زمینه ایچیده، مان جزئي يا كلي جلنوی م كالت موجود بر سر رديابي مينظر را دنبال كند.

يا لركت ایچیده جخم باشد. جخم، تغییرات ر شنايي

گینرد، ذنود جخنم نینز دسنتخوش عال ه بر تغییرات متفا ت محیطي كه جخم در آن قرار مي انطباق:

در نتیجه به يک مكانیزم انطباق در سیختم رديابي بنرای انطبناق سیخنتم نخنبت بنه شود. تغییراتي مي

تغییرات ظا ری جخم نیازمنديم.

ه با تصا ير زنده يديويي سر كار دارد بايد سنرعت انردازش زينادی سیختم ك واقعي:-پردازش زمان

نايي بنا بنازد ي بناال سازی سري بهینه به مراه منتخبي از الگوريتمداشته باشد. در نتیجه يک ایاده

مورد نیاز است. سرعت اردازش ابخته به سرعت جخم دف است، اما برای ايجاد تصا يری بنا تغیینرات

.[1] فريم بر ثانیه مورد نیاز است 15چ م انخان لداقر نرخ فريم نرم برای

کند؟ردیابي با استفاده از تصویر چگونه عمل مي 1.2

تواند الگويي از جخم، يک ا ال، به توكیفي از جخم نیاز داريم تا به دنبال آن بگرديم. اي توكیف مي

ز ديگری باشد. ساذت چنی توكیفي از جخم امری بخیار دشوار نگ يا چی، مدل ر5شكر، يک بافت

گ ارد. مچنی مهم است، زيرا كیفیت توكیف انتخاب شده مختقیما در كیفیت ار سه رديابي اثر مي

4 Real-Time

5 Texture

فصر ا ل: مقدمه

4

م اجرای الگوريتم ساذته چنی توكیفي ممك است از قبر شناذته شده نباشد نیاز باشد تا در نگا

شود.

تصويری در زمینه ت خیص جخم درك زمینهگیرند. ذاكي قرار مي 6زمینهال در د ما، اجخام معمو

كلي در زمینه -مورد بررسي قرار گرفته شده است. به عنوان مثال بخیاری از ارتباطات جزئي 7تصوير

اايدار طوالني زمینه-در آشكارسازی، تنها ر ابط شي آشكارسازی تصا ير مورد بررسي قرار گرفته است.

. در رديابي [11] [10]ت از نظر آماری قابر توجه به سادگي قابر استفاده ختند، به عنوان مثال مد

میان جخم دف بقیه با استفاده از تصوير، بخیاری از ر ابط كوتاه مدت اما به طور بالقوه بخیار قوی

تواند برای تحقیقات در يک سیختم رديابي مي زمینهاستفاده كحیح از اي اطالعات . دتصوير جود دارن

تفاده از تصوير بخیار مفید باشد.در لوزه رديابي با اس

عال ه بر اي ، لتي با داشت يک توكیف ذوب از جخم ایش از شر ع برنامه يا ايجاد يک توكیف ذوب

اين ت ظا ری جخم برای ايجاد مقا منت در ردينابي الزم اسنت. در لی اجرای برنامه، انطباق با تغییرا

ای كوچک يا تبديالت ندسي جخم در تصوير يا لتي تغییرات توانند لاكر از چرذشتغییرات مي

م نكر برای مقابله با اي تغییرات، مدل بايد در طول زمان با شرايط جديند منطبنق شنود. بافت باشند.

تر شدن مدل ظا ری بنه دلینر دقینق نی سیختم رديابي انطباق ا يری ضعیفاكلي بر سر راه ايجاد چ

است. به طور متدا ل ا زمیننه انیش زمیننه بنا 8نبودن سیختم ت خیص ا زمینه از ایش زمینه

بد ن توجه به اي كه شوند. استفاده از مختطیلي د ر جخم يا نالیه ای اطراف جخم از يكديگر جدا مي

ده چقدر دقیق است، چنی تخمیني مواره لا ی مقداری از ا زمینه نیز خت كه بنه نالیه ايجاد ش

اند. مخصوكا نگامي كه مانعي بر سر راه جخم جود داشته باشند ينا عنوان ایش زمینه شناذته شده

.[12] شودگفته مي Driftingموقعیت جخم به طور دقیق م خص نباشد. به اي م كر

6 Context

7 Image understanding

8 Foreground

فصر ا ل: مقدمه

5

توان گفت در يک كالم، اكثر ر شهای رديابي با استفاده از كنید ميماللظه مي 1.1شكر كه در مانطور

، تصمیم گیری به زمینهتصوير شامر ر دی تصوير، توكیف ي گي ظا ری جخم، استفاده از اطالعات

شهای گوناگون میزان تاكید بر ر ی ر يک از بخ های ذكنر شنده ر ز رساني مدل ختند. البته برای ر

.[1] متفا ت است

.[1] ردیابي با استفاده از تصویر عملکرد یک سیستم فلوچارت 1.1شکل

اهداف چندگانه با استفاده از تصویر ردیابي همزمان 1.3

از مخنائر يكن ي مچننان کين ر تي دف به طور مزمان بد ن گم كردن و ي مزمان چند بیتعق

ر ادهیا تیاز كاربرد ا مانند امن یاریدر بخ قیدق يابياست. رد یماش يينایب نهیدر زم زیچالش برانگ

یار در سنالها یبخ رفتیاست. با جود ا تیلائز ا م اریبخ ييويديلركت كحنه نظارت زی ا، آنال

كنه ي)در كنورت زنند يجلو من یماش يابياز قدرت رد يانخانها به سادگ يابيگ شته، مچنان قدرت رد

یاز استرات يابيرد نهیدر زم ریاذ یاز ر شها یاری(. بخردیقرار گ ی اریاردازش در اذت یبرا يزمان كاف

انردازش شیمرلله ان کيا داف در یات استر ياند كه در ااستفاده كرده صیخبا استفاده از ت يابيرد

لاكنر از صیكننده( كه از ت نخ یدسته بند کي اي رياز تصو نهی)توسط ل ف ا زم شوديم افتهي

فصر ا ل: مقدمه

6

يابين باز تیمقا مت در برابر ذطا قابل شير ش افزا يا تي. مزشونديزده م یتخم ر ایمرلله مخ يا

قابنر ري دف در تصو کيمخاله كه تنها ي( است. در لالت ساده شده اdetector)آشكار ساز یاز ذطا

کين دین با استفاده از جختجو به دنبال دف در بخش منورد انتظنار تول توانديم يابيم ا ده است، رد

تر،ید بكه تعدا ياست كه در لالت يدر لال يفرد در طول زمان انجام شود. ا تیبا اتصال موقع ریمخ

گنر يد راين ز شنود يمن تنر دهیچیا اریاند مخاله بخبه طور مزمان قابر م ا ده دافمعموال نا معلوم، از ا

لركت بخش قابر م ا ده ا داف يمربوط به كدام دف است. عال ه بر ا صیكدام ت خ ختیمعلوم ن

مدل بنه شندت يد آمده توسط ابه جو یساز نهی. مخاله بهردگیيا داف اطراف ذود قرار م ریتحت تاث

nonconvex به كورت یساز بهینهبوده بد ن مفر ضات ساده كننده قابرglobal .نخوا د بود

رئوس مطالب 1.4

در اي فصر به بررسي مقدمات الزم بنرای آشننايي بنا ردينابي ا نداف چندگاننه بنا اسنتفاده از تصنوير

ای استفاده شده در آنها، كه ا لنی سازی ي گيارداذتیم. در فصر د م، ما به بررسي ر شهای آشكار

مرلله در ر شهای رديابي با استفاده از آشكارسازی است، ذوا یم ارداذت. سو در فصر سوم در رابطه

در فصلهای بعد نیز ای آنها ذوا یم ارداذت. با ر شهای رديابي جخم در تصا ير كاربرد ا محد ديت

د به منظور رديابي مزمان ا داف چندگانه با استفاده از تصنوير ذنوا یم زد. دست به ارائه را كاری جدي

در نهايت نیز نتايج عملي راكار ارائه شده بر ر ی دادگان استاندارد را ارائه ذوا یم كرد.

فصر د م: آشكارسازی جخم

7

2

فصل دوم

آشکارسازی جسم

فصر د م: آشكارسازی جخم

8

9آشکارسازی جسم

ای ر ز افز ن را ا عالقها انخان در د ه اذیر، آشكارسازی جخمي از يک كالا ذاص، مانند اتومبیر

در زمینه بینايي ماشی به ذود ج ب كرده است. ت خیص با استفاده از تصوير امری دشنوار اسنت زينرا

ظا ر جخم ممك است به دالير مختلفي نظیر تغییر زا يه ديد، مان ، نور زمینه، بافت مفاكر متحرك

ای را نمنايش د ند شنده ای متفا تي كه ذنواص م خصنه جخم تغییر كند. اي امر باعث ايجاد ي گي

كنند. اي امر ا بنا مياست. برذي آشكارساز ای جخم اايه ذود را تنها بر ر ی يک نوع ذاص از ي گي

ای مختلف را ارائه داد. اي در لالي است كنه ديگنر شود تا بتوان مقايخه مختقیمي از ي گيباعث مي

كنند تا بازد ي ذود را افنزايش د نند. در اين فصنر بنه ا يكديگر تركیب مي ا چندي ي گي را بر ش

ای توكیف جخم استفاده شده در آشكارسنازی جخنم ر شنهای مختلنف آشكارسنازی بررسي ي گي

ذوا یم ارداذت.

های توصیف جسم برای ردیابي و آشکارسازیویژگي 2.1

تري مورد عالقهكند. از تصوير بازی مي انتخاب ي گي مناسب نق ي كلیدی در رديابي با استفاده

ذاكیت يک ي گي منحصر به فرد بودن آن است تا بتوان با كمک آن به سادگي در فضای ي گي جخم

توان در رديابي در لقیقت ر ي گي استفاده شده در آشكارسازی اجخام را ميتمییز داد. را از زمینه

ای عدی ما به بررسي جديدتري دستا رد ا در زمینه ي گيدر نتیجه در بخ های باجخام به كار برد.

.[1] اردازيمموجود در زمینه آشكارسازی اجخام مي ی اتوكیفگر با استفاده از ای رفت

9 Object Detection

فصر د م: آشكارسازی جخم

9

های مبتني بر گرادیانویژگيهای آشکارسازی بر اساس روش 2.2

توانند در زمیننه آشكارسنازی انخنانها مفیند گراديان مي ای مبتني براذیرا اثبات شده است كه ي گي

به طور كلي د اند. چندي تكنیک مختص تحقیقات مرتبط با اي زمینه ای نهاد شده[. 15، 14باشند ]

ای مبتني بر گراديان جود دارند. دسته ي گي

يش جخمي ماننند بندن يک شاذه اكلي از ر شهای مبتني بر گراديان استفاده از شكر/كانتور برای نما

Contour Based Hierarchical Chamfer Matching[ ر شي با عنوان 16] Gavrrilaانخان است.

[ اي اثر را با تجزيه مدل شكر كلني 17 مكارانش ] Linبرای آشكارسازی عابري ایاده ای نهاد كرد.

Ferrariبخنش توسنعه داد. به چندي مدل جزئي تولید يک درذت سلخله مراتبي برای الگوی نر

ای كانتور برای نمايش شكر ينک جخنم بنه منظنور آشكارسنازی ای از بخش[ از شبكه18 مكارانش ]

را ای نهاد كردنند Edgelet ای [ ي گي19] Wu Neratia. ندجخم در تصا ير ایچیده استفاده كرد

سنو ای محلي انخان خنتند. Silhouetteبه منظور نمايش Silhouetteكه نوعي ي گي مبتني بر

شود.تبدير مي 10MAPمخاله ت خیص انخان به يک مخاله

توكنیفگر Lowe[، 20 ا است. بنه عننوان مثنال در ] شاذه ديگر استفاده از جم بندی آماری گراديان

را ای نهاد كردنند SURF مكارانش Bayسو را برای ت خیص جخم ای نهاد داد. SIFTمعر ف

[ از ي گني 14] Dalal Triggsتوكنیفگری بخنیار سنريعتر ننامتغیر بنا چنرذش اسنت. [، كه 21]11HOG در آموزشSVM .برای ت خیص عابري ایاده استفاده كردندZhu [ بازد ي 22 مكارانش ]

مكنارانش Majiافنزايش دادنند. Boosted Cascade Rejectorsمحاسباتي ذود را بنا اسنتفاده از

در چند رز لوش خنته سنريعتر بنرای دسنته HOGرا با استفاده از توكیفگر ذوبيج [ م نتاي23]

12ای[ مدل تغییر شكر يابننده 24 مكارانش ] Felzenszwalbاز ذود ن ان داد. SVMبندی كننده

در چند رز لوش برای رديابي عابري ایاده استفاده HOGبر اساا اجزای مختلف مبتني بر توكیفگر

10 Maximum a Posteriori

11 Histogram of Oriented Gradients

12 Diformable

فصر د م: آشكارسازی جخم

10

14را بنرای جداسنازی 13ACF[ نوعي ي گي توكیفگر ذالقاننه بنا ننام 25 مكارانش ] Gaoد. كردن

15OGSاين ي گني از زنجینره ای از تعندادی داننه رينز در فضنای آشكارسازی انخان ای نهاد كردند.

16GGP[ توكیفگر 26 مكارانش ] Liuآموزش ديده بود. Adaboostت كیر شده بود كه با الگوريتم

( برای تعريف مینزان عندم granularity ای ريز )برای آشكارسازی انخان ای نهاد كردند. مفهوم دانه را

Mikolajczykشنود. اسنتفاده مني Hough نای ذطنوط در فضنای ای تكنه اطمینان مكاني زا ينه

از مكنارانش Leibeرا معرفني كردنند. 17 یختوگرام بر اساا موقعینت ای [ ي گي27 مكارانش ]

[ 29 مكنارانش در ] Gall[ اسنتفاده كردنند. 28( در ]18ISMدر مدل شكر ضمني ) SIFTتوكیفگر

را برای استفاده در يک ر ش ت نخیص جنگنر Houghمختص يک كالا بر اساا تبدير ISMر ش

Hough [1] بهبود دادند.

ر رنگهای مبتني بویژگيهای آشکارسازی بر اساس روش 2.3

اسنتفاده 19برجخته ای مبتني بر شدت نور كه تابحال معرفي شدند برای نمايش ي گي در نقاط ي گي

ای مبتني بر رنگ ای نهاد شدند كنه در برابنر ای، ي گيبرای افزايش قابلیت تمییز ي گيشدند. مي

فناكتور فیزيكني مقا م ختند. رنگ م ا ده شده از ينک جخنم توسنط د 20برذي تغییرات فتومتريک

نای انعكاسني سنطح جخنم. ( ي گني 2( توزي طیفي منبن ننور ) 1گیرد، )اكلي تحت تاثیر قرار مي

13 Adaptive Contour Feature

14 Segmentation

15 Oriented Granular Space

16 Granularity tunable Gradients Partition

17 Position-Oriented Histogram

18 Implicit Shape Model

19 Salient Points

20 Photometric

فصر د م: آشكارسازی جخم

11

توان بنه د دسنته كلني توكنیفگر ای مبتنني بنر ای اذیر در زمینه توكیفگر ای رنگ را ميای رفت

تقخیم كرد. SIFT یختوگرام توكیفگر ای مبتني بر

شنود. در نزديكي محور ذاكختری بي ثبات مي Hueشناذته شده است كه ، امریHSVدر فضای رنگ

Van de Weijer [ آنالیزی بر ر ی توزي ذطای تبدير 30 مكارانش ]Hue .اين آننالیز انجام دادند

در نتیجنه یخنتوگرام دارد. Saturationنخبت معكنوا بنا Hueد د كه میزان اطمینان به ن ان مي

، Hدر نتیجنه مندل رننگ آن مقا متر كرد. Saturationبا Hueد ي ر نمونه زن توان بالاكر را مي

Scale-Invariant Shift-Invariant .[، 31در ]بننا شنندت نننور اسننتGevers مكننارانش يننک

نرمنالیزه شنده اسنت. بنه RGBرا ای نهاد كردند كه بر اساا يک مدل رننگ rgتوكیفگر یختوگرام

- در نتیجه نامتغیر با تغییرات شدت نور، سايه r g ،Scale-Invariantنجام شده، دلیر نرمالیزاسیون ا

ا اذتالف شدت نور در د بخش تصوير ختند.

نخبت به تغییرات رنگ نور زمینه نامتغیر نیخت زيرا كانال شدت ننور اسنتفاده شنده در SIFTتوكیفگر

[ تركیبني از یخنتوگرام 30 مكنارانش ] Van de Weijerاست. R ،G B ای آن تركیبي از رنگ

Hue توكیفگر SIFT را ای نهاد كردند كنهScale-Invariant Shift-Invariant [ 32اسنت. در ،]

معرفي شدند كه منجر به SIFTبرای ا لی بار به عنوان ر دی به توكیفگر 21 ای نامتغیر با رنگ ي گي

نخبت به شندت ننور اسنت. بررسني دقیقتنر ارزينابي Scale-Invariantشدند كه CSIFTتوكیفگر

.[1] [ ایدا كنید33توانید در ]توكیفگر ای مبتني بر رنگ را مي

بافتهای مبتني بر ویژگيهای آشکارسازی بر اساس روش 2.4

د ند ن نان مني معیاری از تغییرات شدت نور يک سطح است كه میزان نرمي منظم بنودن آن را بافت

است. فیلتر ای گابور بافتتري ي گي مبتني بر [ التماال مورد مطالعه37] 23گابور 22[. موجک34-36]

21 Color Invariants

22 Wavelet

23 Gabor

فصر د م: آشكارسازی جخم

12

ايي با جهت اندازه قابر تنظیم در نظر گرفت معمنوال آمارگنان اين ا ذط يابرا میتوان لبه ياب

در سنالهای شود. استفاده مي بافت ا در يک محد ده داده شده برای م خص كردن اطالعات ي گي-ريز

اذیر بخیاری از مطالعات بر ر ی بررسي الگو ای محلي تصوير برای آشكارسازی ت خیص بهتر متمركز

انند انند توانخنته ای انطباقي به كورت د ضعیتي در آمدهاند. مخصوكا الگو ای محلي كه با آستانهشده

نتیجه د د 24بندی تصوير ا مانند ت خیص چهره دستهمینهبهتري نتايج ر ز دنیا را در بخیاری از ز

[1].

معرفي كردند. آننالیز 25LBP مكارانش نوعي توكیفگر با بازد ي بخیار باال را به نام Ojala[، 38در ]

در ينک تبافن معیاری نامتغیر با سطح ذاكخنتری اسنت كنه از تعريفني كلني از LBPموجود در بافت

مقا منت آن در برابنر تغیینرات شندت ننور در LBPمهمتري ي گي مخايگي محلي ايجاد شده است.

LBPاذینرا بخنیاری از اننواع گونناگون تصوير است. ي گي مهم ديگر آن سادگي محاسباتي آن اسنت.

Zhang[ معرفني شندند. 40( ]27LBP-MBبلنوكي در چنند مقیناا ) 26LTP [39 ]LBPشنامر

را برای نمايش ت خیص چهره ای ننهاد كردنند. 28[ ي گي گابور محلي د سطحي41ارانش در ] مك

اي د فوريه. LBP 29معنايي LBPرا ای نهاد كردند: LBP مكارانش د نوع ديگر Mu[، 42در ]

ر توانند در فضا ای رنگ استفاده شوند ن ان داده شده كنه بنرای ت نخیص انخنان مناسنبت ي گي مي

نوعي توكیفگر محلي با نام توكیفگر محلني 30 مكارانش با الهام از قانون بر Chen[ 43در ] ختند.

اي توكیفگر بر اي اساا بنا شده است كه ادراك انخنان از ينک الگنو ( را معرفي كردند. 31WLD بر )

24 Image Classification

25 Local Binary Patterns

26 Local Ternary Patterns

27 Multi-scale Block LBP

28 Gabor Binary Patterns

29 Semantic LBP

30 Weber’s Law

31 Weber Local Descriptor

فصر د م: آشكارسازی جخم

13

ه محنرك نینز بخنتگي دارد تنها بر تغییرات محرك )مانند كدا يا نور( بختگي ندارد، بلكه به مقدار ا لی

[33].

32زماني-های مکانيویژگيهای آشکارسازی بر اساس روش 2.5

به نماي ي محبوب برای ت خیص عمر آشكارسازی بنا اسنتفاده از زماني اذیرا - ای محلي فضا ي گي

ن ای برجخته الگو ای لركتي در يديو را ن ازماني محلي، ي گي- ي گي فضايياند. تصوير بدل شده

ا مچنی ایچیدگي مكاني مقیاا-داده نماي ي نخبتا مختقر از اعمال را نخبت به شیفت زماني

چندي ر ش برای محلي سازی توكیف گ ارند. ا زمینه چندي لركت در كحنه را در اذتیار مي

نای متفنا ت لش ای دسته بندی عمر چنا ي گي ای نهاد شده نتايج بخیار ذوبي از آنها در زمینه

[.44اند ]آشكارسازی نمايش داده شده

Ke [ استفاده از ي گي45 مكارانش در ] ای لجمي برای ت خیص عمر در تصا ير يديويي را مورد

نای ای د بعدی در ن ينک مخنتطیر در تصنا ير را بنه ي گني آنها مفهوم ي گيبررسي قرار دادند.

Liuآينند. بنه لخناب مني 33ماننند - نای نار بخنطي از ي گني زماني بخط دادند كه -لجمي مكاني

لركت را برای ت خیص مقا م عنابري ایناده ای ننهاد -[ يک توكیفگر ي گي كانتور47 مكارانش در ]

سنو زماني به عنوان نماي ي سطح اايی از عابري ایاده استفاده شده اسنت. -كانتور ای مكانيدادند.

شود تا كنانتور ينک بعندی را بنه فضنای سنه بعندی بخنط د ند. مال مييک تبدير فاكله سه بعدی اع

Willems [ آشكارساز ِخیَ 48 مكارانش در ]را ای ننهاد كردنند كنه نم مكناني نم زمناني 34

Scale-Invariant [ بنرای 49زمناني از معینار برجخنتگي خنی اا كنه در ] -است بخنطي مكناني

اي آشكارساز میزان برجختگي را بنا اسنتفاده از مناتري ت.در تصا ير استفاده شده اس Blobت خیص

[ 50 مكنارانش در ] Laptevتوسنط HOG/HOFتوكنیفگر كنند. گیری مي خی سه بعدی اندازه

32 Spatio-Temporal features

33 Haar-like features

34 Hessian Detector

فصر د م: آشكارسازی جخم

14

برای م خص كردن لركت ظا ر محلي، نويخندگان یختوگرامهايي با مقیاا درشت را معرفي شدند.

ای فضايي زماني نقاط منورد توجنه جم شده در مخايگي 35 ای جهتدار جريان تصويریاز گراديان

سه بعندی SIFT[ نوعي توكیفگر 51 مكارانش در ] Scovanerآشكارسازی شده را محاسبه كردند.

را برای نمنايش ينديو ا اسنتفاده كردنند Bag of Wordsآنها از ر شي مبتني بر را ای نهاد كردند.

Klaserتوسنط HOG3Dتوكنیفگر زمناني كلمنات ایندا كردنند. -نوعي ارتباط میان نمايش فضنايي

ای جهتدار سه بعدی عمر اي توكیفگر بر اساا یختوگرام گراديان[ ای نهاد شد. 52 مكارانش در ]

برای ت خیص عمر انخان (Transform) زماني بر اساا تبدير-[ نوعي توكیفگر مكاني53كند. در ]مي

( را ای ننهاد 36ESURFتوسعه يافته ) SURF[ توكیفگر 48ارانش در ] مك Willemsای نهاد شد.

[ 54 مكنارانش در ] Zhaoداد. بنرای تصنا ير را بنه ينديو ا بخنط مني SURFكردند كه توكیفگر

( را بر ر ی سه كفحه متعامد ای نهاد كردند 37DLBPتوكیفگر الگو ای د سطحي محلي دينامیک )

.[1] یک استفاده كردنددينام بافتاز آن برای ت خیص

ترکیبي از چند ویژگيهای آشکارسازی بر اساس روش 2.6

ای متفا ت در كاربرد ای بازينابي تصنوير ينديو، از زمان ظهور توكیفگر ای متفا ت، تركیب ي گي

ای متفا ت تركیب ي گيآشكارسازی رديابي با استفاده از تصوير دارای ا میتي ر ز افز ن شده است.

شود تا توجه محققان بی تری شود كه باعث ميمعموال باعث افزايش بازد ي سیختم يا مقا مت آن مي

تصويری ... ج ب آن شود.-ای، بینايي ماشی ، اردازش گفتار كوتي ای چند رسانهدر زمینه

Tuzel [ از ماتري كو اريان به عنوان توكی55 مكارانش در ] .فگر در نمايش انخان استفاده كردنند

ا را در توكیفگر ای كو ارينان قطعني ا موقعیت ا، جهتتواند اطاعات قدرت گراديانر ش آنها مي

35 Optical Flow

36 Extended SURF

37 Dynamic Local Binary Patterns

فصر د م: آشكارسازی جخم

15

قرار د ند. م كر اكلي ماتري كو اريان اي اسنت 38مثبت متقارن كه بر ر ی يک مانیفولد ريماني

[ نوعي توكیفگر جديند 56 مكارانش در ] Hongر است. كه عملیات در ندسه ريماني معموال زمان ب

در مقايخه با ماتري كو ارينان ننه تنهنا در ارزينابي Sigmaمعرفي كرد. دسته Sigmaبه نام دسته

با استفاده از آمارگان مرتبه ا ل ترساده توانفاكله محاسبه میانگی بازد ي بهتری دارد، بلكه آن را مي

بهبود داد.

نای اند كه استفاده از تركیبي از ي گي ای چندگانه جديد، برذي آثار ن ان دادهار اذتراع ي گيدر كن

edgelet ،HOG نای [ ي گني 57در ] Wu Nevatiaتوانند بازد ي را بهبود بخ د. موجود نیز مي

Han. برای بهبنود دقنت سنرعت بنه كنار بردنند Boostingماتري كو اريان را در يک چارچوب

مانند - ای اربخط يافته برای تولید تركیبي از ي گي Swendsen-Wang[ از برش 58 مكارانش در ]

شنود. مانند مني -استفاده كردند نتايج آنها ن ان داد كه اي تركیب باعث بهبود ای كلي در ي گي ار

Shao Ji [ 59در ]MHI PCOG كردند. انخاني تركیب لركاتبندی را برای دسته

Wang [ يک توكیفگر جديد 60 مكارانش در ]HOG-LBP را برای ت خیص عابري ایاده ای نهاد

[ ننوعي تركینب بهیننه از 61 مكنارانش در ] Shottonكردند كه نخبت به موان جزئي مقا مت دارد.

ردننند. بنرای ت نخیص اجخنام ای ننهاد ك Boostingرا بنر اسناا الگنوريتم بافنت اطالعنات كنانتور

Schwartz [ نوعي توكیفگر بهینه را برای آشكارسازی عابري ایاده بر اساا آنالیز 62 مكارانش در ]

PLS (Partial Least Squares .ای نهاد كردند ) ،بافنت چنی توكیفگری تركیبي از اطالعات گراديان

كردنند كنه چنندي [ معیناری بنرای اجخنام را معرفني 63 مكارانش در ] Alexe رنگ را داراست.

كند. چارچوب بیزی از تصا ير مانند رنگ، كنتراست، تراكم لبه برجختگي در چند مقیاا را تركیب مي

اذیرا، ر ش آموزش چندي خته در میان محققان جلب توجه كنرده اسنت. بنا داشنت چنندي منبن

يكني از منناب اطالعنات اطالعات فرد ممك است چندي خته اايه را محاسبه كند كه ر كدام بنرای

نای ااينه محاسنبه توان به كورت تركیبي محدب از ختهدر چنی مواقعي خته نتیجه را مي ختند.

را برای ت خیص اجخام ای ننهاد كنرد 39IMKL[ ر شي به نام 64 مكارانش در ] Kembhaviكرد.

38Reimannian manifold

39 Incremental Multiple Kernel Learning

فصر د م: آشكارسازی جخم

16

يابي بنر ر ی آشكارسناز ای يک ارز[ تار كردن ندسي را با يكديگر تركیب كردند. 65] 40PHOGكه

[ داده شده است.67 ي گي توكیفگر ا در ]

41EBIMتوان از به عنوان مثال مياند. ای بیولوژيكي نیز توجه بخیاری را جلب ذود كردهاذیرا ي گي

[68 ]42AR [69 .نام برد ]بنا تقلیند از مكنانیزم بیولنوژيكي كننند تنا ای بیولوژيكي تالش مي ي گي

.[1] ینايي انخان برای دست يافت به بازشناسي مقا م استفاده كنندسیختم ب

نند نای تحقیقناتي متعنددی در انردازش تصنوير مان توكیف ي گي به طور كلي جزئي لیاتي از زمینه

ر زمینه توكیفگر ای تصنويری را ذالكنه ای اذیر دای رفت 2.1جد ل آشكارسازی يا رديابي است.

ای چ مگیر در اي زمینه، نوز توان نتیجه گرفت كه با جود ای رفت ای باال مياز دسته كرده است.

م كالت در یچ توكیفگری جود ندارد تا به تنهايي به قدر كافي مقا م با بازد ي باال باشد كه بر تمام

كنند ا ساذتار ای كلي تمركز ميبر ر ی لبه HOGن مثال توكیفگر اي زمینه مقابله كند. به عنوا

يک م كر ای نويزدار عمر كند. تواند در نوالي با لبهكند، در نتیجه نمياز نوالي كاف چ مووشي مي

گ اری در نگنام مقايخنه ينک ایكخنر بنا ایكخنر اي است كه عمر آستانه LBPدر توكیفگر عملگر

ای مبتني بنر رننگ اطالعنات كلني تصنوير را ي عملگر را به نويز لخاا كند. ي گيتواند اكناری مي

بنا اين د ند كه نخبت به زا يه ديد، جابجايي چرذش جخم نالیه مد نظر مختقر اسنت. ن ان مي

كامال متفا ت باشند، در نتیجه یختوگرام بافت جود ممك است اجخامي با یختوگرام رنگ م ابه در

طريقه تركیب چندي ننوع ي گني در ينک چنارچوب تواند اطالعات كافي را در اذتیار بگ ارد. نميرنگ

-عال ه بر اي درك بهتر سیختم بینايي انخان مييكوارچه امری است كه نیاز به تحقیقاتي سیعتر دارد.

ای توكیفگر بخیار مفید اق شود.تواند در زمینه تحقیقات ي گي

های اخیر در توصیفگرهای تصویری.پیشرفت 2.1جدول

ار ش نمايندگان توكیفگر

40 Pyramidal Histogram of Oriented Gradients

41 Enhanced Biologically Inspired Model

42 Attentional Regions

فصر د م: آشكارسازی جخم

17

HOG, SIFT, ISM [14-29] ای مبتني بر گراديان ي گي

CSIFT [30-33] ای مبتني بر رنگ ي گي

LBP, WLD [34-43] بافت ای مبتني بر ي گي

3DSIFT, DLBP [44-53] مكاني- ای زماني ي گي

Sigma Set, HOG-LBP [54-64] تركیب چندي ي گي

EBIM, ARs [65 ،66] ای بیولوژيكي ي گي

فصر سوم: رديابي جخم

18

3

فصل سوم

ردیابي جسم

فصر سوم: رديابي جخم

19

43ردیابي جسم

اردازيم. در يک دسته در اي فصر به بررسي انواع گوناگون ر شهای رديابي جخم با استفاده از تصوير مي

توان به ر شهای آنالي ، ر شهای مبتني بر اطالعات زمیننه ای رديابي جخم را ميالگوريتمبندی ساده،

(contextر شهای مبتني بر نمونه ) برداری مونته كارلو دسته بندی كرد. در اي فصر بنه بینان شنیوه

.لر مخاله توسط اي ر شها ارداذته تالش داريم تا مزيات معايت ر يک را مت كر شويم

های ردیابي آنالین جسمروش 3.1

نای اساسني در رديابي با استفاده از تصوير، رسیدگي به تغییرات ظا ری جخم دف، يكني از چنالش

بنیادی است. به طور كلي د دسته تغییرات ظا ری داريم: داذلي ذارجي. تغییرات زا ينه ينا تغیینر

ند. اي در لالیخت كه تغییرات ذارجي بنه رشكر جخم دف جزء تغییرات ظا ری داذلي به شمار مي

دلیر تغییرات ر شنايي محیط، جابجايي د ربی ، زا يه ديد د ربی اوشش جخم توسط ديگنر اجخنام

تواننند نمنايش ای انطباقي قابر رسیدگي ختند كنه مني اي تغییرات تنها با استفاده از ر ش ختند.

شنود كنه ای آنالي لن مني جه نیازی جدی به الگوريتمجخم را به طور تدريجي تغییر د ند. در نتی

توان به د دسته تقخیم كرد: ای آنالي را ميبه طور كلي ر شتوانند به طور مدا م آموزش ببینند. مي

.45تفا ت گ ار ای ر ش 44مولد ای ر ش

43 Object Tracking

44 Generative

45 Discriminative

فصر سوم: رديابي جخم

20

برای ردیابي آنالین مولدهای روش 3.1.1

شوند، برای رسیدگي بنه تغیینرات جخنم استفاده ميجخم ، كه برای يادگیری ظا ر يک مولد ای ر ش

شنود تنا بنا تغیینرات مدل جخم معموال به كورت آنالي بنه ر ز مني اند. دف مورد استفاده قرار گرفته

د.باق يابظا ری انط

Jepson [ يک مدل مخلوط را با استفاده از يک الگوريتم 70 مكارانش در ]EM آنالي توسعه دادنند

[ مندلهای انطبناقي 71 مكنارانش در ] Zhouا ری در لی رديابي را مدلخازی كننند. تا تغییرات ظ

جاسازی كردند تا به رديابي مقنا م بنا اسنتفاده از تصنوير دسنت Particle Filterظا ر جخم را در يک

[ يک الگوريتم يادگیری آنالين را بنرای آمنوزش تندريجي ينک مندل 72در ] Lee Kriegnanيابند.

مكارانش ينک چنارچوب ردينابي بنا اسنتفاده از Ross[، 73در ]عمومي از يديو ارائه دادند. ظا ری

بردار بنا اسنتفاده از -عنوان-به-تصوير عمومي سازی شده را بر اساا آموزش زيرفضای تدريجي تصوير

ا ای نهاد دادند.بر زرساني به سیله میانگی نمونه

مكناني Redundancyی رديابي ذكر شند تواننايي بهنره بنرداری از توجه داشته باشید كه تمامي ر شها

ماتري برای -عنوان-به-در ن تصا ير را ندارند. در نتیجه توجه اكلي بر ر ی توسعه الگوريتمهای تصوير

[ از ينک ر ش آمنوزش زيرفضنای 74 مكنارانش در ] Liآنالیز زيرفضای منوثر معطنوف بنوده اسنت.

[، ينک 75در ] ( برای رديابي با استفاده از تصوير استفاده كردند.46ITPCA)تانخور ای زماني سه بعدی

( بنرای تطبینق بنا تغیینرات 47WTSالگوريتم آموزش آنالي تدريجي برای زير فضای تانخنور زن دار )

البته مدلهای ظنا ری اسنتفاده شنده در ر شنهای ظا ری جخم در لی رديابي توسعه داده شده است.

عموال نخبت به تغییرات نور محیط، زا يه ديد محر د ربی لخاا ختند. اي امر رديابي ذكر شده م

ای مكناني ای آماری م ي گيبه دلیر كمبود يک معیار مناسب برای توكیف جخم كه م ي گي

48IPCA[ بنا الهنام گنرفت از الگنوريتم 76 مكارانش در ] Yangجخم را مد نظر داشته باشد است.

46 Incremental Tensor Principal Component Analysis

47Weighted Tensor Subspace

48 Incremental Principal Component Analysis

فصر سوم: رديابي جخم

21

بنر را برای رديابي دست با استفاده از تصوير استفاده كردنند. PCA-HOGتوكیفگر تدريجي يک [73]

[ 78 مكنارانش در ] Li[، 77اقلیدسني ] -Logاساا توكیفگر ماتري كو ارينان معینار ريمناني

الگوريتمي برای يادگیری زيرفضای آنالي ارائه دادند كه تغییرات ظنا ری را بنا آمنوزش تندريجي ينک

برای ر ضعیت ندف بنه سنیله بنه ر ز كنردن انطبناقي مینانگی نموننه نا eigenspaceمايش ن

eigenbasis با توجه به ایچیدگي محاسنباتي بناال، كند. مدلخازی ميWu [ ينک 79 مكنارانش در ]

گیرد كنه ر ش رديابي را ای نهاد كردند كه به تدريج يک نمايش تانخور كو اريان با ابعاد كم را ياد مي

يابد.در نتیجه به طور آنالي با تغییرات ظا ری انطباق مي

برای ردیابي آنالین تفاوت گذارهای روش 3.1.2

برای دسته بندی نیز برای رسنیدگي بنه تغیینرات ظنا ری در نگنام ردينابي بنا تفا ت گ ار ای ر ش

بینند رت آنالي آموزش مني بندی كننده به كواند كه در آنها يک دستهاستفاده از تصوير استفاده شده

رديابي با اسنتفاده از آشكارسنازی اي ر ش نیز با عنوان شوند تا جخم را از ا زمینه جا كنند. بر ز مي

ای از شود كه در آن يک جخم دف ت خیص داده شده توسط كاربر در فريم ا ل توسط دستهنامیده مي

بنندی كنند يک دسته ا ا زمینه را توكیف مييای از ي گشود. دسته جداگانه ا توكیف مي ي گي

برای رسیدگي به تغییرات كند.كننده د كالسي جخم دف را از ا زمینه در فريمهای متوالي جدا مي

نای مینزان محند ديت شنود. ظا ری جخم، دسته بندی كننده در طول زمان به طور تدريجي بر ز مني

كند.گیرد را محد د ميبال جخم دف كورت ميجابجايي، فضايي كه در آن جختجو به دن

Collin Liu [ ر شي را برای انتخاب انطباقي ي گي80در ] ای مبتني بر رنگ ای نهاد كردند كه بنه

بنندی [ از تركیبي از تعدادی دسنته 81در ] Avidonكند. ذوبي جخم را از ا زمینه فعلي آن جدا مي

بندی كننده ضعیف يک ابر كفحه ر دستهاده از تصوير استفاده كرد. كننده انطباقي برای رديابي با استف

[، 82. در ]HOG نای ي گني R ،G B ای بعدی شامر رنگ 11 ای ذطي است در فضای ي گي

Wang نای جداكنننده از ينک مكارانش الگوريتمي را برای رديابي بر اساا انتخاب آنالين ي گني

( Fisher’s Discriminant Methodبنا اسنتفاده از ر ش جداسناز فی نر ) نا فضای بزرگ از ي گي

د بعندی LDA مكارانش ر ش رديابي جديدی را بنر اسناا آمنوزش Li[، 83در ]ای نهاد كردند.

فصر سوم: رديابي جخم

22

مكارانش يک ر ش آمنوزش جداسناز بنر Zhang[، 84در ]تدريجي استنتاج بیزی ای نهاد دادند.

( ای نهاد كردند كه در آن ساذتار تواولوژی گراف به دقت Graph Embeddingاساا جاسازی گراف )

[ نوعي ردياب 85 مكارانش در ] Tian ا باشد. ای توزي نمونهطرالي شده تا منعك كننده ي گي

ای ذطي را ای نهاد كردند كه از اطالعات گ شنته در نگنام SVMای از آنالي با استفاده از مجموعه

د نند كنه ( ن ان ميcognitive ای ر ان شناسي شناذتي )بررسيكند. ي استفاده ميرديابي به ذوب

مكارانش در Yangبا الهام گرفت از اي تئوری، درك انخان شناذتي ابخته به میزان توجه است.

مبتنني [ يک ر ش جديد برای رديابي با استفاده از تصوير را ای نهاد كردند نوعي الگوريتم جديد 86]

ای از ننوالي اي الگوريتم به كورت دينامیک زير مجموعه( را ارائه دادند. 49AVTبر توجه برای رديابي )

د ند. ای گ شته ت خیص مني بر اساا داده تفا ت گ ارمورد توجه جداساز را با استفاده از يادگیری

را طرالني Boostingتني بر آنالي مب[ نوعي دسته بندی كننده 87،88 مكارانش ] Grabnerاذیرا

Saffariمندتي بعند، كند. ای جداساز را از میان تعدادی كانديدا انتخاب ميكردند كه بهتري ي گي

در مقايخه بنا آنالي را بر اساا نوعي ار سه رشد درذت آنالي ای نهاد دادند. 50RF[ 89] مكارانش

Wangتنر اسنت. ويز برچخنب داده مقنا م در مقابنر نن RF[، ر ش 87،88آنالي ] Boostingر ش

[، بنرای 91تصا ير يديويي ای نهاد كردنند. در ] تفخیر [ معیاری فراتر از فاكله را برای 90 مكارانش ]

بر ر ی يديو از يادگیری چند گرافه استفاده شد.تفخیر يكوارچه كردن

كر اساسي دارنند: نر بر زرسناني علي ررم بازد ي باالی آنها، ر شهای مبتني بر انطباق آنالي يک م

تواند باعث ذطا در رديابي شود )مخناله ردياب ممك است میزاني ذطا ارد مدل كرده كه در نهايت مي

Drifting ،برای رلبه بر اي م كر .)Grabner [ ينک ننوع ر ش نیمنه نظنارتي را 92 مكارانش در ]

فنريم ا ل آمنده ديگنر مثالهنای آموزشني بند ن ای نهاد دادند كه در آن مثالهای برچخب دار تنها از

اگرچه اي ر ش برای سناريو ايي كه در آنهنا جخنم بنه طنور از محند ده ديند مانند. برچخب باقي مي

بنه شود مناسب است، تخمی دقیق موقعیت جخم در فنريم ا ل امنری دشنوار اسنت. د ربی ذارج مي

يند بنرای ردينابي را بنر اسناا ر ش آنالين [ ر شني جد 93 مكنارانش در ] Babenko می دلیر

49 Attentional Visual Tracking

50 Random Forrest

فصر سوم: رديابي جخم

23

را ای نهاد كردند كه م كر عدم قطعیت برای برداشنت مثالهنای مثبنت در 51يادگیری با چندي مثال

[ ر ش يادگیری 92 ای ذوب ر د ر ش نیمه نظارتي ]با الهام از ي گيكند. نگام رديابي را لر مي

[ نوعي الگوريتم رديابي نیمه نظارتي را ای نهاد كردند 94ر ] مكارانش د Zeisl[، 93با چندي مثال ]

اين ر ش باعنث ايجناد نتنايجي تواند ر د ی اي ر شها را در چارچوبي يكوارچه تركینب كنند. كه مي

[ 95 مكنارانش ] Santnerاذینرا توانند. تر از اعمال ر د ی اي ر شها به كورت جداگاننه مني مقا م

را ای نهاد كردند كه با تركیبي وشمندانه از سه ردياب به PROSTص به نام نوعي سیختم رديابي ذا

، جريان 52NCCتخمی موقعیت جخم دست يافته است: ر ش تطبیق قالب بر اساا بهتري نتايج برای

برای رلبه بر مخناله [. از ديگر ر شهای ارائه شده89آنالي ] RF[ 96] 53تصويری با جايجايي میانگی

Drifting ايي با آستانه اطمینان متفنا ت [ دسته بندی كننده97ذر ] [ نام برد.98[ ]97توان از ]مي

مكارانش نوعي الگوريتم رديابي با استفاده از آشكارسنازی را Breitenstein[، 98در ]استفاده شدند.

م آسنتانه اطمیننان برای رديابي چند انخان به طور مزمان ای ننهاد كردنند كنه بنا اسنتفاده از مكنانیز

بنندی كنننده آنالين رلبنه آشكاری سازی آب اری تالش دارد تا بر م كالت به جود آمده توسط دسته

تنري راه لنر بنه دسنت آ ردن ، مختقیمDriftingكند. با در نظر گرفت دالير به جود آ رنده مخاله

رانش يننک چننارچوب مكننا Aeschliman ،[99مرز ننای دقیقنني از جخننم تحننت رديننابي اسننت در ]

رديابي مزمان ای نهاد كردند كه باعث ای نرفت چ نمگیری 54التماالتي جديد را برای قطعه بندی

مكارانش ر شي جديد را برای جاسازی اطالعات شكر كلي Yin[، 100در مقا مت ردگیری شد. در ]

ت شكر كلني مكمنر اطالعاای نهاد دادند. 55CRFجخم در ن ارتباطات محلي گراف در يک چارچوب

سازی موفق از باال به اايی بنوده اسنت بندی تصوير، نوعي ایادهسازی از باال به اايی ر ش قطعهایاده

گام رديابي انطباقي جلوگیری كند.در ن Driftكه توانخته از بر ز

51 Multiple Instance Learning

52 Normalized Cross Correlation

53 Mean Shift Optical Flow

54 Segmentation

55 Conditional Random Field

فصر سوم: رديابي جخم

24

ننه اسنتفاده توان در يک چارچوب رديابي با ا داف چندگارا مي تفا ت گ ار مولد ر د دسته ر شهای

انند كنه بنر ر ی لنر مخناله اذیرا تعداد زيادی الگوريتم رديابي با ا داف چندگاننه ای نهاد شنده كرد.

مكارانش نوعي ر ش بهینه سازی بر اساا جريان Zhang[، 101در ]اند. تخصیص داده تمركز كرده

تخصیص داده بهیننه دادند. شبكه را برای تخصیص داده مورد نیاز برای رديابي چندي جخم را ای نهاد

[ ينک ر ش 102 مكنارانش در ] Yuanشنود. توسط يک الگوريتم لداقر زينه در شبكه ايجاد مني

سلخله مراتبي بر اساا يادگیری از رديابي چندي دف بنا تخصنیص تندريجي نتنايج آشكارسنازی بنه

[ ينک ر ش تخصنیص بنر 103 مكارانش در ] Huang دف مورد عالقه را ای نهاد دادند. مخیر ای

جخم در محیطهنای شنلو ای را برای رديابي مقا م چندي اساا آشكارسازی سلخله مراتبي سه مرلله

دند.ای نهاد دا

ينک م نكر اساسني ای رفتهای اذیر در زمینه ر شهای رديابي آنالي را ذالكه كرده است. 3.1جد ل

به سادگي در مولداي در لالي است كه ر شهای سیت آنها به نويز داده است. لخا تفا ت گ ارر شهای

اند تنا اين ر شنها را بنا [ تالش كرده105 104اذیر ]شوند. مقابر ا زمینه ایچیده دچار م كر مي

در لقیقت، نحوه تركیب ر شهای يادگیری اند. يكديگر تركیب كنند به ای رفتهايي نیز دست ایدا كرده

در يک چارچوب يكوارچه يكي از مخنائر كالسنیک تفا ت گ اربا ر شهای يادگیری ماشی مولدشی ما

عال ه بنر اين ينافت تعنادل بهتنر مینان در زمینه يادگیری ماشی است نیاز به تحقیق بی تری دارد.

از است.انطباق ا يری اايداری در نگام استفاده از ر شهای يادگیری آنالي نوز از مخائر ب

.[1] های اخیر روشهای ردیابي آنالینپیشرفت 3.1جدول

ار ش نمايندگان دسته

IPCA, ITPCA [67-76] مولدای شر

Online RF, MILBoosting [77-93] تفا ت گ ار ای ر ش

[100، 99] كیبي ای ترر ش

فصر سوم: رديابي جخم

25

56زمینههای مبتني بر اطالعات روش 3.2

عات البر سر نقش ارزشمند اط محققان در زمینه رديابي با استفاده از تصوير توافق گخترده ای در جامعه

مطالعنات ( جنود دارد. Image Understandingدر كاربرد ای آنالیز ينديويي درك تصنوير ) زمینه

اند. اذیرا محققنان در خیص آشكارسازی اجخام توسط انخان را ن ان دادهدر ت زمینهبخیاری ا میت

ای رديابي با استفاده از تصوير برای دست يابي به ای نرفتهای را در چارچوب زمینهتالشند تا اطالعات

متعددی جای د ند.

ای از اجخنام دسته مكارانش نوعي الگوريتم رديابي جديد را با استفاده از جا دادن Yang[، 106در ]

به طور ذودكار در ينديو قابنر آشكارسنازی اسنت را ارائنه كردنند. 57كمكي كه با استفاده از داده كا ی

مكارانش Yuanشود. تر شدن الگوريتم ميرديابي اي اجخام كمكي باعث محاسبات بهینه تر مقا م

نای گونناگون در گاننه از دسنته [ مخاله شناسايي، ت نخیص موقعینت ردينابي ا نداف چند 107در ]

زمناني در سنطح جخنم در -آنهنا از ارتباطنات مكناني يديو ای اتاق مالثات را مورد بررسي قرار دادنند.

مناركوف مدلخنازی RFدر اي تحقیق توسط ينک زمینهارتباطات چارچوب كاری ذود استفاده كردند.

Stalder[، 108در ]شد. مي انجاممان شد كه در آن شناسايي، ت خیص موقعیت رديابي به طور مز

مكارانش ر شي جديد را برای افزايش مقا مت الگوريتمهنای ردينابي بنا اسنتفاده از آشكارسنازی را بنا

ايي را بر ر ی استفاده از فیلتر كردن میزان اطمینان آب اری ای نهاد كردند كه در ر مرلله محد ديت

[ ننوعي 109 مكنارانش در ] Rothكنرد. ودن مخیر اعمال مني اندازه جخم، برتری ا زمینه نرم ب

كرد تا امر محلي استفاده مي ایزمینهای نهاد دادند كه از Classifier Gridsتوكیفگر جديد را به نام

[ ر شي را برای 110 مكارانش در ] Grabnerتری تقخیم كند. آشكارسازی كلي را به زيرمخائر ساده

ايي ای نهاد دادند كه لتي در مواقعي كه جخم به طور مختقیم قابر م ا ده نیخت يادگیری ا تیبان

تواند برای تعیی موقعیت جخم مورد عالقه مفیند كند، مي يا ظا ر آن با سرعت شدت زياد تغییر مي

56 Context

57 Data Mining

فصر سوم: رديابي جخم

26

وير را مكارانش الگوريتمي برای رديابي مقا م با استفاده از تص Kalal[، 112[ ]111 اق شود. در ]

زماني ای نهاد دادند.-مكاني ای بر اساا محد ديت

نای اذینر در زمیننه اسنتفاده از ای نرفت 3.2جند ل اند. ذاكي جاسازی شده زمینهاجخام مواره در

ری در بررسني دقیقتن د ند. برای رديابي با استفاده از تصوير را به طور ذالكه ن ان مني زمینهاطالعات

در زمیننه زمیننه كنیند كنه چنندي ننوع اطالعنات [ ماللظنه 113توانید در ]رابطه با اي زمینه را مي

تواند در چارچوب رديابي مي زمینهچگونگي استفاده از اطالعات آشكارسازی جخم را مقايخه كرده است.

ر باشد.جهتي امید اركننده برای تحقیقات آتي در زمینه رديابي با استفاده از تصوي

.[1] برای ردیابي زمینهدر استفاده از اطالعات های اخیر پیشرفت 3.2جدول

ار ش دسته

Co-occurance [101 ،105] ای ر ش

[107، 106، 102] زماني- ای ارتباط مكانير ش

[104، 103] بتني بر دانش ای مر ش

58برداری مونته کارلوهای مبتني بر نمونهروش 3.3

توان به كورت يک مدل گرافیكي شامر ار سه جخنتجو بنرای لندا رديابي با استفاده از تصوير را مي

اگر چگالي التمال اخی يک گوسي لركت يک جخم از م ا دات نا مطمئ مبهم فرمول بندی كرد.

تنوان [ را مي115] 59[ فیلتر كالم بد ن بو114[، فیلتر كالم تعمیم يافته ]114الم ]باشد، فیلتر ك

البته اكثر مخائر رديابي دنیای اقعي معموال ریر ذطي برای يافت ااسخ بهینه/ریر بهینه استفاده كرد.

ی مونته كارلو بر [ ای نهاد شده تا با شبیه ساز12] Particle Filteringریر گوسي ختند در نتیجه

58 Monte Carlo Sampling

59 Unscented Kalman Filter

فصر سوم: رديابي جخم

27

نمايش چگالي التمال اخی مورد نیاز Particle Filteringكلید اكلي استفاده از اي م كر رلبه كند.

ای مختص آنهاست. ر ش مونته كارلوی زنجینره مناركوف بنا ند م با زنر ای ای از نمونهتوسط دسته

وبي در مخائر رديابي ا داف چندگانه [ به ذ116،117در تصوير ] مفرمولبندی دقیق ر د ذر ج اجخا

استفاده شده است.

در زمینه رديابي، اي ر ش بنا ينک م نكر Particle Filteringبا جود موفقیت ای قابر توجه ر ش

بنرداری از ا مینت برداری ریر بهینه آن در ار سنه نموننه اساسي مواجه است كه علت آن مكانیزم نمونه

Zhang[، 118در ]شنود. نا مني يجاد م نكر معنر ف ضنعیف بنودن نموننه ا است كه باعث انمونه

بد ن بو را با اسنتفاده از ر ش محاسنبه نقناط Particle Filtering مكارانش يک الگوريتم بهبود يافته

ا از ينک ار سنه د مرللنه ای ايجناد Particle[ 119را ای نهاد كردند. در ] 60SVDسیگما بر اساا

درستنمايي ایش بیني كننده بزرگ انجنام ا با استفاده از Particleله ا ل، شبیه سازی اند: در مرلشده

در شوند. ای نهايي ك یده ميگیرد لالت ا مجددا زن تعلق ميParticleشود؛ در مرلله د م به مي

[126 ،]Zhang مكارانش يک الگوريتم Particle Filtering ينک بر اساا وش جمعي را به مراه

برداری سلخه مراتبي از ا میت ای نهاد كردند كه توسط نوش جمعني اسنتخراج شنده از ار سه نمونه

Particleبنرداری در شود در نتیجه تا لدی بنه م نكر ضنعف نموننه دايت مي Particleتنظیمات

Filter[، 121در ]كند. ا رلبه ميKwon ده از مكارانش ر شي ندسني را بنرای ردينابي بنا اسنتفا

تصا ير به سیله يک تاب ا میت بهینه كه به كورت ندسي تعريف شنده اسنت بنا اسنتفاده از بخنط

دنند. كنند ای ننهاد دا عمنر مني Affineبر ر ی يک گنر ه PCAگیری بر اساا تیلور يک تاب اندازه

Schindler [ يک جخم را به كورت مجموعه122 مكارانش در ]ه م ابه كور ای از نقاط به م ایوست

Rao-Blackwellized Particleفلكي نمايش دادند تا با دقت بااليي به رديابي يک زنبور با استفاده از

Filter .با ساذتار ثابت بوردازندParticle Filter آب اری به رديابي در يديو ايي بنا ننرخ فنريم انايی

تركیب شد تا به Particle Filterاسبي با در اي ر ش، الگوريتم آشكارسازی به نحو من[. 97]كرد كمک

به منظور اي ر ش در مورد رديابي كورت باعث افزايش كارايي سیختم شد. تغییرات ناگهاني رلبه كند.

[ نوعي الگوريتم رديابي جديد را بر اسناا الگنوريتم 123] Kwon Leeكنار آمدن با لركت ناگهاني،

60 Singular Value Decomposition

فصر سوم: رديابي جخم

28

تواند محد د نرم بودن لركت را م بنا اسنتفاده از تنرم مي ای نهاد كردند كه 61WLMCبرداری نمونه

[ 124در ] 62BHMCبنرداری درستنمايي م با استفاده از ترم چگالي لالتها كا ش د د. ر ش نمونه

-ارائه شد تا يک الگوريتم جديد را برای ا دافي كه ظا ر ندسي آنها در طول زمان تغییرات شديدی مي

د د بنر م نكر با بازد ي باال میزان ایچیدگي محاسباتي را كا ش مي BHMCر ش كند ايجاد كند.

برداری مونته كارلو يک ای رفت چ مگیر در ر شهای نمونهكند. به دام افتادن در مینیمم محلي رلبه مي

[ است كه به مقا مت بااليي در رديابي در سناريو ای به شدت ایچینده دسنت يافتنه اسنت. اين 125]

مخصوكنا مندل م نا ده بنه كنند. اساا ر ش تفكیک رديابي با استفاده از تصوير عمر مي الگوريتم بر

تُنُک از يک دسته ي گي قالب ايجاد PCAشود كه با استفاده از ای تقخیم ميچندني مدل م ا ده اايه

شنود نر كندام ای نمايش داده مني مدل لركت نیز توسط تركیبي از چندي مدل لركت اايهشود. مي

د ند.عي ذاص از لركت را اوشش مينو

-برداری مونته كارلو به جود آمدهدر سالهای اذیر، چندي نوآ ری در زمینه رديابي آماری بر ساسا نمونه

برداری مونته كارلو برای رديابي با ای اذیر در زمینه ر شهای نمونهای از ای رفتذالكه 3.3جد ل اند.

تنوان در برداری مونته كنارلو را مني توضیح مفصلي از ر شهای نمونهد د. استفاده از تصوير را نمايش مي

بنرداری مونتنه در مقايخه با ر شهای مبتني بر جختجوی متدا ل، مزيت اكلي ر ش نمونه[ يافت. 126]

-تالش بنرای نموننه برداری در نگام رديابي است. مزيت ديگر اي است كهكارلو كا ش بخ های نمونه

توان مختقر از ابعاد جخم ثابت نگاه داشت، كه اي لالت با افزايش محد ده جختجو بنرای برداری را مي

، 85ر ز دنینا ] تفا ت گن ار مدل شيء با ضريبي ثابت م ارز نیخت. بخیاری از ر شهای يادگیری آنالي

جختجو به طور مخنتقیم تخمنی زدنند. [ موقعیت جخم را با استفاده از ر شهای مبتني بر93، 87-89

تواند مفید اق شود.تركیب اي ر شها در يک چارچوب استنتاج آماری مي

.[1] برداری مونته کارلوهای مبتني بر نمونههای اخیر در روشپیشرفت 3.3جدول

ار ش دسته

61 Wang-Landau Monte Carlo

62 Basin Hopping Monte Carlo

فصر سوم: رديابي جخم

29

Particle Filter [92 ،113-117] ای ر ش

Markov chain [111 ،112 ،118-121] ای ر ش

های گوناگون ردیابيمقایسه روش 3.4

باشند: رديابي با استفاده از تصوير نوعي آنالیز لركتي در سطح جخم است كه شامر د جنزء اكنلي مني

نای اذینر در فصر فصر قبر ما به بررسي ای نرفت طريقه نمايش جخم فیلتر كردن زماني. در اي

زمینه رديابي با استفاده از تصنوير، شنامر توكنیفگر ای ي گني، ر شنهای ردينابي آنالين ، اسنتفاده از

نا، ينک برداری مونته كارلو ارداذتیم. در ر يک از اي زمینهاطالعات زمینه مچنی ر شهای نمونه

نماينده انتخاب شده است تا بازد ي آن ر ش را ن ان د د. مقايخه میان سیختم شناذته شده به عنوان

نمايش داده شده است. 3.4جد ل ا در اي ر ش

.[1] مقایسه میان روشهای شناخته شده 3.4جدول

Drifting اوشش جزئي د ران سرعت لوزه سیختم

TLD [94] مقا م ریر مقا م ریر مقا م سري يادگیری آنالي

CCD [108] مقا م مقا م ریر مقا م متوسط اتركیب ي گي

TI [110] مقا م مقا م ریر مقا م متوسط زمینه

VTD [125] مقا م مقا م مقا م كند مونته كارلو

در سنالهای اذینر HOG ،LBP SURFكه انواع گوناگون توكیفگر ای ي گني ماننند با جود اي

اند، یچ يک به مقدار كافي سري مقا م در برابر تمامي م كالت موجود بنر سنر راه ردينابي ابداع شده

بنا توجنه بنه ای نرفت نای اذینر در زمیننه ر شنهای نیخت. مانند تغییرات شديد لركت يا ظا ر

فصر سوم: رديابي جخم

30

، يكي از مخیر ای 63 ر شهای يادگیری با چند خته Boostingری ماشی تركیبي مانند ر ش يادگی

امید بخش برای تحقیقات آينده در زمینه تحقیقات رديابي با استفاده از تصوير تركیب انواع ي گي مانند

يكوارچه بنرای ر شهای مبتني بر كانتور يا بافت يا تركیب اطالعات يديويي كوتي در يک چارچوب

تحقیقات بخیاری در اي زمینه مانند آشكارساز چهره ای مكاني آماری ذوا د بود. استفاده از ي گي

Boost [ خته127شده آب اری ][ انجام شده128 ای چندگانه برای آشكارسازی جخم ،] .اگرچنه اند

ای لر ن ده بناقي ماننده اسنت. نوز مخاله Boosting ای ضعیف در ر ش انتخاب دسته بندی كننده

-بندی كننده ای ضعیف از لدا اتفاقي بهتر عمر نكرده در نتیجه در كا ش ذطا كمكي نميدسته

كند.

ای تركیبي از تعدادی ي گني داده شنده بنر تواند تالش برای ايجاد ي گيجهت امیدبخش ديگری مي

معموال زينه ایچیدگي بااليي دارند 64MKL از طرفي ديگر، ر شهایكا ی باشد. اساا تكنیكهای داده

برای رلبه بر اي كنند. در نتیجه، م در فاز آموزش م در فاز تخت، الگوريتمي سنگی را لاكر مي

[ را 129[ جختجوی زير انجره بهینه ]127 مانند ر ش آب اری ]ای م كر، ر شهای جختجوی بهینه

اد.جای د MKLتوان در چارچوب ر شهای مي

انند. ر شهای آموزش آنالي در د ه اذیر در زمینه رديابي با استفاده از تصوير مورد بررسني قنرار گرفتنه

رلبنه اند تا بر م كالت لاالت ایچیده در نگنام ردينابي ای ر ز دنیا ای نهاد شدهبخیاری از الگوريتم

الي نوز بنه تحقیقنات بی نتری ذاتي در زمینه ر شهای رديابي آن Driftingبا اي جود م كر . كنند

بر اساا Boosting[، ر ش 92] 65نیمه نظارت شده Boostingر شهای موجود مانند ر ش نیاز دارد.

-عمر مي Anchoring[، مگي بر اساا مكانیزم 95] PROST مچنی 66آموزش با چندي نمونه

شود اجخام مورد عالقنه بنیش از است كه باعث مي Driftكنند كه يک استرات ی عام برای جلوگیری از

با اي جود تمامي ر شنهای ذكنر شنده م نكر مندل ظنا ری لد از مدل ظا ری ا لیه فاكله نگیرند.

63 Multiple Kernel Methods

64 Multiple Kernel Learning

65 Semi-Supervised

66 Multiple Instance Learning based Boosting

فصر سوم: رديابي جخم

31

ایدا كنند Driftای ی ثابت را دارند كه يا بیش از لد عام بوده ممك است به سمت اجخام م ابه

شود.ز ذطا مييا بیش از لد سختگیرانه است كه در شرايط سخت باعث بر

توانند بنه تواند ايجاد يک مدل ای ی انطباقي آنالي باشد كنه مني راه للي مناسب برای اي م كر مي

توانند تعنادل مناسنبي مینان چنی مندل ای نیني مني تدريج در نگام رديابي با تغییرات انطباق يابد.

ای اذیر در زمیننه ، ای رفتDriftingبا توجه به علت ايجاد مخاله ا يری اايداری برقرار كند. انطباق

م كر اكلي اي ر ش اي اسنت كمک كنند. Driftingتواند در لر مخاله نیز مي 67بندی تصا يرقطعه

عنال ه بنر اين زمینه ای ایچیده امنری بخنیار دشنوار اسنت. بندی دقیق در ا كه دستیابي به قطعه

كنافي بنرای رمنر كنردن در شنرايط اقعني مقنا م به قدر تفا ت گ ار مولدر شهای يادگیری آنالي

در چنارچوبي يكوارچنه باشند تنا بنه تفا ت گ ار مولدتواند تركیب ر شهای نیختند. ر شي مناسب مي

ست دست يابیم. چنی تركیبي سوالي كالسنیک در ا تر نخبت به اعمال جداگانه اي ر شهانتايجي مقا م

-برداری مونته كنارلو مني ای جديد در زمینه نمونهبر اي يافته عال هزمینه يادگیری ماشی بوده است.

بنرداری ر شهای نمونهتواند باعث ايجاد ای رفت در تحقیقات در زمینه رديابي با استفاده از تصوير شود.

زمان جختجو را به شدت كا ش د ند در نتیجنه باعنث كنا ش توانند تر ميمونته كارلوی وشمندانه

ت زمینه در تحقیقات بخنیاری در زمیننه درك تصنوير ينديو منورد اطالعاباتي شود. ایچیدگي محاس

اند تا به طور رديابي با با اي جود، تنها در سالهای اذیر اطالعات زمینه توانختهبررسي قرار گرفته است.

68ری انتقنال ای اذیر، ر شهای دگیری مانند ينادگی با جود ای رفتاستفاده از تصوير استفاده شوند.

[، اطالعات زمینه نق ي مهم در آينده تحقیقات زمینه رديابي با استفاده 131[ مدلهای گرافیكي ]130]

از تصوير ذوا د داشت.

67 Image Segmentation

68 Transfer Learning

مناب مراج

32

مراجعمنابع و [1] Yang, H., Shao, L., Zheng, F., Wang, L., & Song, Z. (2011). Recent advances and

trends in visual tracking: A review. Neurocomputing, 74(18), 3823-3831.

[2] Lucas, B. D., & Kanade, T. (1981, August). An iterative image registration technique

with an application to stereo vision. In IJCAI (Vol. 81, pp. 674-679).

[3] Shi, J., & Tomasi, C. (1994, June). Good features to track. In Computer Vision and

Pattern Recognition, 1994. Proceedings CVPR'94., 1994 IEEE Computer Society

Conference on (pp. 593-600). IEEE.

[4] Isard, M., & Blake, A. (1998). A smoothing filter for condensation. In Computer Vision—

ECCV'98 (pp. 767-781). Springer Berlin Heidelberg.

[5] Comaniciu, D., Ramesh, V., & Meer, P. (2000). Real-time tracking of non-rigid objects

using mean shift. In Computer Vision and Pattern Recognition, 2000. Proceedings.

IEEE Conference on (Vol. 2, pp. 142-149). IEEE.

[6] Adam, A., Rivlin, E., & Shimshoni, I. (2006, June). Robust fragments-based tracking using the integral histogram. In Computer vision and pattern recognition, 2006 IEEE Computer Society Conference on (Vol. 1, pp. 798-805). IEEE.

[7] Avidan, S. (2007). Ensemble tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 29(2), 261-271.

[8] Li, Y., Ai, H., Yamashita, T., Lao, S., & Kawade, M. (2008). Tracking in low frame rate video: A cascade particle filter with discriminative observers of different life spans. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 30(10), 1728-1740.

[9] Özuysal, M., Calonder, M., Lepetit, V., & Fua, P. (2010). Fast keypoint recognition using random ferns. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 32(3), 448-461.

[10] Torralba, A. (2003). Contextual priming for object detection. International journal of computer vision, 53(2), 169-191.

[11] Desai, C., Ramanan, D., & Fowlkes, C. C. (2011). Discriminative models for multi-class object layout. International journal of computer vision, 95(1), 1-12.

[12] Matthews, I., Ishikawa, T., & Baker, S. (2004). The template update problem.IEEE Transactions on Pattern Analysis & Machine Intelligence, (6), 810-815.

[13] Matthews, I., Ishikawa, T., & Baker, S. (2004). The template update problem.IEEE Transactions on Pattern Analysis & Machine Intelligence, (6), 810-815.

[14] Dalal, N., & Triggs, B. (2005, June). Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on (Vol. 1, pp. 886-893). IEEE.

مناب مراج

33

[15] Sabzmeydani, P., & Mori, G. (2007, June). Detecting pedestrians by learning shapelet features. In Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on (pp. 1-8). IEEE.

[16] Gavrila, D. M. (2000). Pedestrian detection from a moving vehicle. In Computer Vision—ECCV 2000 (pp. 37-49). Springer Berlin Heidelberg.

[17] Lin, Z., Davis, L. S., Doermann, D., & DeMenthon, D. (2007, October). Hierarchical part-template matching for human detection and segmentation. InComputer Vision, 2007. ICCV 2007. IEEE 11th International Conference on (pp. 1-8). IEEE.

[18] Ferrari, V., Tuytelaars, T., & Van Gool, L. (2006). Object detection by contour segment networks. In Computer Vision–ECCV 2006 (pp. 14-28). Springer Berlin Heidelberg.

[19] Wu, B., & Nevatia, R. (2005, October). Detection of multiple, partially occluded humans in a single image by bayesian combination of edgelet part detectors. InComputer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on(Vol. 1, pp. 90-97). IEEE.

[20] Lowe, D. G. (1999). Object recognition from local scale-invariant features. InComputer vision, 1999. The proceedings of the seventh IEEE international conference on (Vol. 2, pp. 1150-1157). Ieee.

[21] Bay, H., Tuytelaars, T., & Van Gool, L. (2006). Surf: Speeded up robust features. In Computer vision–ECCV 2006 (pp. 404-417). Springer Berlin Heidelberg.

[22] Zhu, Q., Yeh, M. C., Cheng, K. T., & Avidan, S. (2006). Fast human detection using a cascade of histograms of oriented gradients. In Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on (Vol. 2, pp. 1491-1498). IEEE.

[23] Maji, S., Berg, A. C., & Malik, J. (2008, June). Classification using intersection kernel support vector machines is efficient. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[24] Felzenszwalb, P., McAllester, D., & Ramanan, D. (2008, June). A discriminatively trained, multiscale, deformable part model. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[25] Gao, W., Ai, H., & Lao, S. (2009, June). Adaptive contour features in oriented granular space for human detection and segmentation. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 1786-1793). IEEE.

[26] Liu, Y., Shan, S., Zhang, W., Chen, X., & Gao, W. (2009, June). Granularity-tunable gradients partition (GGP) descriptors for human detection. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 1255-1262). IEEE.

[27] Mikolajczyk, K., Schmid, C., & Zisserman, A. (2004). Human detection based on a probabilistic assembly of robust part detectors. In Computer Vision-ECCV 2004 (pp. 69-82). Springer Berlin Heidelberg.

[28] Leibe, B., Seemann, E., & Schiele, B. (2005, June). Pedestrian detection in crowded scenes. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on (Vol. 1, pp. 878-885). IEEE.

[29] Gall, J., & Lempitsky, V. (2013). Class-specific hough forests for object detection. In Decision forests for computer vision and medical image analysis(pp. 143-157). Springer London.

[30] Van de Weijer, J., Gevers, T., & Bagdanov, A. D. (2006). Boosting color saliency in image feature detection. Pattern Analysis and Machine Intelligence, IEEE Transactions

مناب مراج

34

on, 28(1), 150-156.

[31] Gevers, T., Van De Weijer, J., & Stokman, H. (2006). Color feature detection.Color image processing: methods and applications, 9, 203-226.

[32] Abdel-Hakim, A. E., & Farag, A. (2006). CSIFT: A SIFT descriptor with color invariant characteristics. In Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on (Vol. 2, pp. 1978-1983). IEEE.

[33] Burghouts, G. J., & Geusebroek, J. M. (2009). Performance evaluation of local colour invariants. Computer Vision and Image Understanding, 113(1), 48-62.

[34] Fergus, R., Perona, P., & Zisserman, A. (2003, June). Object class recognition by unsupervised scale-invariant learning. In Computer Vision and Pattern Recognition, 2003. Proceedings. 2003 IEEE Computer Society Conference on(Vol. 2, pp. II-264). IEEE.

[35] Shotton, J., Winn, J., Rother, C., & Criminisi, A. (2009). Textonboost for image understanding: Multi-class object recognition and segmentation by jointly modeling texture, layout, and context. International Journal of Computer Vision,81(1), 2-23.

[36] Winn, J., Criminisi, A., & Minka, T. (2005, October). Object categorization by learned universal visual dictionary. In Computer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on (Vol. 2, pp. 1800-1807). IEEE.

[37] Manjunath, B. S., & Ma, W. Y. (1996). Texture features for browsing and retrieval of image data. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 18(8), 837-842.

[38] Ojala, T., Pietikäinen, M., & Mäenpää, T. (2002). Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 24(7), 971-987.

[39] Tan, X., & Triggs, B. (2007). Enhanced local texture feature sets for face recognition under difficult lighting conditions. In Analysis and Modeling of Faces and Gestures (pp. 168-182). Springer Berlin Heidelberg.

[40] Liao, S., Zhu, X., Lei, Z., Zhang, L., & Li, S. Z. (2007). Learning multi-scale block local binary patterns for face recognition. In Advances in Biometrics (pp. 828-837). Springer Berlin Heidelberg.

[41] Zhang, W., Shan, S., Gao, W., Chen, X., & Zhang, H. (2005, October). Local gabor binary pattern histogram sequence (lgbphs): A novel non-statistical model for face representation and recognition. In Computer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on (Vol. 1, pp. 786-791). IEEE.

[42] Mu, Y., Yan, S., Liu, Y., Huang, T., & Zhou, B. (2008, June). Discriminative local binary patterns for human detection in personal album. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[43] Chen, J., Shan, S., He, C., Zhao, G., Pietikäinen, M., Chen, X., & Gao, W. (2010). WLD: A robust local image descriptor. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 32(9), 1705-1720.

[44] Wang, H., Ullah, M. M., Klaser, A., Laptev, I., & Schmid, C. (2009). Evaluation of local spatio-temporal features for action recognition. In BMVC 2009-British Machine Vision Conference (pp. 124-1). BMVA Press.

[45] Ke, Y., Sukthankar, R., & Hebert, M. (2005, October). Efficient visual event detection using volumetric features. In Computer Vision, 2005. ICCV 2005. Tenth IEEE International Conference on (Vol. 1, pp. 166-173). IEEE.

مناب مراج

35

[46] Viola, P., & Jones, M. (2001). Rapid object detection using a boosted cascade of simple features. In Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on (Vol. 1, pp. I-511). IEEE.

[47] Liu, Y., Chen, X., Yao, H., Cui, X., Liu, C., & Gao, W. (2009). Contour-motion feature (CMF): A space–time approach for robust pedestrian detection. Pattern Recognition Letters, 30(2), 148-156.

[48] Willems, G., Tuytelaars, T., & Van Gool, L. (2008). An efficient dense and scale-invariant spatio-temporal interest point detector. In Computer Vision–ECCV 2008 (pp. 650-663). Springer Berlin Heidelberg.

[49] Lindeberg, T. (1998). Feature detection with automatic scale selection.International journal of computer vision, 30(2), 79-116.

[50] Laptev, I., Marszałek, M., Schmid, C., & Rozenfeld, B. (2008, June). Learning realistic human actions from movies. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[51] Scovanner, P., Ali, S., & Shah, M. (2007, September). A 3-dimensional sift descriptor and its application to action recognition. In Proceedings of the 15th international conference on Multimedia (pp. 357-360). ACM.

[52] Klaser, A., Marszałek, M., & Schmid, C. (2008). A spatio-temporal descriptor based on 3d-gradients. In BMVC 2008-19th British Machine Vision Conference(pp. 275-1). British Machine Vision Association.

[53] Shao, L., Gao, R., Liu, Y., & Zhang, H. (2011). Transform based spatio-temporal descriptors for human action recognition. Neurocomputing, 74(6), 962-973.

[54] Zhao, G., & Pietikainen, M. (2007). Dynamic texture recognition using local binary patterns with an application to facial expressions. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 29(6), 915-928.

[55] Tuzel, O., Porikli, F., & Meer, P. (2007, June). Human detection via classification on riemannian manifolds. In Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on (pp. 1-8). IEEE.

[56] Hong, X., Chang, H., Shan, S., Chen, X., & Gao, W. (2009, June). Sigma set: A small second order statistical region descriptor. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 1802-1809). IEEE.

[57] Wu, B., & Nevatia, R. (2008, June). Optimizing discrimination-efficiency tradeoff in integrating heterogeneous local features for object detection. InComputer vision and pattern recognition, 2008. cvpr 2008. IEEE conference on(pp. 1-8). IEEE.

[58] Han, F., Shan, Y., Sawhney, H. S., & Kumar, R. (2008, June). Discovering class specific composite features through discriminative sampling with swendsen-wang cut. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[59] Shao, L., & Ji, L. (2010, July). A descriptor combining MHI and PCOG for human motion classification. In Proceedings of the ACM International Conference on Image and Video Retrieval (pp. 236-242). ACM.

[60] Wang, X., Han, T. X., & Yan, S. (2009, September). An HOG-LBP human detector with partial occlusion handling. In Computer Vision, 2009 IEEE 12th International Conference on (pp. 32-39). IEEE.

[61] Shotton, J., Blake, A., & Cipolla, R. (2008, December). Efficiently Combining Contour and Texture Cues for Object Recognition. In BMVC (pp. 1-10).

مناب مراج

36

[62] Schwartz, W. R., Kembhavi, A., Harwood, D., & Davis, L. S. (2009, September). Human detection using partial least squares analysis. In Computer vision, 2009 IEEE 12th international conference on (pp. 24-31). IEEE.

[63] Alexe, B., Deselaers, T., & Ferrari, V. (2010, June). What is an object?. InComputer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on(pp. 73-80). IEEE.

[64] Kembhavi, A., Siddiquie, B., Miezianko, R., McCloskey, S., Davis, L., Schwartz, W. R., ... & Cisar, P. (2009). Scene it or not? incremental multiple kernel learning for object detection. In Proceedings of the IEEE International Conference on Computer Vision (ICCV).

[65] Bosch, A., Zisserman, A., & Munoz, X. (2007, July). Representing shape with a spatial pyramid kernel. In Proceedings of the 6th ACM international conference on Image and video retrieval (pp. 401-408). ACM.

[66] Berg, A. C., & Malik, J. (2001). Geometric blur for template matching. InComputer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on (Vol. 1, pp. I-607). IEEE.

[67] Shao, L., & Mattivi, R. (2010, July). Feature detector and descriptor evaluation in human action recognition. In Proceedings of the ACM International Conference on Image and Video Retrieval (pp. 477-484). ACM.

[68] Huang, Y., Huang, K., Wang, L., Tao, D., Tan, T., & Li, X. (2008, June). Enhanced biologically inspired model. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[69] Fan, J., Wu, Y., & Dai, S. (2010). Discriminative spatial attention for robust tracking. In Computer Vision–ECCV 2010 (pp. 480-493). Springer Berlin Heidelberg.

[70] Jepson, A. D., Fleet, D. J., & El-Maraghi, T. F. (2003). Robust online appearance models for visual tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 25(10), 1296-1311.

[71] Zhou, S. K., Chellappa, R., & Moghaddam, B. (2004). Visual tracking and recognition using appearance-adaptive models in particle filters. Image Processing, IEEE Transactions on, 13(11), 1491-1506.

[72] Lee, K. C., Ho, J., Yang, M. H., & Kriegman, D. (2005). Visual tracking and recognition using probabilistic appearance manifolds. Computer Vision and Image Understanding, 99(3), 303-331.

[73] Ross, D. A., Lim, J., Lin, R. S., & Yang, M. H. (2008). Incremental learning for robust visual tracking. International Journal of Computer Vision, 77(1-3), 125-141.

[74] Li, X., Hu, W., Zhang, Z., Zhang, X., & Luo, G. (2007, October). Robust visual tracking based on incremental tensor subspace learning. In Computer Vision, 2007. ICCV 2007. IEEE 11th International Conference on (pp. 1-8). IEEE.

[75] Wen, J., Li, X., Gao, X., & Tao, D. (2009, October). Incremental learning of weighted tensor subspace for visual tracking. In Systems, Man and Cybernetics, 2009. SMC 2009. IEEE International Conference on (pp. 3688-3693). IEEE.

[76] Yang, H., Song, Z., & Chen, R. (2010). An incremental PCA-HOG descriptor for robust visual hand tracking. In Advances in Visual Computing (pp. 687-695). Springer Berlin Heidelberg.

[77] Arsigny, V., Fillard, P., Pennec, X., & Ayache, N. (2007). Geometric means in a novel vector space structure on symmetric positive-definite matrices. SIAM journal on matrix analysis and applications, 29(1), 328-347.

مناب مراج

37

[78] Li, X., Hu, W., Zhang, Z., Zhang, X., Zhu, M., & Cheng, J. (2008, June). Visual tracking via incremental log-euclidean riemannian subspace learning. InComputer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[79] Wu, Y., Cheng, J., Wang, J., & Lu, H. (2009, September). Real-time visual tracking via incremental covariance tensor learning. In Computer Vision, 2009 IEEE 12th International Conference on (pp. 1631-1638). IEEE.

[80] Collins, R. T., Liu, Y., & Leordeanu, M. (2005). Online selection of discriminative tracking features. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 27(10), 1631-1643.

[81] Avidan, S. (2007). Ensemble tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 29(2), 261-271.

[82] Wang, J., Chen, X., & Gao, W. (2005, June). Online selecting discriminative tracking features using particle filter. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on (Vol. 2, pp. 1037-1042). IEEE.

[83] Li, G., Liang, D., Huang, Q., Jiang, S., & Gao, W. (2008, October). Object tracking using incremental 2D-LDA learning and Bayes inference. In Image Processing, 2008. ICIP 2008. 15th IEEE International Conference on (pp. 1568-1571). IEEE.

[84] Zhang, X., Hu, W., Maybank, S., & Li, X. (2007, October). Graph based discriminative learning for robust and efficient object tracking. In Computer Vision, 2007. ICCV 2007. IEEE 11th International Conference on (pp. 1-8). IEEE.

[85] Tian, M., Zhang, W., & Liu, F. (2007). On-line ensemble SVM for robust object tracking. In Computer Vision–ACCV 2007 (pp. 355-364). Springer Berlin Heidelberg.

[86] Yang, M., Yuan, J., & Wu, Y. (2007, June). Spatial selection for attentional visual tracking. In Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on (pp. 1-8). IEEE.

[87] Grabner, H., & Bischof, H. (2006, June). On-line boosting and vision. InComputer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on (Vol. 1, pp. 260-267). IEEE.

[88] Grabner, H., Grabner, M., & Bischof, H. (2006, September). Real-Time Tracking via On-line Boosting. In BMVC (Vol. 1, No. 5, p. 6).

[89] Saffari, A., Leistner, C., Santner, J., Godec, M., & Bischof, H. (2009, September). On-line random forests. In Computer Vision Workshops (ICCV Workshops), 2009 IEEE 12th International Conference on (pp. 1393-1400). IEEE.

[90] Wang, M., Hua, X. S., Tang, J., & Hong, R. (2009). Beyond distance measurement: constructing neighborhood similarity for video annotation.Multimedia, IEEE Transactions on, 11(3), 465-476.

[91] Wang, M., Hua, X. S., Hong, R., Tang, J., Qi, G. J., & Song, Y. (2009). Unified video annotation via multigraph learning. Circuits and Systems for Video Technology, IEEE Transactions on, 19(5), 733-746.

[92] Grabner, H., Leistner, C., & Bischof, H. (2008). Semi-supervised on-line boosting for robust tracking. In Computer Vision–ECCV 2008 (pp. 234-247). Springer Berlin Heidelberg.

[93] Babenko, B., Yang, M. H., & Belongie, S. (2009, June). Visual tracking with online multiple instance learning. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 983-990). IEEE.

مناب مراج

38

[94] Zeisl, B., Leistner, C., Saffari, A., & Bischof, H. (2010, June). On-line semi-supervised multiple-instance boosting. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on (pp. 1879-1879). IEEE.

[95] Santner, J., Leistner, C., Saffari, A., Pock, T., & Bischof, H. (2010, June). Prost: Parallel robust online simple tracking. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on (pp. 723-730). IEEE.

[96] Werlberger, M., Trobin, W., Pock, T., Wedel, A., Cremers, D., & Bischof, H. (2009, September). Anisotropic Huber-L1 Optical Flow. In BMVC (Vol. 1, No. 2, p. 3).

[97] Li, Y., Ai, H., Yamashita, T., Lao, S., & Kawade, M. (2008). Tracking in low frame rate video: A cascade particle filter with discriminative observers of different life spans. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 30(10), 1728-1740.

[98] Breitenstein, M. D., Reichlin, F., Leibe, B., Koller-Meier, E., & Van Gool, L. (2009, September). Robust tracking-by-detection using a detector confidence particle filter. In Computer Vision, 2009 IEEE 12th International Conference on(pp. 1515-1522). IEEE.

[99] Aeschliman, C., Park, J., & Kak, A. C. (2010, June). A probabilistic framework for joint segmentation and tracking. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on (pp. 1371-1378). IEEE.

[100] Yin, Z., & Collins, R. T. (2009, June). Shape constrained figure-ground segmentation and tracking. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 731-738). IEEE.

[101] Zhang, L., Li, Y., & Nevatia, R. (2008, June). Global data association for multi-object tracking using network flows. In Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on (pp. 1-8). IEEE.

[102] Li, Y., Huang, C., & Nevatia, R. (2009, June). Learning to associate: Hybridboosted multi-target tracker for crowded scene. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 2953-2960). IEEE.

[103] Huang, C., Wu, B., & Nevatia, R. (2008). Robust object tracking by hierarchical association of detection responses. In Computer Vision–ECCV 2008 (pp. 788-801). Springer Berlin Heidelberg.

[104] Woodley, T., Stenger, B., & Cipolla, R. (2007, September). Tracking Using Online Feature Selection and a Local Generative Model. In BMVC (pp. 1-10).

[105] Grabner, H., Roth, P. M., & Bischof, H. (2007, June). Eigenboosting: Combining discriminative and generative information. In Computer Vision and Pattern Recognition, 2007. CVPR'07. IEEE Conference on (pp. 1-8). IEEE.

[106] Yang, M., Wu, Y., & Lao, S. (2006, June). Intelligent collaborative tracking by mining auxiliary objects. In Computer Vision and Pattern Recognition, 2006 IEEE Computer Society Conference on (Vol. 1, pp. 697-704). IEEE.

[107] Li, Y., & Nevatia, R. (2008, October). Key Object Driven Multi-category Object Recognition, Localization and Tracking Using Spatio-temporal Context. InECCV (4) (pp. 409-422).

[108] Stalder, S., Grabner, H., & Van Gool, L. (2010). Cascaded confidence filtering for improved tracking-by-detection. In Computer Vision–ECCV 2010 (pp. 369-382). Springer Berlin Heidelberg.

مناب مراج

39

[109] Roth, P. M., Sternig, S., Grabner, H., & Bischof, H. (2009, June). Classifier grids for robust adaptive object detection. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 2727-2734). IEEE.

[110] Grabner, H., Matas, J., Van Gool, L., & Cattin, P. (2010, June). Tracking the invisible: Learning where the object might be. In Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on (pp. 1285-1292). IEEE.

[111] Kalal, Z., Matas, J., & Mikolajczyk, K. (2009, September). Online learning of robust object detectors during unstable tracking. In Computer Vision Workshops (ICCV Workshops), 2009 IEEE 12th International Conference on(pp. 1417-1424). IEEE.

[112] Kalal, Z., Mikolajczyk, K., & Matas, J. (2010, August). Forward-backward error: Automatic detection of tracking failures. In Pattern Recognition (ICPR), 2010 20th International Conference on (pp. 2756-2759). IEEE.

[113] Divvala, S. K., Hoiem, D., Hays, J. H., Efros, A., & Hebert, M. (2009, June). An empirical study of context in object detection. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 1271-1278). IEEE.

[114] Bar-Shalom, Y., Fortmann, T. E., & Tracking and Data Association. (2005). Academic Press, 1988. SV= 0.0001 SV= 0.01 SV, 1.

[115] Li, P., Zhang, T., & Ma, B. (2004). Unscented Kalman filter for visual curve tracking. Image and vision computing, 22(2), 157-164.

[116] Smith, K., Gatica-Perez, D., & Odobez, J. M. (2005, June). Using particles to track varying numbers of interacting people. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on (Vol. 1, pp. 962-969). IEEE.

[117] Khan, Z., Balch, T., & Dellaert, F. (2005). MCMC-based particle filtering for tracking a variable number of interacting targets. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 27(11), 1805-1819.

[118] Zhang, X., Hu, W., Zhao, Z., Wang, Y. G., Li, X., & Wei, Q. (2008, December). SVD based Kalman particle filter for robust visual tracking. In Pattern Recognition, 2008. ICPR 2008. 19th International Conference on (pp. 1-4). IEEE.

[119] McKenna, S. J., & Nait-Charif, H. (2007). Tracking human motion using auxiliary particle filters and iterated likelihood weighting. Image and Vision Computing, 25(6), 852-862.

[120] Zhang, X. (2009). X., Hu, W., ve Maybank S.," A Smarter Particle Filter", LNCS. Computer Vision-ACCV, 5995, 236-246.

[121] Kwon, J., Lee, K. M., & Park, F. C. (2009, June). Visual tracking via geometric particle filtering on the affine group with optimal importance functions. InComputer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 991-998). IEEE.

[122] Schindler, G., & Dellaert, F. (2007). A rao-blackwellized parts-constellation tracker. In Dynamical Vision (pp. 178-189). Springer Berlin Heidelberg.

[123] Kwon, J., & Lee, K. M. (2008). Tracking of abrupt motion using Wang-Landau Monte Carlo estimation. In Computer Vision–ECCV 2008 (pp. 387-400). Springer Berlin Heidelberg.

[124] Kwon, J., & Lee, K. M. (2009, June). Tracking of a non-rigid object via patch-based dynamic appearance modeling and adaptive basin hopping monte carlo sampling. In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on (pp. 1208-1215). IEEE.

مناب مراج

40

[125] Kwon, J., & Lee, K. M. (2010, June). Visual tracking decomposition. InComputer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on(pp. 1269-1276). IEEE.

[126] Liu, J. S. (2008). Monte Carlo strategies in scientific computing. Springer Science & Business Media.

[127] Viola, P., & Jones, M. (2001). Robust real-time object detection. International Journal of Computer Vision, 4, 51-52.

[128] Vedaldi, A., Gulshan, V., Varma, M., & Zisserman, A. (2009, September). Multiple kernels for object detection. In Computer Vision, 2009 IEEE 12th International Conference on (pp. 606-613). IEEE.

[129] Lampert, C. H., Blaschko, M. B., & Hofmann, T. (2009). Efficient subwindow search: A branch and bound framework for object localization. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 31(12), 2129-2142.

[130] Pan, S. J., & Yang, Q. (2010). A survey on transfer learning. Knowledge and Data Engineering, IEEE Transactions on, 22(10), 1345-1359.

[131] Koller, D., & Friedman, N. (2009). Probabilistic graphical models: principles and techniques. MIT press.

[132]

[133]

[134]

[135]

[136]

[137]