به بررسی روش دوم میپردازیم .در این روش مبحث اصلیمون را از یه دید دیگه شروع به بررسی میکنیم : روش حداقل مربعات ! (اگه احیانا مثه خودم اوایل با اون آشنایی ندارید میتونید به کتابهایی که در مورد محاسبات عددی بحث میکنن رجوع کنید ) خوب ! بهتره شروع کنیم :
توجه : در این روش فرض میشه که ذاتا فلو در همسایگی محلی پیکسل های تحت محاسبه ثابت است و به وسیله least squares criterion مسئله پایه فلو را در همسایگی حل میکنیم .در ضمن این روش چون فرض بالا رو داره نسبت به نویز حساسیت کمتری داره.
یه بار دیگه معادله فلو را در نظر بگیرید
اگر ما این معادله را برای یه پنجره بنویسیم (منظورم پنجره حاصل از پیکسلهاست) به صورت زیر میشه :
هدف اینه که حاصل این معادله رو کمینه کنیم :
در اینجا برای اینکه درکی از ساختن و کار کردن با معادله داسته باشیم من ماتریس A رو 2*2 فرض کردم :
در ادامه ما میخواهیم که ماتریس زیر دارای وارون باشد ( که بتونیم با اطمینان داخل مستطیل زرده رو در بالا بیاریم) یا به عبارت دیگه مقدار ویژه ماتریس صفر نشه (eigenvalue)
خوب حالا این مقدار ویژه رو در سه ناحیه ای که ممکنه وجود داشته باشه بررسی میکنیم :
1- در لبه ها :
حاصل ضرب فوق مقدار ویژه یکتا داره ، به شکل زیر دقت کنید :
که در اون(-Iy,Ix)
بردار ویژه با مقدار ویژه صفر است.
2- در پیکسل های همجنس و یکجور و موافق (homogeneous)
حاصلضرب تقریبا صفره و مقادیر ویژه صفر رو میده
3- در نواحی بافت (textured regions)
که نتیجه گیری ساده از سه مورد فوق اینکه : در دو مورد اول ما از نتیجه حاصل شده راضی نیستیم ولی در مورد سوم هستیم )
پس ما تا اینجا دو مورد از break down مون رو فهمیدیم سه مورد دیگه هم به اونها اضافه میکنم :
4- اگه پایداری روشنایی مورد رضایت نباشه (Brightness constancy)
5- اگه یه پیکسل مثه دیگر نقاط همسایش حرکت نکنه (در اینجا اینکه اندازه مناسب پنجره چقدره، پیش میاد)
6-اگه حرکت کوچیک نباشه ( یعنی بسط تیلور رو نشه استفاده کرد)
در مورد اول راهکاری که میتونیم بکار بگیریم Correlation based method است
در مورد دوم راهکار مناسب Regularization based method است و در مورد آخر هم Use multi scale estimate است
در ادامه به اینکه multi scale estimation چیه یکم بحث میکنیم
کلا یه بحثی هست در مورد multi scale flow estimation که با ابزاری توسط هرم های پیاده سازی میشن .بهتره اول بفهمیم هرم در پردازش عکس چیه ؟؟!!
من مختصری در مورد هرم های توضیح میدم بعد میریم سراغ هرم هایی که باهاشون کار داریم یعنی هرم لاپلاس و هرم گوسی .
Pyramid or Pyramid representation یه نوع نمایش multi-scale سیگنال است که توسط زمینه هایی چون image processing و computer vision و signal processing توسعه داده شده، و مواقعی بکار گرفته میشه که یک عکس یا سیگنال به تکرار مورد عمل smoothing و subsampling قرار میگیره (در حقیقت هرم یک رویه برای نمایش scale space و آنالیز multiresolution است) ودر مورد تقسیم بندی هرم ، میتونیم بگیم که دو نوع هرم داریم : هرم پایین گذر و هرم بالا گذر(lowpass pyramids & bandpass pyramid)
هرم پایین گذر : این هرم بوسیله یک هموار( smoothing) کننده عکس با یک فیلتر هموار سازی مناسب و سپس subsampling کردن اون عکس هموار شده ، انجام میشه و در نهایت حاصل این اعمال برای محاسبات استفاده میشه .طی تکرار این روش نتایج به این صورت خواهد بود که در هر مرحله عکس های هموار شده نسبت به مرحله قبل هموار تر میشوند و از لحاظ شکلی این نمایش multi-scale شبیه یه هرم میشه .
خوب فکر کنم که دیگه بیشتراز این لازم نباشه که ببنیم چیه !
Gaussian-Laplacian Pyramid Image Coding
به صورت چندتا نکته این رو بررسی میکنیم :
مرحله (Down-sampling)
1.برای مرحله جدید کانولوشن با یک فیلتر گوسین بالا گذر انجام میدیم-
2.تفاوت عکسها(band-pass)
توجه داریم که پارامتر h تفاوت بین دو عکس است .
3. Down-sampling f’l+1
4.تمامی عکسها را میتوان توسط هرم لاپلاس بدست آورد(هرم لاپلاس اولین بار توسط burt & adelson برای فشرده سازی عکسها آورده شد.)
مرحله (up-sampling)
1.متقاطع کردن صفرها(سطر و ستون)
2.کانولوشن کردن با یک فیلتر گوسین پایین گذر
بطور کلی اگه بخواهیم که بصورت دیاگرامی آنچه گفته شد را نمایش بدیم به صورت زیر میشود
در مورد هرم لاپلاس هم این عکس کمکی برای درک عملی اون دار
و اما یه کم بیشتر در مورد هرم لاپلاس :
بعد از این عمل تنها یک نمونه از دو نمونه باقی میمونه که در اون تعداد پیکسل ها از طریق دو ویژگی های دو نمونه در هر scaling کاهش پیدا میکنه.برای این عمل کانولوشنی با h داریم که از طریقه اون عمل فوق انجام میشه :
برای درک بهتر به نمونه زیر دقت کنید
که در اون گذر C0 به C1 نمایش داده شده است.و برای باز سازی Cjاز Cj+1 عمل زیر را انجام میدهیم:
و برای درک اینهم به شکل زیر دقت کنید تا گذر C1 به C0 را مشاهده کنید :
که این عمل در فضای دو بعدی همان تعریف بالا را دارد با این تفاوت که ،باز هدف کشیدن یک نمونه از دو نمونه است ولی اینبار در دو جهت !!!! یعنی کانولوشن به فرم زیر در میآید :
و فرم بازگشت هم به صورت زیر میشود :
به طور کلی تعداد نمونه ها بر4 تقسیم میشه ، به طوری که اگه ما یه عکس N*N داشته باشیم آنگاه اندازه هرم 4/3N^2 میشه .در شکل زیر هم مراحل هرم رو میبینیم :
خوب ، پس یه دید کلی هم در مورد هرم های پیدا کردیم .
در حقیقت آقایان lucas , kanade ترجیح دادن قبل از اعمال معادله محدودیت گرادیان یک pre-smooth داشته باشن روی عکهاشون!!
که اگه بخواهیم تمامی حرفهایی که زده شد رو به صورت فرمولی بیان کنیم به صورت زیر خواهد شد :
که در اون W(x) یه قابیه (پنجره اییه )که هر چه به مرکز پنجره نزدیکتر میشیم بیشتر تحت تاثیر مرکز همسایگیه Ω قرار میگیره.که اگه بخواهیم دوباره به معرفی پارامترهای این معادله بپردازیم :
در ضمن قابل توجه که نکته مفید قابل ذکر در روش فوق نسبت به روش هورن اینه که در این روش از حضور یک اندازه ضریب استفاده میکنیم.و کمترین مقداری که eigenvalue ماتریس زیر به خودش میگیره (λ) یه معیار اندازه گیری برای تعیین normal vilocity از سرعت دو بعدی است .
در مقاله آقای Barron گزارش شده که این روش طبق نتایجی که داده به عنوان دومین روش مناسب برای تشخیش optic flow است.
به علت دقتی که ما از روشها انتظار داریم ، تحقیقات در جهت کاهش اثر هموار کردن در نواحیی که دارای گرادیان شدت روشنایی تیزی(شیب دار) هستند ادامه داره .آقایان Nagel , Enkelmann و اولین کسایی بودند که در جهت جهت بندی هموارسازی (oriented smoothness constraint) و فرموله کردن روششون تلاش کردن که این موضوع روش سوم ماست!!!!
خوب حالا یه کم! در مورد فیلترهای گوسی بحث کنیم (که در بالا از آنها استفاده کردیم )
فیلترپایین گذر گوسی برای کاهش اثر خطوط ،کاهش دادن جزئیات تصویر(کدر شدن تصویر) ، و کلا به عنوان یک پیش پردازش در تحلیل عکس هایی که دارای جزییات زیادی هستند مورد استفاده قرار میگیره (البته در این فیلتر باید با توجه فرکانس قطع فیلتر کار کنیم !)و یه کاربرد عملی هم در OCR هاست!
و فیلتر بالا گذر برای افزایش جزییات تصویر مورد استفاده قرار میگیره
در مورد اینکه این در فیلتر توسط چه فرمولهای ریاضی تعریف میشوند میتونید به کتاب گنزالز(digital image processing ) مراجعه کنید.
منابع : Performance of Optic Flow Techniques(J.L.Barron…)