آموزش پردازش تصویر با پایتون توسط OpenCV

۰۴ اردیبهشت ۱۴۰۰

کتابخانه OpenCV چیست؟ ( معرفی + کاربردها)

۰۲ مرداد ۱۴۰۰

منتشر شده توسط محمد کیانی در ۱۵ اردیبهشت ۱۴۰۰

موضوعات

پردازش تصویر

برچسب‌ها

فهرست محتوا

مبانی پردازش تصویر دیجیتال

پردازش تصویر دیجیتال چیست؟

پردازش تصویر دیجیتال به معنای پردازش دیجیتالی تصویر توسط کامپیوتر دیجیتال است. ما می‌توانیم بگوییم این امر، همچنین استفاده از الگوریتم‌های کامپیوتری به‌منظور استخراج اطلاعات مفید از تصویر تقویت‌شده است.

پردازش تصویر اصولاً شامل گام‌های زیر می‌شود:

۱.گرفتن تصویر توسط ابزارهای دریافت تصویر (acquisition)

۲.آنالیز و دست‌کاری تصویر

۳.خروجی بر اساس تصویر و یا ارائه گزارش بر اساس آنالیز تصویر

تصویر چیست؟

تصویر توسط تابع دوبعدی F(x,y) تعریف می‌شود. x و y مختصات فضایی و F دامنه مختصات (x,y) است که شدت روشنایی تصویر در آن نقطه نامیده می‌شود. زمانی که x و y و مقادیر دامنه F محدود باشند؛ ما تصویر را دیجیتال می‌نامیم.

در بیان دیگر، تصویری که بتوان در آرایه دوبعدی با سطر و ستون‌های منظم تعریف نمود؛ تصویر دیجیتال است.

تصویر دیجیتال متشکل از تعداد محدودی از اعضا است. هرکدام از المان‌ها دارای مقدار خاصی در موقعیت خاص خود هستند. این المان‌ها با عنوان المان‌های تصویر و پیکسل شناخته می‌شوند. عبارت پیکسل به‌طور گسترده برای نام‌گذاری تصویر دیجیتال مورداستفاده قرار می‌گیرد.

انواع مختلف تصویر

۱.تصویر باینری: تصویر باینری همان‌طور که نامش بیان می‌کند. شامل تنها دو المان (المان‌های صفر و یک) پیکسل است. درحالی‌که صفر، نشان‌دهنده مشکی و یک نشان‌دهنده سفید است. این نوع از تصویر همچنین به‌عنوان سیاه‌وسفید (منوکروم) شناخته می‌شود.

۳.تصویر سیاه‌وسفید: تصویری که تنها شامل رنگ سیاه‌وسفید باشد؛ تصویر سیاه‌وسفید شناخته می‌شود.

۳. فرمت رنگ ۸ بیت: این فرمت مشهورترین فرمت تصویر است. این فرمت دارای ۲۵۶ سطح از شدت روشنایی است و به‌صورت معمول به‌عنوان تصویر مقیاس خاکستری (grayscale) شناخته می‌شود. در این فرمت ۰ نشان‌دهنده مشکی و ۲۵۵ نشان‌دهنده سفید است. مقدار ۱۲۷ نیز نشان‌گر خاکستری است.

۴.فرمت رنگ ۱۶ بیت: این فرمت معمول تصاویر رنگی است. این فرمت دارای ۶۵۵۳۶ سطح مختلف رنگ درون خود است. فرمت ۱۶ بیتی همچنین به‌عنوان High Color Format شناخته می‌شود. در این فرمت، توزیع رنگ مشابه مقیاس خاکستری نیست.

فرمت ۱۶ بیتی در اصل تصویر را به سه فرمت بیشتر از کانال‌های آبی، قرمز و سبز تقسیم کرده است. همان فرمت معروف RGB!

تصویر به‌عنوان یک ماتریس

همان‌طور که می‌دانیم تصاویر در سطرها و ستون‌ها تعریف‌شده‌اند. پس ما با سینتکس زیر روبرو هستیم:

سمت راست این معادله همان تصویر است. هر کدام از المان‌های این ماتریس، المان تصویر و یا پیکسل نامیده می‌شوند.

نحوه ارائه تصویر دیجیتال در MATLAB

در Matlab نقطه آغازین بجای ۰ برابر با ۱ است. بنابراین f(1,1) = f(0,0)است. ارائه تصویر در هر دو مورد به‌جز نقطه مبدأ یکسان است.

ماتریس‌ها در MATLAB در متغیری ذخیره می‌شوند. نام متغیرها همانند دیگر زبان‌های برنامه‌نویسی باید شامل حروف باشد.

فازهای پردازش تصویر:

۱.دریافت (Acquisition): این امر شامل دریافت تصویر در فرمت دیجیتال است. بخش اصلی شامل موارد زیر می‌شود:

آ) مقیاس

ب) تبدیل رنگ (RGB به خاکستری و یا بالعکس)

۲.بهبود تصویر: این امر ساده‌ترین و پرکاربردترین عمل در پردازش تصویر است که می‌تواند داده‌های پنهان در تصویر و هدف را مشخص کند.

۳.ترمیم تصویر (Restoration): این کار نیز در پردازش تصویر شایع است و به‌صورت هدفمند صورت می‌پذیرد. ترمیم بر اساس مدل‌های ریاضی و یا احتمالات یا تنزل تصویر است.

۴. پردازش تصویر رنگی: این فاز با پردازش تصویر تمام و یا تک‌رنگ مواجه است که به پردازش تصاویر دیجیتال رنگی منتهی می‌شود.

۵.پردازش موجک و رزولوشن چندگانه: مبنای این نوع از پردازش باز ارائه تصاویر در زاویه‌های چرخش مختلف است.

۶.فشرده‌سازی تصویر: این امر با طراحی و اجرای توابعی سروکار دارد که تمرکز اصلی آن‌ها بر روی رزولوشن و اندازه تصویر است.

۷. پردازش ریخت‌شناسی: ریخت‌شناسی با ابزارهایی درگیر است که برای جداسازی و تشخیص اجزای تصویر مورداستفاده قرار می‌گیرند. ریخت‌شناسی می‌تواند توضیحات و باز ارائه‌ای از شکل به ما ارائه کند.

۸.فرآیند قطعه‌بندی (segmentation): قطعه‌بندی شامل قسمت‌بندی تصویر به قطعات و یا اشیا است. قطعه‌بندی خودکار یکی از مشکل‌ترین امور در پردازش تصویر است.

۹.باز ارائه و توضیح: این قسمت پیرو مرحله قطعه‌بندی است. باز ارائه تنها قسمتی از راهکار است که داده خام را به اطلاعات پردازش‌شده تبدیل می‌کند.

۱۰. تشخیص و شناسایی اشیا: این فرآیند شامل تخصیص برچسب به شی‌ء بر اساس توضیحات مشخص‌شده است.

حوزه‌های هم پوش در پردازش تصویر

طبق بلوک ۱: اگر ورودی ما تصویر باشد و خروجی نیز تصویر باشد. پس ما در حوزه پردازش تصویر دیجیتال هستیم.

طبق بلوک ۲: اگر ورودی ما تصویر باشد و خروجی نوعی از اطلاعات یا توضیحات باشد. پس ما در حوزه بینایی کامپیوتر هستیم.

طبق بلوک ۳: اگر ورودی ما توضیحات و یا کد باشد و در خروجی دارای تصویر باشیم. پس در حوزه گرافیک کامپیوتری قرار داریم.

طبق بلوک ۴: اگر ورودی توضیحات یا کلمات کلیدی و یا کد باشد و خروجی ما شامل توضیح و یا کلمات کلیدی باشد. پس ما در حوزه هوش مصنوعی هستیم!

منبع:

Digital Image Processing (Rafael c. gonzalez)

اگر خواهان کسب اطلاعات بیشتر درباره پردازش تصویر هستید. مقاله پردازش تصویر چیست؟ را از دست ندهید.

سؤالات متدوال

1تفاوت اصلی بین پردازش تصویر، بینایی کامپیوتر و گرافیک کامپیوتری چیست؟

پردازش تصویر: ورودی و خروجی هر دو تصویر هستند (مثل بهبود کیفیت).
بینایی کامپیوتر: ورودی تصویر، خروجی اطلاعات یا توصیف (مثل تشخیص چهره).
گرافیک کامپیوتری: ورودی توصیف یا کد، خروجی تصویر (مثل ساخت صحنه سه‌بعدی).

2تصویر دیجیتال چگونه در کامپیوتر ذخیره و نمایش داده می‌شود؟

تصویر دیجیتال به صورت یک ماتریس دوبعدی شامل اعداد صحیح ذخیره می‌شود. هر عضو ماتریس یک پیکسل نام دارد که مقدار آن شدت روشنایی (در تصویر خاکستری ۰ تا ۲۵۵) یا ترکیب رنگ (RGB) را نشان می‌دهد.

3چرا در متلب (MATLAB) اندیس پیکسل‌ها از ۱ شروع می‌شود نه ۰؟

در متلب، برخلاف بسیاری از زبان‌ها و تعاریف ریاضی، اولین اندیس آرایه‌ها ۱ است. بنابراین f(1,1) معادل f(0,0) در فرمول استاندارد تصویر است. این یک قرارداد خاص در متلب برای سادگی کار با ماتریس‌هاست.

4کاربرد اصلی فشرده‌سازی تصویر در پردازش دیجیتال چیست؟

کاهش حجم تصویر برای ذخیره‌سازی کمتر و انتقال سریع‌تر در شبکه‌ها و اینترنت، بدون افت محسوس کیفیت (مثل فرمت JPEG) یا با افت کنترل‌شده بر اساس رزولوشن.

5چرا قطعه‌بندی (Segmentation) یکی از چالش‌برانگیزترین مراحل پردازش تصویر است؟

زیرا تشخیص خودکار مرز دقیق اشیا در تصاویر واقعی (با نور غیریکنواخت، نویز، سایه و هم‌پوشانی اشیا) به سادگی امکان‌پذیر نیست و نیاز به الگوریتم‌های پیشرفته یادگیری ماشین دارد.

6فرق تصویر باینری با تصویر مقیاس خاکستری چیست؟

باینری: هر پیکسل فقط ۰ (سیاه) یا ۱ (سفید) است.
خاکستری ۸ بیتی: هر پیکسل ۲۵۶ سطح از سیاه (۰) تا سفید (۲۵۵) دارد که شامل سایه‌های مختلف خاکستری می‌شود.

7پردازش ریخت‌شناسی (Morphological Processing) چه کاری روی تصویر انجام می‌دهد؟

با استفاده از عملیات‌هایی مثل تورم (Dilation) و فرسایش (Erosion)، شکل اشیا در تصویر تحلیل، ساده یا جداسازی می‌شود. کاربردها: حذف نویز، تشخیص لبه، پر کردن حفره‌ها.

8بهترین منبع برای یادگیری مبانی پردازش تصویر چیست؟

کتاب "Digital Image Processing" نوشته Rafael C. Gonzalez و Richard E. Woods (مرجع اصلی بسیاری از دوره‌های دانشگاهی) به همراه تمرین با نرم‌افزار متلب و پایتون (کتابخانه OpenCV).

مبانی پردازش تصویر دیجیتال

آموزش پردازش تصویر با پایتون توسط OpenCV

کتابخانه OpenCV چیست؟ ( معرفی + کاربردها)

مبانی پردازش تصویر دیجیتال

پردازش تصویر دیجیتال چیست؟

تصویر چیست؟

انواع مختلف تصویر

تصویر به‌عنوان یک ماتریس

نحوه ارائه تصویر دیجیتال در MATLAB

فازهای پردازش تصویر:

حوزه‌های هم پوش در پردازش تصویر

منبع:

سؤالات متدوال

محمد کیانی

مطالب مرتبط

پردازش تصویر چیست؟ آشنایی با مفاهیم، کتابخانه‌ها و کاربردها

دیدگاهتان را بنویسید لغو پاسخ