

فهرست محتوا
Toggleپردازش تصویر دیجیتال به معنای پردازش دیجیتالی تصویر توسط کامپیوتر دیجیتال است. ما میتوانیم بگوییم این امر، همچنین استفاده از الگوریتمهای کامپیوتری بهمنظور استخراج اطلاعات مفید از تصویر تقویتشده است.
پردازش تصویر اصولاً شامل گامهای زیر میشود:
۱.گرفتن تصویر توسط ابزارهای دریافت تصویر (acquisition)
۲.آنالیز و دستکاری تصویر
۳.خروجی بر اساس تصویر و یا ارائه گزارش بر اساس آنالیز تصویر
تصویر توسط تابع دوبعدی F(x,y) تعریف میشود. x و y مختصات فضایی و F دامنه مختصات (x,y) است که شدت روشنایی تصویر در آن نقطه نامیده میشود. زمانی که x و y و مقادیر دامنه F محدود باشند؛ ما تصویر را دیجیتال مینامیم.
در بیان دیگر، تصویری که بتوان در آرایه دوبعدی با سطر و ستونهای منظم تعریف نمود؛ تصویر دیجیتال است.
تصویر دیجیتال متشکل از تعداد محدودی از اعضا است. هرکدام از المانها دارای مقدار خاصی در موقعیت خاص خود هستند. این المانها با عنوان المانهای تصویر و پیکسل شناخته میشوند. عبارت پیکسل بهطور گسترده برای نامگذاری تصویر دیجیتال مورداستفاده قرار میگیرد.
۱.تصویر باینری: تصویر باینری همانطور که نامش بیان میکند. شامل تنها دو المان (المانهای صفر و یک) پیکسل است. درحالیکه صفر، نشاندهنده مشکی و یک نشاندهنده سفید است. این نوع از تصویر همچنین بهعنوان سیاهوسفید (منوکروم) شناخته میشود.
۳.تصویر سیاهوسفید: تصویری که تنها شامل رنگ سیاهوسفید باشد؛ تصویر سیاهوسفید شناخته میشود.
۳. فرمت رنگ ۸ بیت: این فرمت مشهورترین فرمت تصویر است. این فرمت دارای ۲۵۶ سطح از شدت روشنایی است و بهصورت معمول بهعنوان تصویر مقیاس خاکستری (grayscale) شناخته میشود. در این فرمت ۰ نشاندهنده مشکی و ۲۵۵ نشاندهنده سفید است. مقدار ۱۲۷ نیز نشانگر خاکستری است.
۴.فرمت رنگ ۱۶ بیت: این فرمت معمول تصاویر رنگی است. این فرمت دارای ۶۵۵۳۶ سطح مختلف رنگ درون خود است. فرمت ۱۶ بیتی همچنین بهعنوان High Color Format شناخته میشود. در این فرمت، توزیع رنگ مشابه مقیاس خاکستری نیست.
فرمت ۱۶ بیتی در اصل تصویر را به سه فرمت بیشتر از کانالهای آبی، قرمز و سبز تقسیم کرده است. همان فرمت معروف RGB!
همانطور که میدانیم تصاویر در سطرها و ستونها تعریفشدهاند. پس ما با سینتکس زیر روبرو هستیم:

سمت راست این معادله همان تصویر است. هر کدام از المانهای این ماتریس، المان تصویر و یا پیکسل نامیده میشوند.

در Matlab نقطه آغازین بجای ۰ برابر با ۱ است. بنابراین f(1,1) = f(0,0)است. ارائه تصویر در هر دو مورد بهجز نقطه مبدأ یکسان است.
ماتریسها در MATLAB در متغیری ذخیره میشوند. نام متغیرها همانند دیگر زبانهای برنامهنویسی باید شامل حروف باشد.
۱.دریافت (Acquisition): این امر شامل دریافت تصویر در فرمت دیجیتال است. بخش اصلی شامل موارد زیر میشود:
آ) مقیاس
ب) تبدیل رنگ (RGB به خاکستری و یا بالعکس)
۲.بهبود تصویر: این امر سادهترین و پرکاربردترین عمل در پردازش تصویر است که میتواند دادههای پنهان در تصویر و هدف را مشخص کند.
۳.ترمیم تصویر (Restoration): این کار نیز در پردازش تصویر شایع است و بهصورت هدفمند صورت میپذیرد. ترمیم بر اساس مدلهای ریاضی و یا احتمالات یا تنزل تصویر است.
۴. پردازش تصویر رنگی: این فاز با پردازش تصویر تمام و یا تکرنگ مواجه است که به پردازش تصاویر دیجیتال رنگی منتهی میشود.
۵.پردازش موجک و رزولوشن چندگانه: مبنای این نوع از پردازش باز ارائه تصاویر در زاویههای چرخش مختلف است.
۶.فشردهسازی تصویر: این امر با طراحی و اجرای توابعی سروکار دارد که تمرکز اصلی آنها بر روی رزولوشن و اندازه تصویر است.
۷. پردازش ریختشناسی: ریختشناسی با ابزارهایی درگیر است که برای جداسازی و تشخیص اجزای تصویر مورداستفاده قرار میگیرند. ریختشناسی میتواند توضیحات و باز ارائهای از شکل به ما ارائه کند.
۸.فرآیند قطعهبندی (segmentation): قطعهبندی شامل قسمتبندی تصویر به قطعات و یا اشیا است. قطعهبندی خودکار یکی از مشکلترین امور در پردازش تصویر است.
۹.باز ارائه و توضیح: این قسمت پیرو مرحله قطعهبندی است. باز ارائه تنها قسمتی از راهکار است که داده خام را به اطلاعات پردازششده تبدیل میکند.
۱۰. تشخیص و شناسایی اشیا: این فرآیند شامل تخصیص برچسب به شیء بر اساس توضیحات مشخصشده است.

طبق بلوک ۱: اگر ورودی ما تصویر باشد و خروجی نیز تصویر باشد. پس ما در حوزه پردازش تصویر دیجیتال هستیم.
طبق بلوک ۲: اگر ورودی ما تصویر باشد و خروجی نوعی از اطلاعات یا توضیحات باشد. پس ما در حوزه بینایی کامپیوتر هستیم.
طبق بلوک ۳: اگر ورودی ما توضیحات و یا کد باشد و در خروجی دارای تصویر باشیم. پس در حوزه گرافیک کامپیوتری قرار داریم.
طبق بلوک ۴: اگر ورودی توضیحات یا کلمات کلیدی و یا کد باشد و خروجی ما شامل توضیح و یا کلمات کلیدی باشد. پس ما در حوزه هوش مصنوعی هستیم!
Digital Image Processing (Rafael c. gonzalez)
اگر خواهان کسب اطلاعات بیشتر درباره پردازش تصویر هستید. مقاله پردازش تصویر چیست؟ را از دست ندهید.
پردازش تصویر: ورودی و خروجی هر دو تصویر هستند (مثل بهبود کیفیت).
بینایی کامپیوتر: ورودی تصویر، خروجی اطلاعات یا توصیف (مثل تشخیص چهره).
گرافیک کامپیوتری: ورودی توصیف یا کد، خروجی تصویر (مثل ساخت صحنه سهبعدی).
تصویر دیجیتال به صورت یک ماتریس دوبعدی شامل اعداد صحیح ذخیره میشود. هر عضو ماتریس یک پیکسل نام دارد که مقدار آن شدت روشنایی (در تصویر خاکستری ۰ تا ۲۵۵) یا ترکیب رنگ (RGB) را نشان میدهد.
در متلب، برخلاف بسیاری از زبانها و تعاریف ریاضی، اولین اندیس آرایهها ۱ است. بنابراین f(1,1) معادل f(0,0) در فرمول استاندارد تصویر است. این یک قرارداد خاص در متلب برای سادگی کار با ماتریسهاست.
کاهش حجم تصویر برای ذخیرهسازی کمتر و انتقال سریعتر در شبکهها و اینترنت، بدون افت محسوس کیفیت (مثل فرمت JPEG) یا با افت کنترلشده بر اساس رزولوشن.
زیرا تشخیص خودکار مرز دقیق اشیا در تصاویر واقعی (با نور غیریکنواخت، نویز، سایه و همپوشانی اشیا) به سادگی امکانپذیر نیست و نیاز به الگوریتمهای پیشرفته یادگیری ماشین دارد.
باینری: هر پیکسل فقط ۰ (سیاه) یا ۱ (سفید) است.
خاکستری ۸ بیتی: هر پیکسل ۲۵۶ سطح از سیاه (۰) تا سفید (۲۵۵) دارد که شامل سایههای مختلف خاکستری میشود.
با استفاده از عملیاتهایی مثل تورم (Dilation) و فرسایش (Erosion)، شکل اشیا در تصویر تحلیل، ساده یا جداسازی میشود. کاربردها: حذف نویز، تشخیص لبه، پر کردن حفرهها.
کتاب "Digital Image Processing" نوشته Rafael C. Gonzalez و Richard E. Woods (مرجع اصلی بسیاری از دورههای دانشگاهی) به همراه تمرین با نرمافزار متلب و پایتون (کتابخانه OpenCV).