جستجو

آرشيو مطالب

تصاویر از جمله منابع اطلاعاتی هستند که هر روزه میلیون ها قطعه بر تعداد آن ها افزوده می شود و به دلیل همین حجم بالای تولید و نیز ویژگی های خاص منابع دیداری، سازماندهی و نمایه سازی آن ها با چالش هایی همراه است. مسئله نمایه سازی و بازیابی تصاویر از سال 1970 میلادی به بعد به مقوله پژوهشی فعالی تبدیل شد و محققان دو حوزه مدیریت پایگاه ها و علوم رایانه در این زمینه رویکردهای مختلفی ارائه داده اند که آن ها را می توان به دو قسمت کلی روش های سنتی یا متنی و روش های محتوایی تقسیم کرد (عباسپور، 1386).

رویکردهای رایج در بازنمایی تصاویر

الف) رویکرد متنی: در این رویکرد به هر تصویر مثل آثار مکتوب چندین اصطلاح نمایه ای نسبت می دهند به طوری که بازتاب دهنده موضوع تصویر باشد. این ساده ترین روش برای بازنمایی تصاویر است و بیشتر افراد نیز ترجیح می دهند تا با وارد کردن چند کلمه در موتور های کاوش به تصویر مورد نظر خود برسند. دو روش برای اختصاص اصطلاحات نمایه ای برای منابع دیداری وجود دارد: استفاده از زبان آزاد و استفاده از زبان کنترل شده. در روش اصطلاح دهی با زبان آزاد، نمایه ساز از توصیفگرهایی که خود مناسب می داند برای توصیف مفاهیم موجود در تصویر استفاده می کند. به عنوان نمونه، تگ هایی که در اینستاگرام توسط کاربران ایجاد می شود را می توان ذکر کرد. در اصطلاح­ دهی با واژگان کنترل شده نیز نمایه ساز از طرح های رده بندی، سرعنوان های موضوعی و اصطلاح­نامه ها برای انتخاب واژگان جهت توصیف تصویر استفاده می کند. لنکستر (1382) واژگان کنترل شده را فهرستی معتبر می داند که نمایه سازان تنها اصطلاحاتی را می توانند به مدرک اختصاص دهند که در این فهرست وجود داشته باشند. کتابخانه کنگره برای منابع گرافیکی اصطلاح نامه ای دارد که در آن هر مدخل حاوی تصویر نمونه همراه با ذکر اصلاحات مرتبط و عام تر است.

یکی دیگر از رویکردهای متنی برای توصیف منابع دیداری قالب های فراداده ­ای است. قالب های فراداده­ ای علاوه بر موضوع، مشخصات دیگر تصویر مثل نام سازنده یا عکاس، فرمت و اندازه تصویر را به شکل متنی توصیف می کنند به طوری که هر یک از این مشخصات می توانند به عنوان نقاط دسترسی برای بازیابی دقیق ­تر تصاویر از طرف نظام های جستجو استفاده شوند. حریری و حسینی شکرایی (1391) در پژوهش خود عناصر یک طرح فراداده­ ای مناسب برای انواع منابع دیجیتالی از جمله تصاویر را ذکر کرده ­اند که شامل طیف وسیعی از اطلاعات از جمله عنوان، تاریخ تهیه، اطلاعات مربوط به فایل تصویر، اطلاعات مربوط به دوربین و سایر موارد می شود. قالب فراداده­ ای دوبلین کور، قالب فایل تصویری قابل تبادل که حاوی اطلاعات مربوط به دوربین است و چارچوب ابر داده­ ای قابل توسعه از جمله قالب های فراداده ­ای موجود برای توصیف تصاویر هستند.

ب) رویکرد محتوایی: نمایه سازی محتوایی تصاویر، بر اساس خصوصیات سطح پایین تصاویر مانند رنگ، شکل، بافت و هر خصوصیتی که مستقیما تصویر را توصیف کند کار می کند. طیف رنگی، با محاسبه هیستوگرام رنگ برای هر تصویر مشخص می شود. هیستوگرام رنگی یک تابع چهار بعدی است که شدت رنگ های اصلی را برای هر نقطه، توصیف می کند. وقتی تفاضل دو هیستوگرام رنگ به اندازه کافی کوچک باشد دو هیستوگرام شبیه هم هستند (ذوالفقاری و خسروی 1392). میزان روشنایی دو نقطه مجاور و تمایز آن، بافت را توصیف می­کند. شکل نیز یکی از مشخصه های مهم اشیای فیزیکی است که با تحلیل لبه های تصویر تعیین می شود.

شکل 1. ساختار سامانه تعاملی بازیابی تصویر (شمسی گوشکی و همکاران، 1393).

حاشیه نویسی خودکار: ایده اصلی حاشیه نویسی خودکار تکنیک هایی است که مفهومی را با استفاده از مجموعه تصاویر نمونه بسیار زیاد به صورت خودکار یاد می گیرند و از این مدل های مفهومی برای برچسب زدن به تصاویر جدید استفاده می کنند. مشخصه کلیدی حاشیه نویسی خودکار این است که مجموعه ای از اصطلاحات نمایه ای را بر اساس محتوای تصاویر پیشنهاد می دهد.

ترتیب کار بدین صورت است که ابتدا مجموعه ای از تصاویر اولیه توسط کارشناسان وارد سیستم می شود. سپس با استفاده از خوشه ­بندی، این مجموعه تصاویر در کلاس های مختلف قرار می گیرند مانند غروب آفتاب، ماشین، حیوانات مختلف، ابزارآلات و غیره. سپس به هرکدام از کلاس ها مجموعه ­ای از اصطلاحات نمایه­ ای اختصاص می­ گیرد. در مرحله بازیابی نیز، هر تصویر دلخواه بعد از ورود به سیستم تقسیم بندی و بعد از استخراج ویژگی های هر بخش، کلاس آن بخش از تصویر مشخص می شود و در نهایت تصاویری از آن کلاس که بیشترین شباهت را به بخش مذکور دارند انتخاب و از اصطلاحات اختصاص داده شده برای توصیف آن بخش از تصویر استفاده می شود. با انجام این فرایند برای همه بخش ها، کل تصویر با چند اصطلاح بازنمایی می شود (عبدالله­ئی و فائز، 1393). در شکل (2) نتایج حاشیه نویسی خودکار با نمایه سازی دستی تصاویر توسط انسان مقایسه شده است.

شکل 2. مقایسه حاشیه نویسی خودکار با حاشیه نویسی دستی توسط انسان (بهرامی و صنیعی آباده، 1394).

منابع:

عباسپور، جواد (1386). نمایه‌سازی تصاویر: چالش‌ها و رویکردها. تحقیقات کتابداری و اطلاع رسانی دانشگاهی، 39(44).

لنکستر، فردریک (1382). نمایه سازی و چکیده نویسی، مبانی نظری و عملی (عباس گیلوری، مترجم). تهران: نشر چاپار.

حاجی اسمعیلی، محمدمهدی؛ منتظر، غلامعلی (۱۳۹6). نگاهی بر بازیابی معنایی تصاویر در وب. سومین کنفرانس بین المللی وب پژوهی، دانشگاه علم و فرهنگ، تهران، ایران.

حریری، نجلا؛ حسینی شکرایی، افروز (1391). بررسی طرح¬های فرا داده ای منابع دیجیتالی تصویری، صوتی و ویدیوئی و شناسایی طرح مناسب. پژوهشنامه کتابداری و اطلاع رسانی، 2 (2)، 222-201.

ذوالفقاری، احمد؛ خسروی، حسین (1392). روشی سریع دربازیابی تصاویر مبتنی بر محتوا با استفاده از ترکیب ویژگی لبه و رنگ. همایش ملی مهندسی برق و توسعه پایدار با محوریت دستاوردهای نوین در مهندسی برق، موسسه آموزش عالی خاوران، مشهد، ایران.

شمسی گوشکی، اسما؛ نظام آبادی پور، حسین؛ سریزدی، سعید؛ کبیر اله، احسان. روشی برای بازخورد ربط براساس بهبود تابع شباهت در بازیابی تصویر بر اساس محتوا. پردازش علائم و داده‌ها، ۱۱ (۲)، ۴۳-۵۵.

عبدالله ئی، فاطمه؛ کریم، فائز (۱۳۹3). حاشيه نويسي خودکار تصاوير با کلاس بندي به کمک شبکه عصبي. بیستمین كنفرانس ملي سالانه انجمن كامپيوتر ايران، دانشگاه فردوسی مشهد، مشهد، ایران.



شنبه 06 مهر 1398
ادامه مطلب