چکیده: تعداد، تنوع و پیچیدگی محتوای تصویری در دنیای دیجیتالی بهسرعت در حال افزایش است و این موضوع نیاز به طراحی و پیادهسازی سامانههای جویش و بازیابی محتوای تصویری را بسیار محسوس کرده است. در حال حاضر با مقیاس عظیمی از دادههای تصویری در فضای وب روبرو هستیم که راهکارهای معمولِ مبتنی بر فرادادههای دستی و انسانی پاسخگوی تنوع و تعداد بسیار زیاد آنها نیست. جویشگر گوگل حدود 35 هزار میلیارد صفحۀ قابل جستجو را نمایهسازی کرده و پاسخگوی بیش از 8/5 میلیارد جستجوی روزانه است. فلیکر بهعنوان یک وبگاه اشتراکگذاری تصاویر در حال حاضر شامل بیش از 10 میلیارد تصویر است که روزانه 25 میلیون تصویر به آن افزوده میشود. وبگاه اینستاگرام در هر روز شاهد بارگذاری حدود 95 میلیون تصویر است و تا به امروز حدود 50 میلیارد تصویر در آن به اشتراک گذاشته شده است و این حجم عظیم از دادههای تولیدی، بدون راهکاری با دقت و سرعت بالا در درک و بازیابی آنها، به آرشیوهای ابدی دیجیتالی خواهند پیوست و هرگز دوباره پیدا نخواهند شد. اخیراً تلاشهای بسیاری برای بازیابی این تصاویر، بهویژه در مبحث «بازیابیمحتوامحورتصویر» (CBIR) و «بازیابی معنایی» (SIR) شکلگرفته است. یک سامانه بازیابی محتوامحور و معنایی تصویر، قادر به جستجو و بازیابی تصاویر، بر اساس محتوای درونی و معانی سطح بالای انسانی آن است و نه فرادادههایی که ممکن است همراه با آن ثبت شده باشند. رویکرد این پژوهش متمرکز بر «بازیابی معنایی» بوده و هدف آن بازیابی تصاویر بر اساس مفاهیمِ معنایی و سطح بالای موجود در تصاویر و نهفقط محتوا و اجزای تشکیلدهنده آن است. پیشنهاد ما برای روش بازیابی معنایی، همجوشی ویژگیهای استخراج شده از تصویر و متن است که درنهایت به توصیف و بازیابی بهتر خواهد انجامید و نشان خواهیم داد که عملکرد این روش نسبت به دیگر تحقیقات مطرح در این حوزه، برتری قابلتوجهی درمجموعه دادههای دارای روابط معنایی پیچیده دارد. به کمک این روش، میتوان حجم عظیمی از دادههای تصویری را در زمانی کوتاه، اندیس گذاری کرد و سپس از طریق تصویر یا زبان طبیعی به جستجو و بازیابی معنایی آنها پرداخت. در این پژوهش راهکاری برای تخمین عمق تصاویر به کمک شبکههای عصبی مصنوعی معرفی شده؛ سپس به کمک روش همجوشی پیشنهادی این رساله، اطلاعات تصویر، عمق و متن توصیفی آن در فضایی برداری با یکدیگر پیوند شده و از این فضای برداری برای بازیابی محتوامحور تصاویر استفاده شده است. نتایج حاصل نشان میدهد که راهکار پیشنهادی برای بازیابی تصاویر با صرف توان محاسباتی بسیار کمی، هم در سناریوهای معمول و هم در تصاویری که دارای اطلاعات فضایی پیچیده هستند، دارای عملکرد بالاتری نسبت به روشهای مطرح است.