پژوهشگران دانشگاه صنعتی نوشیروانی بابل مرجعی جامع در حوزه ردیابی بصری اشیا (VOT) ارائه کردند

به گزارش روابط عمومی، ردیابی بصری اشیا (VOT) با هدف ردیابی یک یا چند هدف در یک توالی ویدیویی بر اساس توصیف شیء انجام میشود. در دهه گذشته، توسعه ردیابها یکی از مهمترین زمینهها در بینایی ماشین بوده است. قبل از پیادهسازی یک ردیاب موجود یا پیشنهاد یک ردیاب جدید، توسعهدهندگان باید دانش جامعی از مجموعه دادهها، ردیابها، پروتکلهای ارزیابی و مقایسه بین ردیابهای مختلف در VOT داشته باشند. اگرچه پیش از این نیز، محققان VOT مقالاتی مروری ارائه داده بودند؛ اما این حوزه هنوز فاقد مرجع کاملی بود که تمام حوزههای VOT را پوشش دهد.
پژوهشگران دانشگاه صنعتی نوشیروانی بابل در مقاله مروری 131 صفحه ای، تمام حوزههای ردیابی، از جمله رنگی (RGB)، فروسرخ یا حرارتی (TIR یا T)، عمق (D)، رویداد (E)، RGB-T، RGB-D و RGB-E را در دستههای مختلف مانند مجموعه دادهها، معیارهای ارزیابی و ردیابها را پوشش داده اند.
این مطالعه جامع، گستردهترین بررسی در حوزه VOT است. برای این منظور، ۶۴ مجموعه داده متنوع ردیابی تک-شیء (SOT) و ردیابی چند-شیء (MOT) معرفی و بررسی شدهاند که بر اساس کاربردشان توسط محققان انتخاب شدهاند. همچنین، تمام معیارهای ارزیابی موجود برای اهداف SOT و MOT در این کار ارائه شده است. در نهایت، ۲۱۶ ردیاب مختلف بررسی شده و مقایسهای کلی بین آنها در حالتهای مختلف VOT انجام شده است تا نقاط قوت و ضعف آنها نشان داده شود.
این مقاله در لینک در دسترس می باشد و از رساله دکتری سید مرتضی غزالی به راهنمایی دکتر یاسر بالغی عضو هیات علمی دانشکده مهندسی برق و کامپیوتر استخراج شده است.