本文介绍: 所有的实例感知任务旨在发现利用 queries 查询到的目标,例如类别名、语言表达式、目标标注,但这一领域被划分为多个独立的子任务。于是本文提出了一种统一的实例感知模型 UNINEXT。UNINEXT 将多个实例感知任务划分为一个统一的目标发现和检索过程,通过改变输入的 promots 能够弹性地感知不同类型的目标。于是有一些好处:不同任务的数据和标签词汇能够用于训练统一的模型,而且有益于那些缺乏训练数据的任务;参数有效性,能够降低冗余的计算。
⎧EncLref(expression) expression–guidedEncLref(concat(categories)) category–guidedmerge(EncVref([template, prior]) annotation-guided
4.2 图像-Prompt 特征融合
Enc
V
EncV,得到级联的视觉特征
4.3 目标发现和检索
4.4 训练和推理
训练
推理
五、实验
5.1 实施细节
5.2 在 10 个任务上的评估
目标检测和实例分割
REC 和 RES
SOT
VOS
MOT
MOTS
VIS
R-VOS
5.3 消融和其它分析
六、结论
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。