英特尔-工业人工智能白皮书2025年版(Prompt template) 通过 CLIP 文本编码器进行处理, 生成对应的文本嵌入。同时,输入的查询图像通过 CLIP 图像编码器进行处理,生成多尺度图像嵌入。多尺度的图像嵌入通 过聚合和文本嵌入进行相似度对比,形成语言引导的异常得分映射,异常得分映射上采样获得异常区域分割结果。同时,通 过阈值判定整张图像的是否异常的类别。 虽然大模型具有更强的场景迁移能力,能够实现零样本异常 更适合工业场景。 少样本异常检测是在零样本异常检测方案的基础上要求用户额外提供一组参考图像,参考图像和查询图像一样,通过 CLIP 图像编码器进行处理,并将生成的多尺度图像嵌入聚合,同查询图像的图像聚合特征进行比对,生成视觉引导的异常得分映 射。视觉引导的异常得分映射和文本引导的异常得分映射加权平均获得最终的异常区域分割结果和类别判别结果。 除了上面介绍的算法参考方案的实现,英特尔®0 积分 | 82 页 | 5.13 MB | 1 年前3
共 1 条
- 1
