上海AI Lab：交错图文细粒度对齐评测基准

张

张建站

2026/5/8 9:14:42

10分钟阅读

标题COHERENCE: Benchmarking Fine-Grained Image-Text Alignment in Interleaved Multimodal Contexts来源arXiv, 2604.27389v1️文章简介研究问题多模态大语言模型在真实场景中如何准确识别交错图文上下文中细粒度的图文对应关系并进行推理主要贡献论文提出了COHERENCE基准这是首个专门评估交错图文上下文中细粒度图文对齐能力的大规模评测基准。重点思路构建包含四个代表性领域WikiHow、StoryBird、Cooking、Science的交错图文数据集共6161个高质量样本设计两种对齐能力评估指标全局图文对齐精确匹配测试模型对整体交错上下文结构的把握局部图文对齐部分匹配测试细粒度图文引用解析能力提出六类错误分析框架包括全局分配漂移、步骤状态混淆、细粒度细节遗漏、语义过度解读、视觉幻觉和指令违反扩展评估设置引入额外候选图像测试模型区分相关与无关图像的能力系统评估开源和闭源模型对比模块化架构与原生联合训练架构的性能差异分析总结小模型在局部图文对齐上已表现较强但全局对齐能力随模型规模增长显著提升是涌现能力原生从头联合训练的MLLM在复杂上下文图文对齐任务上普遍优于LLaVA式模块化架构最强开源模型Qwen3.5-397B得分为64.81与闭源模型Gemini-3.1-Pro的71.82仍存在明显差距模型规模扩大对局部对齐能力提升有限如Qwen3.5从4B到397B仅提升7.21分但对全局一致性提升显著增加额外候选图像时大模型在排除无关干扰图像方面表现更好小模型易受干扰个人观点论文定义了交错图文理解中的细粒度对齐问题突破了传统单图或多图问答的评测局限。

基于FTDI异步FIFO模式实现FPGA与PC的高速数据通信

1. 项目概述：一个让FPGA与PC高速“对话”的桥梁如果你玩过FPGA，肯定遇到过这样的场景：辛辛苦苦在板子上跑通了一个算法，生成了海量的数据，怎么把它弄到电脑上分析？或者反过来，电脑上有个复杂的控…...

2026/5/8 9:14:30 阅读更多 →

如何在5分钟内解锁VMware的macOS支持：终极完整指南

如何在5分钟内解锁VMware的macOS支持：终极完整指南【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unloc/unlocker 你是否曾经想在Windows或Linux电脑上运行macOS虚拟机，却发现VMware中根本没有…...

2026/5/8 9:13:35 阅读更多 →

Angular 表单中基于下拉选择动态启用字段必填校验的完整实现方案

本文介绍如何在 Angular 响应式表单中，根据 payable_frequency_ref_id 下拉框的选择状态，动态控制 min_payable_commission 和 max_payable_commission 两个输入框中「任一必填」的自定义校验逻辑，避免硬编码 required 属性或重复调用 setVal…...

2026/5/8 9:12:41 阅读更多 →

UVa 173 Network Wars

题目分析本题设定在 212621262126 年，彗星 Swift‑Tuttle\texttt{Swift‑Tuttle}Swift‑Tuttle 撞击地球后，网络中的部分链接被切断，同时一些 AI\texttt{AI}AI 程序发生了变异。两个程序 Paskill\texttt{Paskill}Paskill 和 Lisper\texttt{…...

2026/5/7 22:23:35 阅读更多 →

MA-EgoQA：多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域，视频问答（VideoQA）一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频（Egocentric Video）时，问题会变得更加复杂——这类视频通常…...

2026/5/7 22:23:34 阅读更多 →

别再死记硬背DDR4时序参数了！用Python脚本自动解析JESD79-4标准文档，生成你的专属配置表

用Python解放DDR4开发：从JESD79-4标准文档自动生成配置工具当第一次打开JESD79-4标准文档时，大多数硬件工程师都会感到一阵眩晕——数百页的技术规范、错综复杂的时序参数、晦涩难懂的寄存器配置，这些内容不仅难以记忆，更在具体项…...

2026/5/7 22:23:36 阅读更多 →

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效【免费下载链接】ZXPInstaller Open Source ZXP Installer for Adobe Extensions 项目地址: https://gitcode.com/gh_mirrors/zx/ZXPInstaller 还在为Adobe扩展安装而头疼吗？A…...

2026/5/7 22:23:28 阅读更多 →