苹果将在 2025 年国际计算机视觉大会上展示多项研究成果,涉及多模态模型、视频生成等

抖音秀 热点资讯 7

10 月 14 日消息,今日,苹果公司确认将参加将于 2025 年 10 月 19 日至 23 日在檀香山举行的国际计算机视觉大会(ICCV)。

据苹果公司介绍,ICCV“每年与欧洲计算机视觉会议(ECCV)交替举行,聚焦于计算机视觉领域的关键议题”。

除提交并获录用的八篇论文将在大会的海报展示和口头报告环节亮相外,苹果还将参与大会主旨演讲。苹果机器学习应用研究部经理 C. Thomas 博士将出席第三届基于视觉的工业检测研讨会(VISION),并发表主题演讲,Thomas 博士的演讲主题将在未来几天内公布,其演讲定于 10 月 19 日举行。

附苹果将在 ICCV 2025 上展示的八篇论文如下:

  • ETVA:通过细粒度问题生成与回答实现文本到视频对齐的评估

  • MM-Spatial:探索多模态大语言模型中的三维空间理解能力

  • 原生多模态模型的扩展规律研究

  • 稳定扩散模型在视觉上下文学习中表现出隐性优势

  • STIV:可扩展的文本与图像条件化视频生成方法

  • UINavBench:交互式数字智能体综合评估框架

  • 基于多模态提示的统一开放世界分割技术

  • UniVG:用于统一图像生成与编辑的通用扩散模型

此外,苹果还将参与“计算机视觉领域女性研讨会”(Women in Computer Vision Workshop)。苹果研究人员 Patricia Vitoria Carrera 与 Tanya Glozman 将在会后晚宴上担任导师。


标签: 苹果 计算机 多模态模型 视频生成