社区

当前位置：首页社区清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

清华大学研发 LLM4VG 基准：用于评估 LLM 视频时序定位性能

您是不是想找：清华大学清华大学研究生官网招生网清华大学校长清华大学预约参观官网清华大学可以进去参观吗清华大学录取分数线2023清华大学录取分数线清华大学占地面积多少亩清华大学信息门户清华大学创办时间

12 月 29 日消息，大语言模型（LLM）的触角已经从单纯的自然语言处理，扩展到文本、音频、视频等多模态领域，而其中一项关键就是视频时序定位（Video Grounding，VG）。

VG 任务的目的基于给定查询（一句描述），然后在目标视频段中定位起始和结束时间，核心挑战在于时间边界定位的精度。

清华大学研究团队近日推出了“LLM4VG”基准，这是一个专门设计用于评估 LLM 在 VG 任务中的性能。

此基准考虑了两种主要策略：第一种涉及直接在文本视频数据集（VidLLM）上训练的视频 LLM，第二种是结合传统的 LLM 与预训练的视觉模型。

在第一种策略中，VidLLM 直接处理视频内容和 VG 任务指令，根据其对文本-视频的训练输出预测。

第二种策略更为复杂，涉及 LLM 和视觉描述模型。这些模型生成与 VG 任务指令集成的视频内容的文本描述，通过精心设计的提示。

这些提示经过专门设计，可以有效地将 VG 的指令与给定的视觉描述结合起来，从而让 LLM 能够处理和理解有关任务的视频内容。

据观察，VidLLM 尽管直接在视频内容上进行训练，但在实现令人满意的 VG 性能方面仍然存在很大差距。这一发现强调了在训练中纳入更多与时间相关的视频任务以提高性能的必要性。

而第二种策略优于 VidLLM，为未来的研究指明了一个有希望的方向。该策略主要限制于视觉模型的局限性和提示词的设计，因此能够生成详细且准确的视频描述后，更精细的图形模型可以大幅提高 LLM 的 VG 性能。

总之，该研究对 LLM 在 VG 任务中的应用进行了开创性的评估，强调了在模型训练和提示设计中需要更复杂的方法。

附上论文参考地址：https://arxiv.org/pdf/2312.14206.pdf

本文收录在

资讯
分类：资讯
清华大学
标签：清华大学

相关文章推荐

Array

如何评价清华大学 2023 年本科生特等奖学金的15名候选人？

如何评价清华大学 2023 年本科生特等奖学金的15名候选人？

渐冻人蔡磊全球首次试用可穿戴人工喉，清华大学研发

渐冻人蔡磊全球首次试用可穿戴人工喉，清华大学研发

“铊中毒”案受害者清华大学：我校1992级校友朱令去世

“铊中毒”案受害者清华大学：我校1992级校友朱令去世

清华大学合作推出看图答题小能手 CogAgent：可告知《原神》游戏操作步骤等

清华大学合作推出看图答题小能手 CogAgent：可告知《原神》游戏操作步骤等

在清华大学就读是什么体验？

日产汽车将与清华大学成立联合研究中心：聚焦充电基础设施、电池循环利用等

日产汽车将与清华大学成立联合研究中心：聚焦充电基础设施、电池循环利用等

清华大学合作推出体验式协同学习框架：让 AI 总结历史经验，大幅提高学习能力

清华大学合作推出体验式协同学习框架：让 AI 总结历史经验，大幅提高学习能力

中国脑机接口新突破，清华大学团队实现高位截瘫患者脑控光标

中国脑机接口新突破，清华大学团队实现高位截瘫患者脑控光标

清华大学将为 2024 级新生配备“AI 成长助手”，建设百门 AI 赋能教学试点课程

清华大学将为 2024 级新生配备“AI 成长助手”，建设百门 AI 赋能教学试点课程

清华大学团队揭秘月壤固化成形技术，探索月球基地建造四个阶段

清华大学团队揭秘月壤固化成形技术，探索月球基地建造四个阶段

清华大学：2023年学生出国出境交流8000余人次创历史最高水平

清华大学：2023年学生出国出境交流8000余人次创历史最高水平

国产大飞机 C929 项目联合攻关启动大会召开：我国首款自主研制洲际客机

国产大飞机 C929 项目联合攻关启动大会召开：我国首款自主研制洲际客机

电饭煲这4个地方不洗：当心吃“蟑螂蒸饭”！

电饭煲这4个地方不洗：当心吃“蟑螂蒸饭”！

神舟十八号载人飞船4月发射！备份船神十九应急值班

神舟十八号载人飞船4月发射！备份船神十九应急值班

长城魏牌蓝山新款车型完成工信部申报：换装宁德时代 42.5kWh 三元锂电池

长城魏牌蓝山新款车型完成工信部申报：换装宁德时代 42.5kWh 三元锂电池

国内首个“AI评标师”已上岗：有望每年为央国企节约采购成本超5400亿

国内首个“AI评标师”已上岗：有望每年为央国企节约采购成本超5400亿

500米口径世界最大！中国天眼有重大突破：发现900余颗新脉冲星

500米口径世界最大！中国天眼有重大突破：发现900余颗新脉冲星

锦万邦JINWANBANG - 定制电缆贴心品牌

锦万邦JINWANBANG - 定制电缆贴心品牌

融侨母婴中心-专业贴心的母婴护理服务

融侨母婴中心-专业贴心的母婴护理服务

万泽大药房：打造健康营销网络

0评论

最新
最热

还没有任何评论，你来说两句吧

热门资讯

9块9包邮到底让你损失了多少钱

9块9包邮到底让你损失了多少钱

DNF：神界装备系统大改版！4大新内容详解，大小百变怪登场

DNF：神界装备系统大改版！4大新内容详解，大小百变怪登场

DNF：可白嫖一个角色门票，史诗之路“封存券”莫乱用！注意顺序

DNF：可白嫖一个角色门票，史诗之路“封存券”莫乱用！注意顺序

杰佳JIEJIA——健康优质板材的领军品牌

杰佳JIEJIA——健康优质板材的领军品牌

3309 元：小米全能扫拖机器人 M30 Pro 京东 12.12 新低

3309 元：小米全能扫拖机器人 M30 Pro 京东 12.12 新低

ROG 2024 款幻 16 笔记本曝光：Ultra 9 185H + RTX 4090

ROG 2024 款幻 16 笔记本曝光：Ultra 9 185H + RTX 4090

DNF：旭旭宝宝停播！“大斌子”发文辟谣，“茜皇”三字回应

DNF：旭旭宝宝停播！“大斌子”发文辟谣，“茜皇”三字回应

江苏斯特郎电梯：打造高品质的电梯名牌

江苏斯特郎电梯：打造高品质的电梯名牌

荣耀 Magic6 系列手机开启 100 元预订：送体脂秤、180 只换不修等

荣耀 Magic6 系列手机开启 100 元预订：送体脂秤、180 只换不修等

恩科ENKOR音响品牌介绍，专业音箱解决方案提供商

恩科ENKOR音响品牌介绍，专业音箱解决方案提供商

玄派推出“玄熊猫”轻量化鼠标：原相 3395 + 三模连接，149 元

玄派推出“玄熊猫”轻量化鼠标：原相 3395 + 三模连接，149 元

浙江财经大学一退休教授制作“数字人替身”，继续为学生授课

浙江财经大学一退休教授制作“数字人替身”，继续为学生授课

热门晒物

热门好文

魅族21系列新机预热活动开启，挑战最窄下边框

魅族21系列新机预热活动开启，挑战最窄下边框

荣耀X50i+启动预售活动，首发到手价仅1599元起

荣耀X50i+启动预售活动，首发到手价仅1599元起

《人中之龙7外传无名之龙》首发支持DLSS 2！耕升 GeForce RTX 4060 踏雪同玩家击碎黑暗重回现实！

《人中之龙7外传无名之龙》首发支持DLSS 2！耕升 GeForce RTX 4060 踏雪同玩家击碎黑暗重回现实！

福布斯中国最具影响力商会50强评选开放报名

福布斯中国最具影响力商会50强评选开放报名

小米13迎来双11大促活动，仅需3599元即可入手

小米13迎来双11大促活动，仅需3599元即可入手

双十一，送福利啦！四季沐歌 “值”等你来

双十一，送福利啦！四季沐歌 “值”等你来

臭宝推出人民体育联名款螺蛳粉多渠道联动打开体育营销新思路

臭宝推出人民体育联名款螺蛳粉多渠道联动打开体育营销新思路

OPPO Reno11系列新机配置曝光，或搭载骁龙8+

OPPO Reno11系列新机配置曝光，或搭载骁龙8+

iQOO 12 Pro跑分成绩曝光，更多硬件配置揭晓

iQOO 12 Pro跑分成绩曝光，更多硬件配置揭晓

蔡司影像，心临其境 vivo X100系列正式发布

蔡司影像，心临其境 vivo X100系列正式发布

上汽荣威D7正式上市售12.18万起未来3年推8款新车

上汽荣威D7正式上市售12.18万起未来3年推8款新车

HELLY HANSEN推出全新H2EXPLORER系列冲锋衣羽绒服

HELLY HANSEN推出全新H2EXPLORER系列冲锋衣羽绒服