首页
看点啥
插画图片
首页 热点时事 腾讯混元与浙大:VLM 不止能聊天对话 还能原生输出像素级深度图

腾讯混元与浙大:VLM 不止能聊天对话 还能原生输出像素级深度图

2026-06-13 0

DepthVLM团队 2026-06-12 18:00 广东

一句话概括:我们提出DepthVLM,首次让 VLM 以 ?(1) 的推理成本原生输出像素级稠密深度图,并在室内外深度估计上取得平均 δ₁=0.876 的成绩,全面超越 GPT-5.5、DepthLM、Youtu-VL 等现有 VLM,甚至力压纯视觉顶流 DepthAnythingV3。

起底智元机器人,谁在推动一个庞然大物向前

达闼科技陨落一周年:具身独角兽的消亡史

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

阅读原文

喜欢(0)

上一篇

OneReason:当推荐系统学会思考——三个问题:一份回答

OneReason:当推荐系统学会思考——三个问题:一份回答

下一篇

新人产品经理必会的15个提示词模板

新人产品经理必会的15个提示词模板
猜你喜欢