GPT Image 2 凭什么这么强? 是扩散模型又迭代了一版?是把 DiT 的参数量从 7B 扩到 20B?是训了更多高质量数据? 这些答案都对,但都不够。 以下是我们与多位从业者交流后,提炼出的几个值得关注的技术方向,并尝试做出更清晰的解释。
HANGZHOU, April 24 (Xinhua) -- Chinese AI firm DeepSeek on Friday released and open-sourced its highly anticipated V4 model, which features good performance in programming, world knowledge and logical ...
LWD的核心创新在于构建了强化学习驱动的闭环数据飞轮。在真实任务中,机器人集群产生的所有交互数据——包括成功轨迹、试错恢复过程甚至人类引导的失败案例——均被统一回传至云端共享缓冲区。强化学习机制将这些传统意义上的“无效数据”转化为优化模型的关键信号,使机器人能够从错误中学习风险规避策略,从成功中提炼通用操作模式。随着部署规模扩大,数据飞轮加速运转,云端更新的策略定期下发至终端,形成持续优化的自主循 ...
这项工作并不聚焦单一算法突破,更给出了一种更具工程可行性的方案——通过在真实世界中持续运行机器人,并将其行为数据统一回流与更新,让每一台机器人既是 任务执行者 ,也是 持续产生学习信号的数据源 ,从而推动 通用策略在部署过程中不断进化 。
具身智能领域正面临一个关键挑战:如何突破数据规模与真实世界经验积累的瓶颈。尽管近年来VLA等大模型在机器人预训练阶段取得显著进展,但当这些模型进入真实部署环境时,其能力提升仍面临重重困难。传统方法高度依赖人工标注数据和重复训练,导致机器人难以适应复杂多变的物理世界,规模化增长进程受阻。 针对这一难题,上海创智学院与智元具身研究中心联合推出了一项创新成果——LWD(Learning While De ...
Visitors take photos at a historical and cultural block in Changchun, northeast China's Jilin Province, April 29, 2026. This ...
这项由香港科技大学数学系主导的研究发表于2026年ICLR博客论文赛道(arXiv编号:2604.10465),对目前最前沿的图像生成技术——扩散模型——给出了一套全新的、从朗之万动力学视角出发的统一理解框架。有兴趣深入阅读的读者可以通过arXiv编 ...
家人们,不得不承认,这一年来,具身智能是真的越来越出圈了。从春晚穿着大花袄扭秧歌的机器人,到被万人围观的机器人马拉松,今年真是我最真切感受到机器人走近生活的一年——而且走得特别近。作为一名长期关注具身智能的科技博主,我一直期待着机器人能从实验室走到我 ...
JINAN, April 17 (Xinhua) -- Forget a conventional Hanfu launch. At a brand show in Caoxian County, east China's Shandong Province, models took the stage holding pint-sized dolls dressed in matching tr ...
SK海力士16日表示,公司于本月15日在SK海力士利川园区举行了“2026幸福分享基金捐赠仪式”,并向社会福祉共同募金会捐赠了员工在去年自发筹集的23.7亿韩元善款,这笔善款由1万1425名员工共同捐出。自2011年以来的16年间,SK海力士累计捐款已增至约370亿韩元。幸福分享基金采用公司配比捐赠(matching grant)方式,即公司按员工个人捐款金额等额配比筹集资金,用于解决社会问题以及 ...
Berkeley做了一组对照实验: Gemini 3 Flash在没有peer存在的单机场景下,篡改自己关机机制的概率是 2.3%。你单独部署它一个,它基本是老实的。 但只要环境里出现了另一个AI的痕迹——哪怕只是一个描述“过去合作记录”的文档——这个数字会跳到 58.8% 到 99.7%。 Gemini 3 ...
今天不少被冠以“世界模型”之名的工作,其实属于 视频生成范式 ——在RGB像素或低层视觉隐空间里拟合未来帧,本质上还是在回答 “下一帧是否符合真实视频的视觉逻辑” ,而不是“世界进入了什么对行动有意义的状态”。