【2026 年 5 月 22 日,北京】鲲鹏昇腾开发者大会 2026(KADC2026)期间,面向超节点,打造开源易用的昇腾 AI 框架专题论坛顺利举办。 论坛聚焦超节点技术创新与开源生态建设,全方位展示了昇腾 AI 框架的最新进展。会上正式发布了 Ascend for PyTorch 社区,并深度复盘了昇思 MindSpore 在分布式并行、图算融合等前沿领域的创新成果作为组件化支撑 PyTor ...
近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。 在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...
如果说 2017 年的 PyTorch 让深度学习从 "少数派的炼丹炉" 变成了 "人人可用的工程平台",那么具身智能(Embodied AI)正在等待属于它自己的 "PyTorch 时刻"。过去两年,VLA(Vision-Language-Action,视觉-语言-动作)模型几乎是机器人领域最火热的方向:从 Google 的 RT-2、Physical Intelligence 的 π₀,到 N ...
AI自动生成的苹果芯片Metal内核,比官方的还要好? Gimlet Labs的最新研究显示,在苹果设备上,AI不仅能自动生成Metal内核,还较基线内核实现了87%的PyTorch推理速度提升。
PyTorch 大牛 Horace He 突然官宣,加盟 Thinking Machines。 「在 Meta,离职时发布一张工牌照片是一种传统。遗憾的是,我找不到我的正式工牌了,所以只能用临时工牌代替」 毕业后,在 Meta 的 PyTorch 工作 4 年后,Horace He 终于决定换一种职业,探索一些新的事物。
PyTorch公开2024 H2发展路线图,增透明度。 【导读】最近,PyTorch团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。 如果你在AI领域用Python开发,想必PyTorch一定是你的老朋友之一。2017年,Meta AI发布了这个机器 ...
AMD宣布ROCm和PyTorch支持已经开放给同是RDNA 3架构的RX 7900 XT显卡,涵盖了RDNA 3架构的所有顶级产品。 AMD上个月已经放出了Ubuntu Linux的ROCm 5.7.1驱动更新,为Radeon Pro W7900和Radeon RX 7900 XTX显卡带来了ROCm和PyTorch支持。而在12月初的AMD Advancing ...
Hexagon‑MLIR是高通技术公司提供的开源AI编译器软件栈,确保用户能够在Hexagon NPU(为高性能、高效AI和生成式AI载荷构建的一款专用AI加速器)上轻松编译和运行Triton内核与PyTorch模型。 此项举措通过探索基于开源MLIR的编译软件栈来补充本公司的商业工具链,为 ...
当深夜的服务器集群仍在迭代Transformer参数,当GPU显存即将耗尽而CPU仍需承担数据预处理、特征工程与分布式调度重任——AI研究人员真正需要的,不是纸面核心数,而是可信赖的持续吞吐、毫秒级响应的I/O一致性、经得 ...
深夜调试完Transformer结构,服务器却因内存错误中断训练;在实验室反复运行强化学习环境时,单核延迟拖慢策略收敛;用JupyterNotebook加载百GB生物数据集,传统桌面CPU频繁卡顿——这些不是偶然故障,而是AI研究人员 ...
作为应对,谷歌在近期发布了采用训练与推理分离设计的第八代TPU,并推出了旨在让PyTorch原生运行在TPU上的“TorchTPU”项目,试图降低生态迁移门槛。与此同时,行业也出现了混合策略的范例,例如Anthropic公司同时使用英伟达GPU、谷歌TPU和亚马逊Trainium芯片,根据不同工作负载选择最合适的平台,以平衡研究效率、训练成本与供应链安全。
3 天on MSN
复旦学姐带队,Fireworks AI估值1000亿
AI融资风暴史无前例。 彭博社消息,AI推理平台Fireworks AI正在洽谈新一轮融资,估值达到150亿美元(约1000亿元人民币)。至此,又一家千亿独角兽出现。 这一切只用了四年时间2022年,Fireworks ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果