在软件开发领域,单元测试维护一直是保障代码质量的关键环节,但这项工作往往繁琐且复杂。近期,一项由西伯利亚神经网络公司牵头,联合T-Technologies和新西伯利亚国立大学共同完成的研究,为人工智能在这一领域的应用潜力提供了全新视角。研究团队开发的TAM-eval评估体系,首次系统性地衡量了大型语言模型处理单元测试维护任务的真实能力,相关成果已发表于计算机科学领域权威期刊。 该研究以程序员日常工 ...
在自动化软件测试领域,一项突破性研究为开发者带来了效率革命。由西伯利亚神经网络公司牵头,联合T技术公司与新西伯利亚国立大学的研究团队,开发出名为RM-RF的智能评估模型,其核心创新在于颠覆了传统"运行才能验证"的测试评估模式。该模型通过直接分析代码文本,即可预测测试用例的质量指标,这项成果已发表于arXiv预印本平台(编号arXiv:2601.13097v1)。
当你写完一段代码,满心期待地运行测试,结果却发现测试失败了,或者根本跑不起来——这种挫败感几乎每个程序员都经历过。现在,人工智能是否能像一个经验丰富的同事一样,帮你找出问题并修复这些令人头疼的测试代码呢?
本系列为Python基础学习,原稿来源于github英文项目,大奇主要是对其本地化翻译、逐条验证和补充,想通过30天完成正儿八经的系统化实践。此系列适合零基础同学,会简单用但又没有系统学习的使用者。总之如果你想提升自己的Python技能,欢迎加入《挑战30天学 ...
A:RM-RF是由西伯利亚神经网络公司开发的轻量级奖励模型,专门用于评估自动生成的单元测试质量。它的核心功能是无需编译和运行代码,仅通过分析源代码和测试代码就能预测三个关键指标:测试是否能正常编译运行、是否能增加代码覆盖率、以及是否能提高突变检测能力 ...
人民网 on MSN
广西人工智能人才供需有何变化
通过对区内186家连续招聘的重点企业进行长周期数据监测显示,2025年企业招聘策略已从“收缩管控”转向“主动扩张”,AI相关岗位需求量较历史均值激增69.9%,平均薪资逆势上扬至8950元月。
2025 年,AI 编程工具市场迈入规模化落地关键期。据 The Business Research Company 数据,全球 AI 编程工具市场规模预计 2029 年将达 182 亿美元,年复合增长率 24.0%,超 75% 企业开发团队已引入 AI 编程助手。但行业痛点显著:通用工具多聚焦“代码片段补全”,生成代码常因“适配性差、规范缺失、安全隐患”难以直接应用,尤其在 Java 生态中,框 ...
7 天on MSN
智能体与技能:并非非此即彼,携手共筑AI应用新架构
人工智能领域再次迎来突破性进展——Anthropic公司正式推出"智能体技能"架构,这一创新将彻底改变AI系统的构建方式。该架构的核心思想是将传统智能体的功能解耦,通过模块化技能实现专业知识的灵活组合,为AI系统开发提供了全新的设计范式。传统智能体系 ...
12 小时on MSNOpinion
Vibe Coding,正在杀死开源
作者|一涛 编辑| 靖宇 过去一年,Vibe Coding 几乎完全改写了编程的方式。 你不再需要一行一行亲自「写」代码了。只要告诉 Cursor、Claude 或 ...
There was an error while loading. Please reload this page.
LLM-in-Sandbox 提出了一个简洁而有效的范式:通过给大模型提供一台虚拟电脑,让其自由探索来完成任务。实验表明,这一范式能够显著提升模型在非代码领域的表现,且无需额外训练。 研究者认为, LLM-in-Sandbox 应当成为大模型的默认部署范式 , 取代纯 LLM 推理 。当沙盒可以带来显著的性能提升,并且部署成本几乎可以忽略不计时,为什么还要用纯 LLM?
一些您可能无法访问的结果已被隐去。
显示无法访问的结果