在软件开发领域,单元测试维护一直是保障代码质量的关键环节,但这项工作往往繁琐且复杂。近期,一项由西伯利亚神经网络公司牵头,联合T-Technologies和新西伯利亚国立大学共同完成的研究,为人工智能在这一领域的应用潜力提供了全新视角。研究团队开发的TAM-eval评估体系,首次系统性地衡量了大型语言模型处理单元测试维护任务的真实能力,相关成果已发表于计算机科学领域权威期刊。 该研究以程序员日常工 ...
在自动化软件测试领域,一项突破性研究为开发者带来了效率革命。由西伯利亚神经网络公司牵头,联合T技术公司与新西伯利亚国立大学的研究团队,开发出名为RM-RF的智能评估模型,其核心创新在于颠覆了传统"运行才能验证"的测试评估模式。该模型通过直接分析代码文本,即可预测测试用例的质量指标,这项成果已发表于arXiv预印本平台(编号arXiv:2601.13097v1)。
当你写完一段代码,满心期待地运行测试,结果却发现测试失败了,或者根本跑不起来——这种挫败感几乎每个程序员都经历过。现在,人工智能是否能像一个经验丰富的同事一样,帮你找出问题并修复这些令人头疼的测试代码呢?
A:RM-RF是由西伯利亚神经网络公司开发的轻量级奖励模型,专门用于评估自动生成的单元测试质量。它的核心功能是无需编译和运行代码,仅通过分析源代码和测试代码就能预测三个关键指标:测试是否能正常编译运行、是否能增加代码覆盖率、以及是否能提高突变检测能力 ...

Vibe Coding,正在杀死开源

作者|一涛 编辑| 靖宇 过去一年,Vibe Coding 几乎完全改写了编程的方式。 你不再需要一行一行亲自「写」代码了。只要告诉 Cursor、Claude 或 ...