这项由北京航空航天大学的杨健、国鑫、林静等研究者联合优矿公司和中国人民大学人工智能学院团队完成的突破性研究,发表于2025年12月的arXiv预印本(论文编号:2512.13472v1),是全球首次系统性探索多语言编程训练规律的重要成果。
北航、人大和九坤投资共同撰写的论文 《Scaling Laws for Code: Every Programming Language Matters》 整理而成。 在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
IT之家 12 月 23 日消息,TIOBE 指数 2025 年 12 月排行榜现已在官网公布,这个月 Python 依旧稳如泰山,以 23.64% 的市场份额夺得冠军,而 C 语言则是从上月的第 4 名升至亚军,市场份额 10.11%,C++ ...
这项由北京航空航天大学的杨健、国鑫、林静等研究者联合优矿公司和中国人民大学人工智能学院团队完成的突破性研究,发表于2025年12月的arXiv预印本(论文编号:2512.13472v1),是全球首次系统性探索多语言编程训练规律的重要成果。
Welcome to the Bricks 'O' Brian Survival Multiplayer Server! As a brand new series from your favorite Minecraft creator, the ...
近日,市调机构Counterpoint Research在报告中指出,到2035年,全球高级驾驶辅助系统(ADAS)和自动驾驶(AD)传感器市场预计将达到610亿美元。
2025 年, TRAE 用户总共发起了近 6000 万个会话,发送了近 5 亿条 Query,与 AI 进行了深入的创新和协作。TRAE 用户平均周均活跃天数近 5 天 ,相当于“工作日全勤”;其中,国际版付费用户的周均活跃天数超过 6 ...
在刚刚结束的2025亚马逊云科技re:Invent中国行北京站中,这家全球云计算的领军者给出了一份极具份量的答卷。作为一个年收入超过1320亿美元、在如此巨大体量下依然保持20%同比增长的超级平台,亚马逊云科技没有选择回避当下的泡沫论,而是用工程化思 ...
TRAE公布2025年度产品“成绩单”:600万注册用户、6000万个会话和5亿条 Query,代码,工作流,query,企业版 ...
美国宇航局(NASA)资助研发、美国太空军资助发射的四颗新型卫星“DiskSat”近日成功进入预定轨道,标志着这一创新卫星构型进入实际应用验证阶段。此次发射由火箭实验室(Rocket Lab)于上周四在美国弗吉尼亚州瓦勒普斯飞行基地完成,电子号火箭将卫星送至约550公里的轨道,随后所有卫星均与地面建立稳定通信,任务取得圆满成功。 与传统立方体卫星(CubeSat)不同,DiskSat采用扁平圆盘构 ...