说实话我还挺期待 MiniMax 发布新模型的,之前的 M2.1 确实能打。不过,今天看到消息,MiniMax 上市之后发布了第一个开源项目:OctoCodingBench。 这个选择其实挺反直觉的,在今天的 AI 叙事里,模型才是焦点,Bench ...
观点网讯:1月14日,MiniMax宣布开源面向Coding Agent的评测集OctoCodingBench,并同步披露基于该集对国内外十余款开源及闭源大模型的测评结果。根据公开资料整理,实验覆盖代码生成、多轮对话、指令遵循等维度,样本规模超1万条。
字节正研发新一代豆包AI耳机,由歌尔股份代工1月14日,据蓝鲸科技,据供应链人士消息,字节跳动正研发豆包新一代AI耳机,将由歌尔股份承接代工生产。“歌尔股份目前已专门设立事业群(BG),统筹负责字节跳动相关业务。”该人士还表示,“从这样的内部资源配置不难看出,歌尔股份对字节跳动合作的重视程度。”对此,歌尔股 ...
一款名为IQuest-Coder-V1的中国代码生成模型系列近日引发全球科技界关注。该模型在SWE-Bench Verified榜单中取得突破性成绩,其40B参数版本以81.4%的准确率超越外界推测参数规模达千亿至万亿级的Claude Opus-4.5和GPT-5.2,成为当前代码生成领域最受瞩目的新星。 这款由 ...
大家好,我是袋鼠帝。 在用Claude Code写代码的兄弟们,有没有一种感觉: 刚开始写的时候,是行云流水,AI指哪打哪。但是随着项目稍微复杂一点,对话轮次一多,或者经过了大量的修改后,代码就开始变得越来越不对劲了。
2026年1月12日,牛津纳米孔技术公司(Oxford Nanopore Technologies)首席执行官Gordon Sanghera在第44届摩根大通医疗健康年会(J.P. Morgan Healthcare Conference, JPM ...
相关媒体报道,两位知情人士透露,DeepSeek计划在2月中旬农历新年期间发布V4版本,同时表示发布时间仍可能变动。这款模型代号DeepSeek V4,是去年DeepSeek ...
10个趋势,看懂2026年Agentic AI发展方向。