说实话我还挺期待 MiniMax 发布新模型的,之前的 M2.1 确实能打。不过,今天看到消息,MiniMax 上市之后发布了第一个开源项目:OctoCodingBench。 这个选择其实挺反直觉的,在今天的 AI 叙事里,模型才是焦点,Bench ...
观点网讯:1月14日,MiniMax宣布开源面向Coding Agent的评测集OctoCodingBench,并同步披露基于该集对国内外十余款开源及闭源大模型的测评结果。根据公开资料整理,实验覆盖代码生成、多轮对话、指令遵循等维度,样本规模超1万条。
就在刚刚,竞技场排名再次刷新: 深度求索DeepSeek-Coder-v2成竞技场最强开源编码模型! 它在Coding Arena中已攀升至第4名,水平接近GPT-4-Turbo。 在编码领域的整体性能评估中,DeepSeek-Coder-v2的评分和稳定性均位于前10,超越智谱GLM-4、Llama-3等一众知名开源模型。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果