Chatbot - 搜索 News

3 天

给AI打个分，结果搞出17亿估值独角兽？？？

在评分上，平台基于Bradley–Terry模型设计了Elo评分机制，每个模型都有初始分数，赢了就加分，输了就扣分，随着对战次数越来越多，分数会慢慢稳定下来，最终形成实时更新的排行榜。

Chatbot Arena对DeepSeek崛起早有所知

在世界上大多数人看来，DeepSeek似乎在1月底凭着开源人工智能软件一炮走红，其模型可与OpenAI和谷歌(Google)的模型媲美，而且据说所有这些软件的开发成本仅为竞争对手模型的一小部分。然而，对于一个名为Chatbot Arena的网站的粉丝来说，这个时刻没什么好意外的 ...

腾讯网

LLM-as-a-judge有30%评测偏差？这篇论文给出修复方案

点击上方“Deephub Imba”,关注公众号,好文章不错过 !用LLM给LLM打分，这个看起来很聪明的做法正在让AI评估变得不可靠。KRAFTON ...

腾讯网

国产AI大战迈入新阶段？豆包日活破亿机构：“Chatbot入口之争”已然 ...

《科创板日报》12月27日讯国产AI大战或加速步入下一阶段。中金公司援引市场数据显示，国内豆包App日活跃用户数（DAU）已突破1亿大关。该机构认为，豆包目前的用户规模、留存率、增速、DAU与MAU的比率，均说明其DAU迈向更高门槛的确定性强，甚至有望实现对 ...

2 天

土耳其，怎么就在AI应用赛道“遥遥领先”了？

在 a16z 给出的按照 MAU 排名的全球 Top50 AI App 榜单中，来自土耳其的 Codeway 和 HubX 两个公司各有三款产品进入了 Top50 当中，除了这 6 款产品，还有 Genie 和 Lisa AI ...

China.org.cn

India orders X Corp. to curb obscene content from Grok AI chatbot

NEW DELHI, Jan. 3 (Xinhua) -- The Indian government has directed X Corp., the parent company of the Grok AI chatbot, to prevent the generation of obscene and sexually explicit content and to submit a ...

来自MSN

腾讯混元首次上榜Chatbot Arena排名：跻身全球Top 15

快科技3月10日消息，腾讯官方发文宣布，腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名，跻身全球 Top 15。 Chatbot Arena 发起方 LMSYS Org （加州大学伯克利分校等机构支持的非营利组织）通过官方X账号对腾讯混元的加入表示欢迎。跟其他测评不一样 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果