Requesting API Token Graph API Powerautomate

小米 MiMo 模型 API 平台开放充值功能：输入 0.7 元 / M tokens，新老用户 ...

小米MiMo模型API平台开放充值！国内输入仅0.7元/M tokens，新老用户可领免费额度。专为AI智能体设计的309B MoE模型，推理成本低至Claude 4.5的2.5%，速度提升2倍！小米 MiMo API 平台今天开放了充值功能，近期将上线计费系统。输入（命中缓存）：0.01 美元 / M tokens 输出 ...

GitHub

LLM API 速度与延迟测试工具 (Cloudflare Worker)

这是一个部署在 Cloudflare Worker 上的小工具，用于测试大语言模型 (LLM) API 的调用速度和性能。它可以测量不同输入和输出 Token 组合下的吞吐量 (tokens/sec) 和首个 Token 的平均响应延迟。 API 端点自定义: 支持测试任意兼容 OpenAI 流式接口的 LLM API 端点。模型名称 ...

IT之家

2600 tokens / s：Meta 发布 Llama API，携手 Cerebras 打造最快 AI 推理解决方案

IT之家4 月 30 日消息，在首届 LlamaCon 大会上，Meta 公司在推出独立 AI 应用之外，还发布了 Llama API，目前以免费预览形式向开发者开放。 IT之家援引博文，Llama API 支持开发者测试包括 Llama 4 Scout 和 Llama 4 Maverick 在内的最新模型，提供一键 API 密钥创建以及轻量级的 ...

站长之家

迄今最贵！谷歌Gemini 2.5 Pro API定价公布：每百万输入tokens超9元

快科技4月5日消息，据报道，谷歌近日公布了Gemini 2.5 Pro的API定价，基础定价为每百万输入tokens 1.25美元（约合人民币9.1元），每百万输出tokens 10美元（约合人民币72.9元）。对于超过20万tokens的长文本输入，价格调整为每百万输入tokens 2.50美元（约合人民币18.2 元 ...

太平洋电脑网

迄今最贵！谷歌Gemini 2.5 Pro API定价公布：每百万输入tokens超9元

17173游戏网

阿里QwQ-32B API接口服务上线国家超算互联网：零门槛部署免费100万Tokens

从超算互联网官微获悉，本周，超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务，现在用户可获得免费的100万Tokens。据了解，基于国产深算智能加速卡以及全国一体化算力网，平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产开源大模型的接口服务。

快科技

阿里QwQ-32B API接口服务上线国家超算互联网：零门槛部署免费100万Tokens

快科技3月9日消息，从超算互联网官微获悉，本周，超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务，现在用户可获得免费的100万Tokens。据了解，基于国产深算智能加速卡以及全国一体化算力网，平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国产 ...

新浪网

国家超算互联网平台 QwQ-32B API 接口服务上线，免费提供 100 万 Tokens

IT之家 3 月 9 日消息，国家超算互联网平台昨日晚宣布本周上线阿里巴巴开源推理模型 QwQ-32B API 接口服务，用户可获得免费 100 万 Tokens。 QwQ-32B 是阿里 Qwen 团队最新发布的推理模型，基于 Qwen2.5-32B + 强化学习构建。据官方公示的基准评测结果，在测试数学能力的 ...

深圳新闻网