大家好,这里是人工智能最前沿。OCR 赛道悄悄展开了一个机会。 DeepSeek 官方已经正式开源了「DeepSeek-OCR」,并宣布已原生支持 vLLM 推理框架。 这意味着:企业现在可以 本地化部署一款高质量视觉大模型,不依赖第三方 API,也无需担心数据外泄,相信大多数 ...
适用于常规 AI 模型和 MoE。 DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的 ...
“在核对经营主体有关信息时,我们运用‘DeepSeek+Python’技术进行数据分析,自动批量化获取审计所需要的数据,运用科技手段提升审计工作质效。”日前,鹤壁市审计局结合审计项目积极探索将DeepSeek等大模型生成式人工智能技术应用于数据分析中,不断夯实 ...
IT之家 2 月 24 日消息,DeepSeek 今日启动“开源周”,首个开源的代码库为 FlashMLA—— 针对 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。 使用 CUDA 12.6,H800 SXM5 在内存受限配置下可达 ...