Lage Language Model PDF

1 天

DeepSeek 突发梁文峰署名新论文：V4 新架构提前曝光？

今天凌晨，喜欢闷声做大事的 DeepSeek 再次发布重大技术成果，在其 GitHub 官方仓库开源了新论文与模块 Engram，论文题为 “Conditional Memory via Scalable Lookup: A New Axis of ...

10 天

DeepSeek 新发现：给 AI 递一张“作弊小抄”，它的数学和代码能力竟然 ...

DeepSeek-AI 与北京大学的重磅论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》 ...

腾讯网

DeepSeek公布全新论文，梁文锋署名

【TechWeb】1月13日消息，DeepSeek最新公布题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language ...

腾讯网

梁文锋署名开源“记忆”模块，DeepSeek V4更细节了

机器之心编辑部就在十几个小时前，DeepSeek 发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models ...

13 天

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

就在十几个小时前，DeepSeek 发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language ...

GitHub

BELLE: Be Everyone's Large Language model Engine

本项目的目标是促进中文对话大模型开源社区的发展，愿景是成为能够帮到每一个人的LLM Engine。相比如何做好大语言模型的预训练，BELLE更关注如何在开源预训练大语言模型的基础上，帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力 ...

中国日报网

每日一词|多模态地理科学大模型 geographic sciences multi-modal Large Language ...

我国研发的全球首个多模态地理科学大模型“坤元”近日在京发布。“坤元”由中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位共同研发。 A geographic sciences multi-modal Large Language Model, the first of its kind in the world, was ...

中国日报网

每日一词|文生视频大模型 text-to-video large AI model

4月27日，2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。这一视频大模型由清华大学联合北京生数科技有限公司共同研发，可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容。 Vidu, a text-to ...

GitHub

FedJudge: Federated Legal Large Language Model

近期Large Language Model（LLM）卓越表现推动了其在智慧司法领域的应用。目前已经涌现出许多优秀的法律大模型（Legal LLM），如Lawyer LLaMA和ChatLaw等。然而，尽管Legal LLM在集中式数据训练的环境中取得了显著的成果，却少有人深入探究其在联邦学习场景下的应用。

Microsoft

如何评测一个大语言模型？

编者按：大型语言模型（Large language models, LLMs）因其在学术界和工业界展现出前所未有的性能而备受青睐。随着 LLMs 在研究和实际应用中被广泛使用，对其进行有效评测变得愈发重要。近期已有多篇论文围绕大模型的评测进行研究，但尚未有文章对评测的方法 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果