大神仅花一个周末训练微型LLaMA 2,并移植到C语言。 推理代码只有500行,在苹果M1笔记本上做到每秒输出98个token。 作者是OpenAI创始成员Andrej Karpathy,他把这个项目叫做Baby LLaMA 2(羊驼宝宝)。 虽然它只有1500万参数,下载下来也只有58MB,但是已经能流畅讲故事。
大神仅花一个周末训练微型LLaMA 2,并移植到C语言。 推理代码只有500行,在苹果M1笔记本上做到每秒输出98个token。 作者是OpenAI创始成员Andrej Karpathy,他把这个项目叫做Baby LLaMA 2(羊驼宝宝)。 虽然它只有1500万参数,下载下来也只有58MB,但是已经能流畅讲故事。
不得不说,Llama 2 的「二创」项目越来越硬核、有趣了。 自 Meta 发布开源大模型 Llama 2 以来,围绕着该模型的「二创」项目便多了起来。 此前 7 月,特斯拉前 AI 总监、重回 OpenAI 的 Andrej Karpathy 利用周末时间,做了一个关于 Llama 2 的有趣项目 llama2.c,让用户在 ...
Andrej Karpathy, renombrado experto en el campo del deep learning, ha sorprendido a la comunidad científica decidiendo focalizar su talento en el desarrollo del modelo Llama 2 en lugar de seguir ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果