我们经常在一些对比 AI 性能的测试中,看到宣称基础模型在自然语言理解、推理或编程任务等性能超人类的相关报道。 但你有没有想过,这些结果真的可信吗? 在近期的一项研究中,美国哈佛大学研究员魏来(Kevin Wei)与合作者指出,目前人类基准测试(Human Baselines)的严谨性和透明度存在一系列严重问题,这直接关系着相关测试中关于 AI 性能的结论是否“立得住”的问题。 为此,研究人员对基 ...
ChatGPT不仅彻底在科技领域成功“出圈”,也在逐渐影响着整个教育领域。 一些教育工作者反对在课堂上使用这项新技术,主要原因是ChatGPT不仅可以智能化地编写不同类型的文章并且能够提供非常直观的问题回答,甚至帮助学生在作业和考试中作弊。
编者按:抗菌药物耐药已成为全球医疗领域的棘手难题,传统医院抗菌谱的局限性让经验性用药面临诸多挑战。近日,一项发表于Clinical Infectious Diseases的研究创新性地运用多任务机器学习框架,以电子健康档案为数据支撑,打造出“ ...
引言 在当下的科研生态中,人工智能(Artificial Intelligence, AI)已经不仅仅是一个工具,它更像是一种信仰。从AlphaFold摘得诺贝尔奖的桂冠,到大语言模型(Large Language ...
Patrick 早年堪称天才少年,继承了微生物科学家母亲的基因,17 岁便基于 MIT 开发的编程语言 Lisp 获得第 41 届爱尔兰全国在校学生科学竞赛,作为获胜者进一步晋级参加欧盟青年科学家竞赛,Patrick 拿到了第二名,第一名是 ...