人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

AI日报|姚期智团队新作:“累积推理”让大模型更聪明;Stability AI发布全新StableCode模型

2023-08-09 139

今日值得关注的人工智能新动态:

姚期智团队新作:“累积推理”让大模型更聪明

突破极限!英伟达推出GH200芯片

Stability AI发布全新StableCode模型

谷歌提出AI抓取版权新解:出版商拥有拒绝权利

AutoPCF:大幅缩短自动计算产品碳足迹时间的框架

AgentSims:用于大型语言模型评估的开源沙盒

AI多角色聊天机器人:革新计算机科学教育的参与模式

MindDiffuser:通过语义和结构扩散从人脑中控制图像重建

InstructZero:黑盒大型语言模型的高效指令优化

姚期智团队新作:

“累积推理”让大模型更聪明

尽管语言模型强大且用途多,但难解复杂问题,因为复杂问题需要深思熟虑,训练中对此支持有限。为解决此问题,姚期智团队提出了一种名为“累积推理”(Cumulative Reasoning,CR)的方法,该方法以累积和迭代的方式使用语言模型来模拟人类的思维过程。以处理逻辑推理任务为例,CR 在准确率上超越现有方法多达 9.3%,在 FOLIO 维基数据集达 98.04%。在“24 点游戏”中,CR 达 94% 准确率,较先前最先进方法提升 20%。

论文:

Cumulative Reasoning With Large Language Models

突破极限!

英伟达推出GH200芯片

本周二,英伟达宣布推出一款支持 AI 模型的新芯片 GH200,该芯片在 GPU 性能方面与英伟达当前最高端的 AI 芯片 H100 相当,然而它引入了高达 141GB 的顶尖内存以及一颗拥有 72 核的 ARM 中央处理器。英伟达首席执行官黄仁勋表示,“这款处理器是为全球数据中心的横向扩展而设计的。”

Stability AI发布

全新StableCode模型

昨天,Stability AI 首次公开发布其全新开放式大型语言模型 StableCode,该模型可以帮助用户生成编程语言代码。据悉,StableCode 模型受益于开源的 BigCode 项目的初始编程语言数据集,并且经过 Stability AI 的额外筛选和微调。最初,StableCode 将支持 Python、Go、Java、JavaScript、C、Markdown 和 C++ 编程语言的开发。

谷歌提出AI抓取版权新解:

出版商拥有拒绝权利

近日,谷歌呼吁修改版权法,允许出版商选择拒绝 AI 系统抓取其作品。公司主张推广适当使用版权内容的版权系统,同时支持实体选择退出。另外,谷歌提议类似于 Robots.txt 的退出机制,要求出版商标明 AI 是否可使用其内容。专家认为,这或将形成规范,免去付费需求。

AutoPCF:

大幅缩短自动计算

产品碳足迹时间的框架

近日,阿里云、香港中文大学和清华大学合作发布一项新研究,该研究测试了五个大型语言模型(LLMs)在产品生命周期建模和生成库存数据方面的新能力,揭示了它们作为通用产品碳足迹(PCF)知识库的限制。为解决该问题,研究团队利用 LLMs 提出了自动 AI 驱动的 PCF 核算框架——AutoPCF,该框架应用深度学习算法自动匹配计算参数,并最终计算 PCF。通过 AutoPCF 框架估算三种案例产品的碳足迹,结果显示其在实现 PCF 自动建模和估算方面潜力巨大,能将建模时间从数天减少到几分钟。

论文:

AutoPCF: Efficient Product Carbon Footprint Accounting with Large Language Models

AgentSims:

评估大型语言模型的开源沙盒

为弥补目前大型语言模型(LLMs)评估方法存在的缺陷,PTA studio 领衔的研究团队提出了一种基于任务的评估方法——AgentSims,即在模拟环境中让 LLMs 代理完成任务。研究人员可以通过交互式图形用户界面(GUI)添加代理和建筑物来构建评估任务,也可以通过少量代码部署和测试新的支持机制。

论文:

AgentSims: An Open-Source Sandbox for Large Language Model Evaluation

AI多角色聊天机器人:

革新计算机科学教育的参与模式

近期,谢菲尔德大学、Microsoft Research、卡内基梅隆大学和科布伦茨大学共同发布了一项研究。该研究以 AI 为动力,通过设计创新的多角色聊天机器人,增强计算机科学教育中的学习体验与参与度。研究团队依托自我决定理论,将教师、同伴、职业指导和情感支持四种聊天机器人角色融入学习环境,满足学生在能力、自主性和相关性方面的需求。经过一个月的高等教育背景测试,与人类导师或单一机器人相比,该系统展示了积极影响。

论文:

AI Chatbots as Multi-Role Pedagogical Agents: Transforming Engagement in CS Education

MindDiffuser:

通过语义和结构扩散

从人脑中控制图像重建

将大脑记录转化为视觉刺激是一项具有意义但充满挑战的任务。尽管复杂的图像重构技术已有所突破,但在将语义和结构与图像刺激紧密融合方面仍存在挑战。为了解决这一问题,中国科学院大学、中科院自动化研究所和北京理工大学的研究人员提出了一种名为 MindDiffuser 的双阶段图像重构模型。定性和定量分析结果表明,该模型在自然场景数据集(NSD)上已超越目前最先进的模型。随后的实验结果证实了该模型的神经生物学合理性,多模态特征的可解释性与相应脑响应相吻合。

论文:

MindDiffuser: Controlled Image Reconstruction from Human Brain Activity with Semantic and Structural Diffusion

InstructZero:

黑盒大型语言模型的高效指令优化

尽管大型语言模型(LLMs)可以执行指令,但在不同情境下找到最佳指令,尤其是对于不允许反向传播的黑盒LLMs,是具有挑战性的。为了解决这个问题,马里兰大学的研究人员提出了一种名为 InstructZero 的方法。该方法通过在开源 LLMs 上优化低维软提示,生成适用于黑盒LLMs 的指令,而不是直接优化离散指令。在每次迭代中,软提示转化为指令,提交给黑盒 LLMs 进行零样本评估,并将性能发送到贝叶斯优化产生新的软提示,提高零样本性能。在多种开源 LLMs 和 API 组合上的测试中,InstructZero 在各类下游任务上的表现都超过了自动指令方法。

论文:

InstructZero: Efficient Instruction Optimization for Black-Box Large Language Models

原标题:《AI日报|姚期智团队新作:“累积推理”让大模型更聪明;Stability AI发布全新StableCode模型》

原文链接:https://www.thepaper.cn/newsDetail_forward_24168362

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部