人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

小米 AI 大模型 MiLM-6B 曝光

2023-10-18 164

小米 AI 大模型 MiLM-6B 首次曝光

小米公司近日公布了其研发的人工智能大模型 MiLM-6B,这是小米史上首个 GPT 大模型产品,参数规模达到 64 亿,超过了阿里云、OpenAI 等知名机构的同类产品。MiLM-6B 在 C-Eval 和 CMMLU 两个综合汉语模型评测榜单上均取得了同参数量级的最好效果,展现出了强大的语言理解和生成能力。

小米 AI 大模型 MiLM-6B 曝光插图

C-Eval 是清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件,包含了 STEM、社会科学和人文学科等 41 个不同领域和难度级别的测试科目。MiLM-6B 在 C-Eval 总榜单上排名第 10,平均分为 60.2 分,同参数量级排名第 1。在具体各科目成绩上,MiLM-6B 在计量师、物理、化学、生物等多个科目中获得了较高的准确率,而在法学、数学、编程等涉及抽象思维的科目中还有一定进步空间。

小米 AI 大模型 MiLM-6B 曝光插图1

CMMLU 是综合汉语模型基准,旨在评估模型的知识和推理能力,包含了常识推理、数学推理、逻辑推理等多个任务。MiLM-6B 在 CMMLU 上的表现也十分亮眼,在零样本和五样本测试中的平均得分分别为 60.37 分和 57.17 分,远高于其他参评模型。

小米 AI 大模型 MiLM-6B 曝光插图2

据悉,小米 AI 大模型团队成立于今年 4 月,由栾剑带队向王斌汇报。王斌是小米 AI 实验室的负责人,曾在中科院从事了 20 多年自然语言处理相关的研究和开发工作。王斌曾表示,小米会去自研通用语言大模型,但不会单独发布一款类 ChatGPT 的产品,而是会与业务深度结合,利用丰富的应用场景反哺大模型能力。

小米 CEO 雷军也曾透露,公司正在研发一些技术和产品,等打磨好了再给大家演示。小米集团总裁卢伟冰称,小米目前拥有超过 1200 人的 AI 团队,会积极拥抱大模型。小米将会于 8 月 14 日举行 2023 雷军年度演讲,届时或许会有更多关于 MiLM-6B 的信息公布。

举报/反馈

原文链接:https://baijiahao.baidu.com/s?id=1774072619122829905&wfr=spider&for=pc

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部