自2022年11月ChatGPT正式上线开始,引发了新一轮全球人工智能热潮。
GPT(Generative Pre-trained Transformer)是OpenAI公司开发的一种基于Transformer架构的大型语言模型(Large Language Model)。
大语言模型作为ChatGPT的底层架构,是一种基于机器学习和自然语言处理技术的模型,通过对大量的文本数据进行训练,来学习服务人类语言理解和生成的能力。简单来说,大语言模型这个内核在学习大量文本数据的同时还进行着相关的“训练”,进而在一定程度上模拟出人类的语言认知生成过程。
大模型具有大量的参数,并采用了复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题。相对而言,传统的机器学习模型,如逻辑回归、决策树、朴素贝叶斯等,规模较小,只能处理少量的数据。深度学习模型则可以包含数百万个参数,处理海量数据。而超大规模深度学习模型甚至可以达到百亿级别的参数,需要使用超级计算机进行训练。
目前很多科技公司和机构发布了他们自己的大模型,如OpenAI发布ChatGPT-4、微软发布必应AI、Google发布Bad、百度发布 “文心一言”等。据不完全统计,目前国内包括百度、阿里、华为在内至少19家大型科技公司、科研院校和初创科技团队涉足人工智能大模型训练。
本文整理了国内外常见的AI大模型,可以测试学习。
国 内
发布机构 | 模型名称 | 模型连接 |
讯飞 | 星火大模型 | https://xinghuo. |
百度 | 文心一言 | https://yiyan.baidu.com |
阿里 | 通义千问 | https://tongyi.aliyun.com |
华为 | 盘古大模型 | https://pangu. |
清华 | 智谱清言 | https://yiyan.baidu.com |
复旦 | 大学MOSS | https://moss. |
商汤 | 商量 | https://chat. |
360 | 智脑 | https://www.so.com/zt/invite.html |
抖音 | 云雀大模型 | https://www. |
中科院 | 紫东太初 | https://xihe. |
上海人工智能实验室 | 书生通用 | https:// |
网易 | 子曰大模型 | https://aicenter.youdao.com |
天工 | AI助手 | https://tiangong. |
国 际
发布机构 | 模型名称 | 模型连接 |
OpenAI | ChatGPT | https://chat. |
微软 | 必应AI | https://www.bing.com/new |
Anthropic | Claude | https://www. |
Anthropic | Claude 2 | https:///chats |
Bad | https://bard.google.com | |
Poe | AI聊天 | https:// |
Character.AI | Character.AI | https://www. |
Neeva | Neeva | https:// |
原文链接:http://www.360doc.com/content/23/0925/19/82909108_1097874297.shtml