自ChatGPT发布以来,通用大模型就仿佛坐了火箭,短短几个月的时间,各大企业便争相发布自己的大模型,这其实也反应了目前人工智能发展的方向。
不过从长远来看,垂直领域大模型的发展会比通用大模型更具势头,一是通用大模型有GPT4这座难以跨越的大山,二是自研通用大模型的成本实在太高,一般公司承受不来。
目前,无论是通用大模型还是垂直领域大模型,都已经有了相当多的成果。那今天咱们就来简单盘点一些比较出名的通用/垂直领域大模型。
当然啦~相关论文资料学姐也给打包了,还附赠一份超详细的垂直领域大模型思维图谱!
扫码添加小享,回复“大模型PK”
免费领取全部论文合集+思维导图
通用大模型
国内:
1.文心一言
网址:https://yiyan.baidu.com/
使用评价:在文学创作上回答的挺全面,数学解答能力有点不太行,代码生成和理解能力有待提升。
2.通义千问
网址:https://qianwen.aliyun.com/
使用评价:文学创作也很不错,翻译和数学问题回答的也可以,代码颇具优势。
3.讯飞星火
网址:https://xinghuo.xfyun.cn/desk
使用评价:首先它这个审核速度我是满意的,两天就通过可以上手玩耍了,代码解释能力不错,但是写代码还是差点意思。
4.天工
网址:https://tiangong.kunlun.com/
使用评价:文学创作能力也在线,多轮对话不错,数理问题也能做,代码能力整体也是一般。
5.360智脑
网址:https://chat.360.cn/index?src=invite
使用评价:这个也是申请了好久,刚刚才通过,我都快忘了…简单试用了一下,数理问题复杂点的不太行,代码编程能力还不错。
国外:
1.ChatGPT
网址:https://chat.openai.com/
使用评价:这还需要学姐评价嘛(doge)
2.new bing
网址:https://www.bing.com/
使用评价:这么说吧,学姐现在找论文基本都用它。
3.Claude
网址:https://app.slack.com/
使用评价:用Claude需要先注册一个slack号,然后才能使用。好处是登录之后就不用再用魔法了,而且用它来辅助阅读论文是真不错~
PS:还能给Claude改名哦~
4.Bard
网址:https://bard.google.com/
使用评价:这个学姐用的少,用的时候还不支持中文,创造力不如GPT,其他能力还是可以的。
扫码添加小享,回复“大模型PK”
免费领取全部论文合集+思维导图
垂直领域大模型
1.BloombergGPT 金融大模型
-
原始论文:BloombergGPT: A Large Language Model for Finance
BloombergGPT是由彭博社开发的拥有500亿参数的语言模型。依托彭博社的大量金融数据源,BloombergGPT构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。
作为首个金融垂直领域大模型,BloombergGPT同样基于transformer架构,采用译码器的技术。实验可得,BloombergGPT在执行金融任务方面的表现超过了现有的通用 LLM模型。
2.FinBERT金融大模型
-
原始论文:FinBERT: A Large Language Model for Extracting Information from Financial Text*
FinBERT同样是适用于金融领域的大型语言模型,采用了两大类预训练任务:字词级别的预训练和任务级别的预训练。具体来说,FinBERT有以下内容:
-
FinBERT-Pretrained:针对大规模金融文本的预训练 FinBERT 模型。
-
FinBERT-Sentiment:用于情感分类任务。
-
FinBERT-ESG:用于 ESG 分类任务。
-
FinBERT-FLS:用于前瞻性陈述(FLS)分类任务。
实验表明FinBERT在识别与环境、社会和治理问题相关的讨论方面优于其他模型。
3.LaWGPT 中文法律知识模型
-
项目地址:https://github.com/pengxiao-song/LaWGPT/
LaWGPT 目前也是比较热门的垂直领域大模型之一了,它是一系列基于中文法律知识的开源大语言模型。
该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。
放张官方图感受一下:
4.BenTsao 中文医学模型
-
项目地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese
原名华佗(HuaTuo),是一个基于中文医学知识的LLaMA-7B微调模型,通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,在此基础上对LLaMA进行指令微调。
目前这个模型只开放针对"肝癌"单个疾病训练的模型参数,开发团队表示后期会针对“肝胆胰”相关16种疾病训练模型。
5.MathGPT 数学大模型
MathGPT是学而思自研,以数学领域的解题和讲题算法为核心的数学大模型,目前官方表示今年内将推出基于该自研大模型的产品级应用,可以等待一波。
扫码添加小享,回复“大模型PK”
免费领取全部论文合集+思维导图
原文链接:https://www.bilibili.com/read/cv24567471/