DeepSeek基础使用指南
本攻略适合电脑小白使用,全部来自我个人学习DeepSeek所进行的总结,学习操作所用的B站的原链接已放贴内,如有问题,亦可跟着视频操作的步骤来。
在学习操作前,我们先梳理一下Deepseek相关的一些基础概念。
- 什么是Deepseek?
1.DeepSeek的定义
定义:DeepSeek(以下简称DS)是由幻方量化公司创造的一款大语言模型人工智能,因为及其低廉的训练成本以及开源开发模式,受到全球的追捧,其R1版本性能能够媲美美国的ChatGPT模型。
2.DeepSeek的架构
基于transform架构,该架构从2017年后被广泛的运用于机器学习中,该架构的特点是为语言模型添加了“注意力机制”,能够对词汇进行串联从而实现“抓住重点,联系上下文”的作用,ChatGPT同样是基于此架构的产物。
3.DeepSeek的优势
优化了训练模型,使得AI可以以极低的成本进行训练和部署,其主要表现为:
1、具备亲和度偏置能力,可以实现均衡负载
2、采用MLA架构,可拆分模型,减少存储空间
3、FP8混合精度训练框架,可以减少显存使用
4、MTP(多token预测能力),可同时处理多个数据单元
4.DeepSeek的应用
Deepseek具备强大的搜索能力、总结以及逻辑推理能力,可用于公文辅助、工业管理、政策分析、校园学习等多项产业,此外通过API接口与其他APP对接后,亦可以辅助人员进行软件开发和维护等日常工作。
5.AI的未来趋势
自ChatGPT问世以后,AI对算力的需求已经到达一个顶峰,因此对AI开发转而走向了优化算法、降低成本方面,Deepseek的诞生正基于此,因此基于以上论述可得出结论,AI未来的发展方向将具备如下特点:
1、降低训练成本–缩小蒸馏参数
2、提高算法效率–增强推理过程
3、赋能专业领域–强化专项知识
随着AI技术的不断迭代,更多的专业领域将会得到AI技术的赋能及加持。
- 如何使用Deepseek?
最简单的是直接去官网注册一个账号,用官网的客户端进行对话。
(网址:https://www.deepseek.com/),但是由于官方访问人数过多因此会卡顿,想要更好的使用一般会考虑本地部署或者用API进行连接。
- 如何本地化部署DS
本地部署的AI将完全属于你个人,可以在不联网的情况下进行使用,但对电脑配置有极高要求。
第一步:下载一个能够部署AI的大语言模型的服务工具如Ollmam(网址:Ollama
【手机电脑都能用,DeepSeek本地部署指南!】 可按视频步骤操作:https://www.bilibili.com/video/BV1RJN3e4ETj/?share_source=copy_web&vd_source=1ec4bd2a6e39fd84684303c4d4fa2d89
第二步:安装Ollama平台并验证运行,在平台上选择需要运行的模型,模型参考请按照电脑配置进行选择,建议基础配置6G的GPU显存以及16G的内存以上再使用,低于此配置无法运行7B以上模型,不建议本地部署,因为1.5b模型运行速率太慢(配置可通过任务管理器查看Ctrl+alt+.呼出任务管理器)。
本地部署配置可参考如下表(来源B站):
第三步:在ollama官网寻找DS的运行代码,然后进入电脑的运行界面(快捷键:Ctrl+R)输入CMD回车进入命令界面,输入运行代码如:ollama run deepseek-r1:32b,(最后的数字代表你选择安装的DS模型类型)
第四步:在浏览器中下载page assist插件,此插件的作用是提供一个更好的交互界面,并且用中文运行
网址:https://www.crxsoso.com/webstore/detail/jfgfiigpkhlkbnfnbobbkinehhfdhndo
第五步:打开浏览器的拓展开发者模式,导入下载的插件,以Edge为例,路径为右上角选项-拓展-管理拓展,然后将下载的拓展软件拖入浏览器。
第六步:打开浏览器的右上角的拓展即可找到AI对话框,选择AI模型可进行对话,可在该拓展工具的设置中修改界面为中文
2.如何使用API接入DS
API接入的优势是能够让本地算力无法支撑的电脑通过联网的服务器运算,同时通过API接口可以将个人数据传输给服务器,达到使用AI进行数据处理的作用。
第一步:寻找能够支撑API的软件项目,如cherry studio 网址:Cherry Studio – 全能的AI助手,点击下载,或Chatbox(网址:https://chatbox.taizlkj.cn/)如需其他软件也可进入GitHub官网搜索,GitHub是一个面向开源及私有软件项目的托管平台
(网址:https://github.com/)
【DeepSeek API 到底怎么用?】视频链接 https://www.bilibili.com/video/BV1aWFWeyE6D/?share_source=copy_web&vd_source=1ec4bd2a6e39fd84684303c4d4fa2d89
第二步:获取找到DS的运营商获取API密钥,如DS官方、硅基流动、火山方舟、英伟达等等,以硅基流动为例,进入官网注册后即可获取API密钥。
第三步:输入API密钥,并检查是否能运行
第四步:可选择一个嵌入模型进行数据分析,如BAAI/bge-m3,在硅基流动主页模型广场即可选择嵌入模型。
第五步:在下载好的cherry studio软件硅基流动运营商里选择添加模型,把复制的嵌入模型名称粘贴进去。
第六步:在APP主页的上方选择运行的模型,我们选择deepseek R1模型可进行对话
第七步:在软件的知识库中,可将需要分析的文件或网址导入,我们选择的嵌入模型会辅助搜索,也可以直接在对话中导入文件。(注:免费版分析速度较慢,如需分析大型文件需要付费模型)
3.常用的DeepSeek国内运营商网址(截止至25年2月)
Deepseek官网:https://www.deepseek.com/
硅基流动官网:https://account.siliconflow.cn/
火山方舟官网:https://www.volcengine.com/
百度云千帆:百度智能云-云智一体深入产业
原文链接:https://blog.csdn.net/m0_59032675/article/details/145608184?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522385b9d2595f03344d9319ff8fac8de83%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=385b9d2595f03344d9319ff8fac8de83&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-5-145608184-null-null.nonecase&utm_term=deepseek%E5%91%BD%E4%BB%A4