6、进阶部署(二):非量化版DeepSeek分布式部署方案实战你好,我是邢云阳。 前面两节课,我们完成了私有化部署的入门。我们学到了一种非常简单的易上手的方案,即利用网关 + 多个 Ollama 实现负载均衡的大模型集群的方案。这种方案的本质还是单卡单模型,但通过负载均衡技术,可以将一次对话任务,分配到多个模型...2026-01-24DeepSeek 应用开发实战
7、进阶部署(三):非量化版 DeepSeek 分布式部署方案实战你好,我是邢云阳。 在上节课中,我们学习了 DeepSeek 官方在做私有化部署时,推荐的一个工具,也就是 vLLM。通过学习 vLLM,想必你对分布式部署是怎么回事儿,已经有了初步感知。 今天,我们将学习另一个组件——Ray。随后,我们将在一台配备...2026-01-24DeepSeek 应用开发实战
8、llama.cpp部署:无GPU服务器如何部署DeepSeek你好,我是邢云阳。 经过几节课的学习,我们已经掌握了两种行业主流的模型部署方式。但其实对于大多数普通同学来说,前面两种方式很难长期使用,毕竟 GPU 卡实在是太贵了,普通人根本消费不起。 大模型动辄数十上百亿的参数,对运行机器的内存提出了很高的要求,...2026-01-24DeepSeek 应用开发实战
9、体验微调:微调DeepSeek、R1大模型,实现新闻分类器你好,我是邢云阳。 通过前面的学习,相信你对常用的几种模型部署方案已经有所了解。这一章剩余的两节课我会分别带你实操一下微调和蒸馏,让你对于这项技术有一个直观的概念。这节课我们先来看微调。 什么是微调?所谓微调,就是对模型进行微微的调整。我举一个例子,...2026-01-24DeepSeek 应用开发实战
10、体验蒸馏:如何蒸馏一个自己的DeepSeek、R1大模型你好,我是邢云阳。 上节课,我带领你借助开源大模型微调工具 LLama-Factory 对 DeepSeek-R1-Distill-Qwen-7B 进行了微调,实现了新闻分类器的效果。通过这样一个挺有意思的小案例,想必你也感受到了微调的魅力。这节课我...2026-01-24DeepSeek 应用开发实战
11、凤雏来了:什么是模型上下文协议MCP你好,我是邢云阳。 在前置课程的第二节课,我曾经为你讲解了 Agent 技术。我们抛开思维链不谈,Agent 最牛的是能够通过调用工具实现大模型与外界环境的交互,让大模型不再“闭关锁国”。 Agent在 24 年得到了人们广泛认可,发展得十分迅速,现...2026-01-24DeepSeek 应用开发实战