分类：DeepSeek 应用开发实战

6、进阶部署（二）：非量化版DeepSeek分布式部署方案实战

你好，我是邢云阳。前面两节课，我们完成了私有化部署的入门。我们学到了一种非常简单的易上手的方案，即利用网关 + 多个 Ollama 实现负载均衡的大模型集群的方案。这种方案的本质还是单卡单模型，但通过负载均衡技术，可以将一次对话任务，分配到多个模型...

2026-01-24

7、进阶部署（三）：非量化版 DeepSeek 分布式部署方案实战

你好，我是邢云阳。在上节课中，我们学习了 DeepSeek 官方在做私有化部署时，推荐的一个工具，也就是 vLLM。通过学习 vLLM，想必你对分布式部署是怎么回事儿，已经有了初步感知。今天，我们将学习另一个组件——Ray。随后，我们将在一台配备...

2026-01-24

8、llama.cpp部署：无GPU服务器如何部署DeepSeek

你好，我是邢云阳。经过几节课的学习，我们已经掌握了两种行业主流的模型部署方式。但其实对于大多数普通同学来说，前面两种方式很难长期使用，毕竟 GPU 卡实在是太贵了，普通人根本消费不起。大模型动辄数十上百亿的参数，对运行机器的内存提出了很高的要求，...

2026-01-24

9、体验微调：微调DeepSeek、R1大模型，实现新闻分类器

你好，我是邢云阳。通过前面的学习，相信你对常用的几种模型部署方案已经有所了解。这一章剩余的两节课我会分别带你实操一下微调和蒸馏，让你对于这项技术有一个直观的概念。这节课我们先来看微调。什么是微调？所谓微调，就是对模型进行微微的调整。我举一个例子，...

2026-01-24

10、体验蒸馏：如何蒸馏一个自己的DeepSeek、R1大模型

你好，我是邢云阳。上节课，我带领你借助开源大模型微调工具 LLama-Factory 对 DeepSeek-R1-Distill-Qwen-7B 进行了微调，实现了新闻分类器的效果。通过这样一个挺有意思的小案例，想必你也感受到了微调的魅力。这节课我...

2026-01-24

11、凤雏来了：什么是模型上下文协议MCP

你好，我是邢云阳。在前置课程的第二节课，我曾经为你讲解了 Agent 技术。我们抛开思维链不谈，Agent 最牛的是能够通过调用工具实现大模型与外界环境的交互，让大模型不再“闭关锁国”。 Agent在 24 年得到了人们广泛认可，发展得十分迅速，现...

2026-01-24