-
如何将deepseek1.5b 通过喂送资料变得 专业,聪明
要让DeepSeek 1.5B这类1.5B参数的中等规模模型通过资料训练变得更专业和聪明,需系统性融合领域知识强化、训练策略优化和工程调优。以下是完整技术方案: 一、知识注入策略(需3-5周) 1. 领域知识图谱构建 …
-
deepseek大模型微调
一、DeepSeek 模型微调核心原理 DeepSeek 采用的 MoE(Mixture of Experts)架构 使其特别适合通过微调(Fine-tuning)实现领域适配。其微调特性包括: 二、…