AI
-
如何将deepseek1.5b 通过喂送资料变得 专业,聪明
要让DeepSeek 1.5B这类1.5B参数的中等规模模型通过资料训练变得更专业和聪明,需系统性融合领域知识强化、训练策略优化和工程调优。以下是完整技术方案: 一、知识注入策略(需3-5周) 1. 领域知识图谱构建 …
-
阿里通义千问登顶全球最强开源模型
国际权威大模型评测榜单LiveBench放榜,阿里巴巴最新开源的推理模型通义千问 QwQ-32B 冲入全球前五,超过 OpenAI-GPT-4.5 preview、Google-Gemini2.0、DeepSeek-R1…
-
能够微调的大模型有哪些
一、开源大模型(可直接微调) 这些模型提供完整的权重和代码,允许用户自行修改、微调和部署。 1. LLaMA 系列(Meta) 2. Falcon 系列(TII UAE) 3. BLOOM(BigScienc…
-
大型语言模型(LLM,Large Language Model)的核心原理
大型语言模型(LLM,Large Language Model)的核心原理基于深度学习和自然语言处理技术,尤其是 Transformer 架构和自监督学习。以下是其核心原理的分步解析: 1. 基础架构:Transfo…
-
18种RAG技术综合比较
我们将从一个简单的RAG方法开始,这是我们都知道的,然后测试更高级的技术,如CRAG、融合、HyDE等! 为了保持一切简单…… 我没有使用LangChain或FAISS 而是只使用基本库来代码所有技术,采用Jupyter…
-
Gemini 2.0 Flash原生图像生成
在去年12月,我们首次向可信测试人员推出了Gemini 2.0 Flash的原生图像输出功能。今天,我们将其开放给所有当前由Google AI Studio支持的地区进行开发者实验。你可以通过Google AI Stud…
-
deepseek大模型微调
一、DeepSeek 模型微调核心原理 DeepSeek 采用的 MoE(Mixture of Experts)架构 使其特别适合通过微调(Fine-tuning)实现领域适配。其微调特性包括: 二、…
-
免费商用图库!无版权、高分辨率、可商用图像素材下载
为了抓住顾客注意力、提升广告和网站成效,设计师、部落客或行销人员都经常需要收集大量的精美图像,好制作出吸睛的内容创作。不过,万一不慎使用来路不明的网络素材,可能会落得侵权被告的下场! 本文收集了 47 个免费、高品质、高…
-
Stable Diffusion 常用模型下载
常用模型下载网址推荐 目前,模型数量最多的两个网站是https://civitai.com/和https://huggingface.co/。civitai又称c站,有非常多精彩纷呈的模型,有了这些模型,我们分分钟就可以…
-
Midjourney 提示词工具(10 个国内外最好最推荐的)
Midjourney,是一个革命性的基于人工智能的艺术生成器,可以从被称为提示的简单文本描述中生成令人惊叹的图像。Midjourney已经迅速成为艺术家、设计师和营销人员的首选工具(包括像我这样根本不会设计任何东西的无能…