+1
-1
@@ -130,7 +130,7 @@ export default defineConfig({
|
||||
lastUpdated: "最近更新",
|
||||
|
||||
// GitHub 仓库位置
|
||||
repo: "liyupi/codefather",
|
||||
repo: "liyupi/ai-guide",
|
||||
docsBranch: "master",
|
||||
|
||||
// 编辑链接
|
||||
|
||||
+6
-6
@@ -6,27 +6,27 @@ export default [
|
||||
items: [
|
||||
{
|
||||
text: "关于DeepSeek",
|
||||
link: "/关于DeepSeek/",
|
||||
link: "/Deepseek/#关于deepseek",
|
||||
},
|
||||
{
|
||||
text: "DeepSeek 使用指南",
|
||||
link: "/DeepSeek使用指南/",
|
||||
link: "/Deepseek/#deepseek使用指南",
|
||||
},
|
||||
{
|
||||
text: "DeepSeek 应用场景",
|
||||
link: "/DeepSeek应用场景/",
|
||||
link: "/Deepseek/#deepseek应用场景",
|
||||
},
|
||||
{
|
||||
text: "DeepSeek 资源汇总",
|
||||
link: "/DeepSeek资源汇总/",
|
||||
link: "/Deepseek/#deepseek资源汇总",
|
||||
},
|
||||
{
|
||||
text: "DeepSeek 技术解析",
|
||||
link: "/DeepSeek技术解析/",
|
||||
link: "/Deepseek/#deepseek技术解析",
|
||||
},
|
||||
{
|
||||
text: "DeepSeek 行业资讯",
|
||||
link: "/Deepseek行业资讯/",
|
||||
link: "/Deepseek/#deepseek行业资讯",
|
||||
},
|
||||
],
|
||||
},
|
||||
|
||||
@@ -22,43 +22,50 @@ function genReadme(directory) {
|
||||
// 递归生成 Markdown 内容
|
||||
function generateContent(directory, dirName) {
|
||||
let content = `# ${dirName}\n\n`;
|
||||
content += `> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)\n\n`;
|
||||
content += `> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)\n\n`;
|
||||
|
||||
// 处理当前目录下的 Markdown 文件
|
||||
const files = getFilesInDirectory(directory);
|
||||
if (files.length > 0) {
|
||||
for (let i = 0; i < Math.min(files.length, 100); i++) {
|
||||
const file = files[i];
|
||||
// 跳过 README.md 文件
|
||||
if (path.basename(file).toLowerCase() === "readme.md") {
|
||||
continue;
|
||||
}
|
||||
const relativePath = path.relative(directory, file)?.replaceAll(" ", "%20");
|
||||
content += `[${path.basename(file, ".md")}](${relativePath})\n\n`;
|
||||
}
|
||||
}
|
||||
|
||||
// 处理子目录
|
||||
// 获取所有一级子目录
|
||||
const subDirs = getSubDirectories(directory);
|
||||
|
||||
// 循环处理每个一级子目录
|
||||
for (const subDir of subDirs) {
|
||||
const subDirName = path.basename(subDir);
|
||||
|
||||
// content += `## [${subDirName}](/${dirName}/${subDirName.replaceAll(" ", "%20")}/)\n`;
|
||||
content += `## ${subDirName} \n`;
|
||||
const subDirFiles = getFilesInDirectory(subDir);
|
||||
for (let i = 0; i < Math.min(subDirFiles.length, 10); i++) {
|
||||
content += `## ${subDirName}\n\n`;
|
||||
|
||||
// 递归获取子目录下的所有 Markdown 文件
|
||||
const subDirFiles = getFilesInDirectory(subDir).sort((a, b) => a.length - b.length);
|
||||
|
||||
for (let i = 0; i < Math.min(subDirFiles.length, 100); i++) {
|
||||
const file = subDirFiles[i];
|
||||
|
||||
// 跳过 README.md 文件
|
||||
if (path.basename(file).toLowerCase() === "readme.md") {
|
||||
continue;
|
||||
}
|
||||
|
||||
const relativePath = path.relative(directory, file)?.replaceAll(" ", "%20");
|
||||
content += `[${path.basename(file, ".md")}](${relativePath})\n\n`;
|
||||
}
|
||||
}
|
||||
|
||||
// 处理当前目录下的 Markdown 文件
|
||||
// const files = getFilesInDirectory(directory);
|
||||
// if (files.length > 0) {
|
||||
// content += `## 当前目录文件\n\n`;
|
||||
// for (let i = 0; i < Math.min(files.length, 100); i++) {
|
||||
// const file = files[i];
|
||||
// // 跳过 README.md 文件
|
||||
// if (path.basename(file).toLowerCase() === "readme.md") {
|
||||
// continue;
|
||||
// }
|
||||
// const relativePath = path.relative(directory, file)?.replaceAll(" ", "%20");
|
||||
// content += `[${path.basename(file, ".md")}](${relativePath})\n\n`;
|
||||
// }
|
||||
// }
|
||||
|
||||
// 添加底部内容
|
||||
content += `> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)\n\n`;
|
||||
content += `> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)\n\n`;
|
||||
|
||||
return content;
|
||||
}
|
||||
|
||||
@@ -1,136 +0,0 @@
|
||||
const fs = require("fs");
|
||||
const path = require("path");
|
||||
|
||||
function generateSidebarConfig(dirPath) {
|
||||
const absolutePath = path.resolve(process.cwd(), dirPath);
|
||||
const sidebarItems = [];
|
||||
|
||||
// 如果根目录有 README.md,添加空字符串
|
||||
if (fs.existsSync(path.join(absolutePath, "README.md"))) {
|
||||
sidebarItems.push("");
|
||||
}
|
||||
|
||||
// 读取目录内容
|
||||
function scanDirectory(currentPath, relativeDirPath = "") {
|
||||
const items = [];
|
||||
const files = fs.readdirSync(currentPath);
|
||||
|
||||
files.forEach((file) => {
|
||||
const fullPath = path.join(currentPath, file);
|
||||
const stat = fs.statSync(fullPath);
|
||||
|
||||
if (stat.isFile() && file.endsWith(".md") && file !== "README.md") {
|
||||
// 如果有相对路径,添加相对路径
|
||||
const relativePath = relativeDirPath
|
||||
? `${relativeDirPath}/${file.replace(".md", "")}`
|
||||
: file.replace(".md", "");
|
||||
items.push(relativePath);
|
||||
}
|
||||
});
|
||||
|
||||
return items.sort();
|
||||
}
|
||||
|
||||
// 检查目录是否包含子目录
|
||||
function hasSubDirectories(dirPath) {
|
||||
const items = fs.readdirSync(dirPath);
|
||||
return items.some((item) => {
|
||||
const fullPath = path.join(dirPath, item);
|
||||
return fs.statSync(fullPath).isDirectory();
|
||||
});
|
||||
}
|
||||
|
||||
// 处理目录
|
||||
function processDirectory(currentPath, isRoot = true) {
|
||||
const dirs = fs.readdirSync(currentPath, { withFileTypes: true });
|
||||
|
||||
// 如果当前目录只包含文件(没有子目录)
|
||||
if (!hasSubDirectories(currentPath)) {
|
||||
const files = scanDirectory(currentPath);
|
||||
if (files.length > 0) {
|
||||
sidebarItems.push({
|
||||
title: path.basename(currentPath),
|
||||
collapsable: false,
|
||||
children: files,
|
||||
});
|
||||
}
|
||||
return;
|
||||
}
|
||||
|
||||
// 处理包含子目录的情况
|
||||
dirs.forEach((dir) => {
|
||||
if (dir.isDirectory() && !dir.name.startsWith(".")) {
|
||||
const fullPath = path.join(currentPath, dir.name);
|
||||
const children = [];
|
||||
|
||||
// 扫描子目录中的文件
|
||||
function scanSubDirectory(subPath, relPath) {
|
||||
const subItems = fs.readdirSync(subPath);
|
||||
subItems.forEach((item) => {
|
||||
const itemPath = path.join(subPath, item);
|
||||
const itemStat = fs.statSync(itemPath);
|
||||
|
||||
if (itemStat.isFile() && item.endsWith(".md")) {
|
||||
if (item === "README.md") {
|
||||
// children.push(`${relPath}/`);
|
||||
} else {
|
||||
// 如果包含特殊字符
|
||||
if (item.includes("!")) {
|
||||
children.push(`${relPath}/${encodeURI(item.replace(".md", ""))}`);
|
||||
} else {
|
||||
children.push(`${relPath}/${item.replace(".md", "")}`);
|
||||
}
|
||||
}
|
||||
} else if (itemStat.isDirectory()) {
|
||||
scanSubDirectory(itemPath, `${relPath}/${item}`);
|
||||
}
|
||||
});
|
||||
}
|
||||
|
||||
scanSubDirectory(fullPath, `${dir.name}`);
|
||||
|
||||
if (children.length > 0) {
|
||||
sidebarItems.push({
|
||||
title: dir.name,
|
||||
collapsable: true,
|
||||
children: children.sort(),
|
||||
});
|
||||
}
|
||||
}
|
||||
});
|
||||
}
|
||||
|
||||
processDirectory(absolutePath);
|
||||
return sidebarItems;
|
||||
}
|
||||
|
||||
// 接收命令行参数
|
||||
const targetDir = process.argv[2] || ".";
|
||||
|
||||
try {
|
||||
// 检查目录是否存在
|
||||
if (!fs.existsSync(targetDir)) {
|
||||
throw new Error(`目录 "${targetDir}" 不存在`);
|
||||
}
|
||||
|
||||
// 生成配置
|
||||
const sidebarConfig = generateSidebarConfig(targetDir);
|
||||
|
||||
// 生成 TypeScript 代码
|
||||
const tsContent = `// 自动生成的侧边栏配置
|
||||
|
||||
export default ${JSON.stringify(sidebarConfig, null, 2)};
|
||||
|
||||
`;
|
||||
|
||||
// 写入文件
|
||||
fs.writeFileSync("temp.ts", tsContent, "utf-8");
|
||||
console.log("侧边栏配置已生成到 temp.ts 文件中");
|
||||
|
||||
// 输出生成的配置预览
|
||||
console.log("\n生成的配置预览:");
|
||||
console.log(JSON.stringify(sidebarConfig, null, 2));
|
||||
} catch (error) {
|
||||
console.error("错误:", error instanceof Error ? error.message : "未知错误");
|
||||
process.exit(1);
|
||||
}
|
||||
@@ -0,0 +1,99 @@
|
||||
const fs = require("fs");
|
||||
const path = require("path");
|
||||
|
||||
function generateSidebarConfig(dirPath) {
|
||||
// 将相对路径转为绝对路径
|
||||
const absolutePath = path.resolve(process.cwd(), dirPath);
|
||||
// 创建一个数组,存储 侧边栏目录列表
|
||||
let sidebarItems = [];
|
||||
// 如果根目录存在 README.md ,添加空字符串
|
||||
if (fs.existsSync(path.join(absolutePath, "README.md"))) {
|
||||
sidebarItems.push("");
|
||||
}
|
||||
|
||||
/**
|
||||
* 递归的处理目录
|
||||
* @param {*} currentPath 当前的目录
|
||||
* @param {*} relativePath 当前目录的相对路径
|
||||
* @param {*} config 当前的配置
|
||||
*/
|
||||
function processDirectory(currentPath, relativePath = "", config = sidebarItems) {
|
||||
// 获取目录下的所有文件
|
||||
const items = fs.readdirSync(currentPath, { withFileTypes: true });
|
||||
// 文件列表
|
||||
const files = [];
|
||||
// 目录列表
|
||||
const directories = [];
|
||||
// 遍历 items 得到所有的文件和目录
|
||||
items.forEach((item) => {
|
||||
if (item.isDirectory() && !item.name.startsWith(".")) {
|
||||
directories.push(item);
|
||||
} else if (item.isFile() && item.name.endsWith(".md") && item.name !== "README.md") {
|
||||
files.push(item);
|
||||
}
|
||||
});
|
||||
// 处理文件
|
||||
if (files.length > 0) {
|
||||
const filePaths = files.map((file) => {
|
||||
const filePath = relativePath
|
||||
? `${relativePath}/${file.name.replace(".md", "")}`
|
||||
: file.name.replace(".md", "");
|
||||
return filePath;
|
||||
});
|
||||
// 将文件路径添加到 config 中
|
||||
|
||||
filePaths
|
||||
.sort((a, b) => a.length - b.length)
|
||||
.forEach((filePath) => {
|
||||
config.push(filePath);
|
||||
});
|
||||
}
|
||||
if (directories.length > 0) {
|
||||
directories.forEach((dir) => {
|
||||
const subDirectoryPath = path.join(currentPath, dir.name);
|
||||
const newRelativePath = relativePath ? `${relativePath}/${dir.name}` : dir.name;
|
||||
|
||||
// 查找当前目录是否已经存在于配置中
|
||||
let existingDir = config.find((item) => item.title === dir.name);
|
||||
if (!existingDir) {
|
||||
existingDir = {
|
||||
title: dir.name,
|
||||
collapsable: true,
|
||||
children: [],
|
||||
};
|
||||
config.push(existingDir);
|
||||
}
|
||||
|
||||
processDirectory(subDirectoryPath, newRelativePath, existingDir.children); // 传递 existingDir.children 作为 config
|
||||
});
|
||||
}
|
||||
}
|
||||
processDirectory(absolutePath);
|
||||
// 返回计算得到的 sidebar 数组
|
||||
return sidebarItems;
|
||||
}
|
||||
|
||||
// 接收命令行参数:相对路径;默认使用当前目录作为兜底
|
||||
|
||||
const targetDir = process.argv[2] || ".";
|
||||
|
||||
try {
|
||||
// 检查目录是否存在
|
||||
const isExisting = fs.existsSync(targetDir);
|
||||
if (!isExisting) {
|
||||
throw new Error(`目录 “${targetDir}” 不存在`);
|
||||
}
|
||||
// 目录存在,生成 sidebar 配置数组
|
||||
const sidebarConfig = generateSidebarConfig(targetDir);
|
||||
// 输出内容到 temp.ts 中
|
||||
const content = `
|
||||
export default ${JSON.stringify(sidebarConfig, null, 2)}
|
||||
`;
|
||||
const fileName = "temp.ts";
|
||||
fs.writeFileSync(fileName, content, "utf-8");
|
||||
// 提示生成成功
|
||||
console.log(`侧边栏配置已经生成到 ${fileName} 文件中`);
|
||||
} catch (error) {
|
||||
console.error("错误:", error instanceof Error ? error.message : "未知错误");
|
||||
process.exit(1);
|
||||
}
|
||||
+2
-12
@@ -1,18 +1,8 @@
|
||||
import { SidebarConfig4Multiple } from "vuepress/config";
|
||||
import AboutDeeepseek from "./sidebars/aboutDeepseek";
|
||||
import DeeepseekTechAnalysis from "./sidebars/deepseekTechAnalysis";
|
||||
import DeeepseekUseGuide from "./sidebars/deepseekUseGuide";
|
||||
import DeeepseekInfo from "./sidebars/deepseekInfo";
|
||||
import DeeepseekApp from "./sidebars/deepseekApp";
|
||||
import DeeepseekSource from "./sidebars/deepseekSource";
|
||||
import Deepseek from "./sidebars/deepseekSidebar";
|
||||
// @ts-ignore
|
||||
export default {
|
||||
"/关于DeepSeek/": AboutDeeepseek,
|
||||
"/DeepSeek技术解析/": DeeepseekTechAnalysis,
|
||||
"/DeepSeek使用指南/": DeeepseekUseGuide,
|
||||
"/Deepseek行业资讯/": DeeepseekInfo,
|
||||
"/DeepSeek应用场景/": DeeepseekApp,
|
||||
"/DeepSeek资源汇总/": DeeepseekSource,
|
||||
"/Deepseek/": Deepseek,
|
||||
// 降级,默认根据文章标题渲染侧边栏
|
||||
"/": "auto",
|
||||
} as SidebarConfig4Multiple;
|
||||
|
||||
@@ -1,9 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
{
|
||||
title: "关于DeepSeek",
|
||||
collapsable: false,
|
||||
children: ["什么是 DeepSeek?有什么核心功能?", "DeepSeek 发展历程", "DeepSeek 创始团队介绍"],
|
||||
},
|
||||
];
|
||||
@@ -1,58 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "DeepSeek + 内容创作",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek + 内容创作/3秒让DeepSeek写出爆款小红书",
|
||||
"DeepSeek + 内容创作/人有多大胆,地有多大产:如何用DeepSeek写长篇小说-虎嗅网",
|
||||
"DeepSeek + 内容创作/如何利用DeepSeek进行高效内容创作",
|
||||
"DeepSeek + 内容创作/用DeepSeek做小红书真的太牛了!轻轻松松打造爆款笔记",
|
||||
"DeepSeek + 内容创作/用DeepSeek写文章?这4个骚操作让你躺平也能出爆款!(含提示词)",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 创意设计",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek + 创意设计/DeepSeek一句话搞定修图难题",
|
||||
"DeepSeek + 创意设计/deepseek+数字人王炸组合使用方法",
|
||||
"DeepSeek + 创意设计/用 deepseek 做 AI 视频,绝了,和抄作业一样简单!",
|
||||
"DeepSeek + 创意设计/绝绝子!用deepseek做AI视频,涨粉10W+(附保姆级教程)",
|
||||
"DeepSeek + 创意设计/这怕是全网最强的 DeepSeek 图片教程吧,赶紧收藏了!",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 办公效率",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek + 办公效率/DeepSeek R1 + 个人知识库,直接起飞!",
|
||||
"DeepSeek + 办公效率/DeepSeek嵌入到Excel,提升10倍工作效率,太牛了!",
|
||||
"DeepSeek + 办公效率/DeepSeek配合KIMI,自动生成PPT,感觉自己要失业了!",
|
||||
"DeepSeek + 办公效率/WPS里装上deepseek,简直就是办公神器",
|
||||
"DeepSeek + 办公效率/利用deepseek建立专属销售知识库",
|
||||
"DeepSeek + 办公效率/如何用DeepSeek更高效地工作:10个实用技巧",
|
||||
"DeepSeek + 办公效率/手把手教你在word中接入deepseek,秒生文档材料",
|
||||
"DeepSeek + 办公效率/法律人保姆级deepseek使用指南(附指令版)",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 理财",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek + 理财/普通人如何通过炒股买基金赚到100万?",
|
||||
"DeepSeek + 理财/用Deepseek回答:如果有100万闲钱,几年内不用,该怎么理财?",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 编程开发",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek + 编程开发/DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!",
|
||||
"DeepSeek + 编程开发/DeepSeek装进VSCode,编程非常丝滑!",
|
||||
"DeepSeek + 编程开发/教你用DeepSeek+Clien,从0到1开发一个APP",
|
||||
],
|
||||
},
|
||||
];
|
||||
@@ -1,37 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "Deepseek行业资讯",
|
||||
collapsable: false,
|
||||
children: [
|
||||
"DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入",
|
||||
"DeepSeek“金融朋友圈” 从“争先”到“恐后”,从“好用”到“用好”",
|
||||
"DeepSeek如何搅动AI产业?",
|
||||
"DeepSeek宣布涨价!",
|
||||
"DeepSeek带飞科大讯飞?",
|
||||
"DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事",
|
||||
"DeepSeek被封杀了",
|
||||
"DeepSeek预测:未来10年,就业前景最好的10个专业",
|
||||
"DeepSeek,紧急声明",
|
||||
"vivo与荣耀相继接入DeepSeek:AI深度融合引领手机创新潮流",
|
||||
"vivo官宣:将深度融合满血版DeepSeek",
|
||||
"不在场的DeepSeek,是巴黎AI峰会真正的主角",
|
||||
"争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?",
|
||||
"价值千万美元的“AI.com”,会是谁给DeepSeek公司使用的呢",
|
||||
"外资机构看DeepSeek:提振中国股市 机会藏在这些领域",
|
||||
"多家车企接入AI大模型DeepSeek 智能汽车再进一步",
|
||||
"如何利用DeepSeek翻身?抓住AI红利,普通人也能逆袭的3个方向",
|
||||
"日本如何看待Deepseek",
|
||||
"深度求索正在物色韩国人工智能人才,展开确保人才的战争",
|
||||
"清华大学:普通人如何抓住DeepSeek红利2025",
|
||||
"点赞收藏!DeepSeek在GitHub星标量已超OpenAI",
|
||||
"爆冷,DeepSeek出局,苹果AI国行版将与阿里合作",
|
||||
"看短剧、“交朋友”,DeepSeek挤进中老年社交圈",
|
||||
"被DeepSeek刺激到了?文心一言、ChatGPT同时宣布:免费! ",
|
||||
"运营商全面接入DeepSeek意味着什么?",
|
||||
"雷军:钦佩DeepSeek取得的成就,每个人可能都要学习AI知识",
|
||||
],
|
||||
},
|
||||
];
|
||||
@@ -0,0 +1,167 @@
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "关于DeepSeek",
|
||||
collapsable: true,
|
||||
children: ["关于DeepSeek/什么是 DeepSeek", "关于DeepSeek/DeepSeek 发展历程", "关于DeepSeek/DeepSeek 创始团队介绍"],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek使用指南",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek使用指南/🔥DeepSeek 小白快速上手指南",
|
||||
"DeepSeek使用指南/DeepSeek 本地部署教程",
|
||||
"DeepSeek使用指南/DeepSeek API 使用指南",
|
||||
"DeepSeek使用指南/DeepSeek 多种使用连接方式推荐",
|
||||
"DeepSeek使用指南/官方 DeepSeek R1 满血版使用指南",
|
||||
"DeepSeek使用指南/如何在iPhone上用语音调用Deepseek",
|
||||
"DeepSeek使用指南/普通人能用DeepSeek做什么?20个实用建议",
|
||||
{
|
||||
title: "DeepSeek 提问技巧",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek使用指南/DeepSeek 提问技巧/DeepSeek 提示词基本法则",
|
||||
"DeepSeek使用指南/DeepSeek 提问技巧/吐血整理!DeepSeek神级指令,好用到爆!",
|
||||
"DeepSeek使用指南/DeepSeek 提问技巧/DeepSeek不好用?那是你还不知道这些指令!",
|
||||
"DeepSeek使用指南/DeepSeek 提问技巧/普通人也能轻松掌握的 20 个 DeepSeek 高频提示词(2025版)",
|
||||
],
|
||||
},
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek应用场景",
|
||||
collapsable: true,
|
||||
children: [
|
||||
{
|
||||
title: "DeepSeek + 内容创作",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek应用场景/DeepSeek + 内容创作/3秒让DeepSeek写出爆款小红书",
|
||||
"DeepSeek应用场景/DeepSeek + 内容创作/如何利用DeepSeek进行高效内容创作",
|
||||
"DeepSeek应用场景/DeepSeek + 内容创作/人有多大胆,地有多大产:如何用DeepSeek写长篇小说",
|
||||
"DeepSeek应用场景/DeepSeek + 内容创作/用DeepSeek做小红书真的太牛了!轻轻松松打造爆款笔记",
|
||||
"DeepSeek应用场景/DeepSeek + 内容创作/用DeepSeek写文章?这4个骚操作让你躺平也能出爆款!(含提示词)",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 创意设计",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek应用场景/DeepSeek + 创意设计/DeepSeek一句话搞定修图难题",
|
||||
"DeepSeek应用场景/DeepSeek + 创意设计/deepseek+数字人王炸组合使用方法",
|
||||
"DeepSeek应用场景/DeepSeek + 创意设计/这怕是全网最强的 DeepSeek 图片教程吧,赶紧收藏了!",
|
||||
"DeepSeek应用场景/DeepSeek + 创意设计/用 deepseek 做 AI 视频,绝了,和抄作业一样简单!",
|
||||
"DeepSeek应用场景/DeepSeek + 创意设计/绝绝子!用deepseek做AI视频,涨粉10W+(附保姆级教程)",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 办公效率",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/利用deepseek建立专属销售知识库",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/WPS里装上deepseek,简直就是办公神器",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/法律人保姆级deepseek使用指南(附指令版)",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/DeepSeek R1 + 个人知识库,直接起飞!",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/如何用DeepSeek更高效地工作:10个实用技巧",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/手把手教你在word中接入deepseek,秒生文档材料",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/DeepSeek嵌入到Excel,提升10倍工作效率,太牛了!",
|
||||
"DeepSeek应用场景/DeepSeek + 办公效率/DeepSeek配合KIMI,自动生成PPT,感觉自己要失业了!",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 理财",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek应用场景/DeepSeek + 理财/普通人如何通过炒股买基金赚到100万?",
|
||||
"DeepSeek应用场景/DeepSeek + 理财/用Deepseek回答:如果有100万闲钱,几年内不用,该怎么理财?",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek + 编程开发",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek应用场景/DeepSeek + 编程开发/DeepSeek装进VSCode,编程非常丝滑!",
|
||||
"DeepSeek应用场景/DeepSeek + 编程开发/教你用DeepSeek+Clien,从0到1开发一个APP",
|
||||
"DeepSeek应用场景/DeepSeek + 编程开发/DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!",
|
||||
],
|
||||
},
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek资源汇总",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek资源汇总/DeepSeek 学习资料",
|
||||
"DeepSeek资源汇总/DeepSeek 官方链接",
|
||||
"DeepSeek资源汇总/DeepSeek 开源项目",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek技术解析",
|
||||
collapsable: true,
|
||||
children: [
|
||||
{
|
||||
title: "DeepSeek 技术分析",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek的优势与不足",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/一文详解 DeepSeek 技术架构",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek最强专业拆解:清交复教授超硬核解读",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek技术解读:从V3到R1的MoE架构创新",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek 爆火逻辑、行业影响及对未来AI发展的启示",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek vs. ChatGPT:谁才是真正的王者?",
|
||||
"DeepSeek技术解析/DeepSeek 技术分析/DeepSeek-R1 技术全景解析:从原理到实践的“炼金术配方”",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek 模型训练",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek技术解析/DeepSeek 模型训练/DeepSeek-R1的四个训练阶段",
|
||||
"DeepSeek技术解析/DeepSeek 模型训练/DeepSeek-V3 高效训练关键技术分析",
|
||||
"DeepSeek技术解析/DeepSeek 模型训练/DeepSeek-R1的训练流程强化学习(RL)阶段采用了GRPO算法",
|
||||
"DeepSeek技术解析/DeepSeek 模型训练/DeepSeek华丽文风从何而来?业内人士:训练数据、训练策略和迭代优化缺一不可",
|
||||
],
|
||||
},
|
||||
],
|
||||
},
|
||||
|
||||
{
|
||||
title: "Deepseek行业资讯",
|
||||
collapsable: true,
|
||||
children: [
|
||||
{
|
||||
title: "2025-02",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"Deepseek行业资讯/2025-02/DeepSeek被封杀了",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek宣布涨价!",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek,紧急声明",
|
||||
"Deepseek行业资讯/2025-02/日本如何看待Deepseek",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek带飞科大讯飞?",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek如何搅动AI产业?",
|
||||
"Deepseek行业资讯/2025-02/运营商全面接入DeepSeek意味着什么?",
|
||||
"Deepseek行业资讯/2025-02/vivo官宣:将深度融合满血版DeepSeek",
|
||||
"Deepseek行业资讯/2025-02/不在场的DeepSeek,是巴黎AI峰会真正的主角",
|
||||
"Deepseek行业资讯/2025-02/深度求索正在物色韩国人工智能人才,展开确保人才的战争",
|
||||
"Deepseek行业资讯/2025-02/清华大学:普通人如何抓住DeepSeek红利2025",
|
||||
"Deepseek行业资讯/2025-02/看短剧、“交朋友”,DeepSeek挤进中老年社交圈",
|
||||
"Deepseek行业资讯/2025-02/爆冷,DeepSeek出局,苹果AI国行版将与阿里合作",
|
||||
"Deepseek行业资讯/2025-02/多家车企接入AI大模型DeepSeek 智能汽车再进一步",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek预测:未来10年,就业前景最好的10个专业",
|
||||
"Deepseek行业资讯/2025-02/外资机构看DeepSeek:提振中国股市 机会藏在这些领域",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入",
|
||||
"Deepseek行业资讯/2025-02/点赞收藏!DeepSeek在GitHub星标量已超OpenAI",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事",
|
||||
"Deepseek行业资讯/2025-02/争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?",
|
||||
"Deepseek行业资讯/2025-02/雷军:钦佩DeepSeek取得的成就,每个人可能都要学习AI知识",
|
||||
"Deepseek行业资讯/2025-02/vivo与荣耀相继接入DeepSeek:AI深度融合引领手机创新潮流",
|
||||
"Deepseek行业资讯/2025-02/价值千万美元的“AI.com”,会是谁给DeepSeek公司使用的呢",
|
||||
"Deepseek行业资讯/2025-02/如何利用DeepSeek翻身?抓住AI红利,普通人也能逆袭的3个方向",
|
||||
"Deepseek行业资讯/2025-02/被DeepSeek刺激到了?文心一言、ChatGPT同时宣布:免费! ",
|
||||
"Deepseek行业资讯/2025-02/DeepSeek“金融朋友圈” 从“争先”到“恐后”,从“好用”到“用好”",
|
||||
],
|
||||
},
|
||||
],
|
||||
},
|
||||
];
|
||||
@@ -1,10 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "DeepSeek资源汇总",
|
||||
collapsable: false,
|
||||
children: ["DeepSeek 学习资料", "DeepSeek 官方链接", "DeepSeek 开源项目"],
|
||||
},
|
||||
];
|
||||
@@ -1,28 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "DeepSeek 技术分析",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek 技术分析/DeepSeek vs. ChatGPT:谁才是真正的王者?",
|
||||
"DeepSeek 技术分析/DeepSeek 爆火逻辑、行业影响及对未来AI发展的启示",
|
||||
"DeepSeek 技术分析/DeepSeek-R1 技术全景解析:从原理到实践的“炼金术配方”",
|
||||
"DeepSeek 技术分析/DeepSeek技术解读:从V3到R1的MoE架构创新",
|
||||
"DeepSeek 技术分析/DeepSeek最强专业拆解:清交复教授超硬核解读",
|
||||
"DeepSeek 技术分析/DeepSeek的优势与不足",
|
||||
"DeepSeek 技术分析/一文详解 DeepSeek 技术架构",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek 模型训练",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek 模型训练/DeepSeek-R1的四个训练阶段",
|
||||
"DeepSeek 模型训练/DeepSeek-R1的训练流程强化学习(RL)阶段采用了GRPO算法",
|
||||
"DeepSeek 模型训练/DeepSeek-V3 高效训练关键技术分析",
|
||||
"DeepSeek 模型训练/DeepSeek华丽文风从何而来?业内人士:训练数据、训练策略和迭代优化缺一不可",
|
||||
],
|
||||
},
|
||||
];
|
||||
@@ -1,28 +0,0 @@
|
||||
// 自动生成的侧边栏配置
|
||||
|
||||
export default [
|
||||
"",
|
||||
{
|
||||
title: "DeepSeek使用指南",
|
||||
collapsable: false,
|
||||
children: [
|
||||
"🔥DeepSeek 小白快速上手指南",
|
||||
"DeepSeek API 使用指南",
|
||||
"DeepSeek 多种使用连接方式推荐",
|
||||
"DeepSeek 本地部署教程",
|
||||
"如何在iPhone上用语音调用Deepseek",
|
||||
"官方 DeepSeek R1 满血版使用指南",
|
||||
"普通人能用DeepSeek做什么?20个实用建议",
|
||||
],
|
||||
},
|
||||
{
|
||||
title: "DeepSeek 提问技巧",
|
||||
collapsable: true,
|
||||
children: [
|
||||
"DeepSeek 提问技巧/DeepSeek 提示词基本法则",
|
||||
"DeepSeek 提问技巧/DeepSeek不好用?那是你还不知道这些指令!",
|
||||
"DeepSeek 提问技巧/吐血整理!DeepSeek神级指令,好用到爆!",
|
||||
"DeepSeek 提问技巧/普通人也能轻松掌握的 20 个 DeepSeek 高频提示词(2025版)",
|
||||
],
|
||||
},
|
||||
];
|
||||
@@ -39,7 +39,7 @@ export default {
|
||||
components: { PageEdit, PageNav, PageSidebarToc },
|
||||
props: ['sidebarItems', 'pageSidebarItems'],
|
||||
mounted() {
|
||||
console.log(this.$site,this, 'this.$site')
|
||||
console.log(this.$route.path, this, 'this.$site')
|
||||
}
|
||||
}
|
||||
</script>
|
||||
@@ -74,6 +74,8 @@ export default {
|
||||
//height 100vw
|
||||
//width 100vw
|
||||
//overflow scroll
|
||||
|
||||
|
||||
.toc-container-sidebar
|
||||
|
||||
order 2
|
||||
@@ -135,5 +137,15 @@ export default {
|
||||
margin-top: 0;
|
||||
& > ol > li
|
||||
padding-left: 15px;
|
||||
.not-index-content .sidebar
|
||||
.sidebar-sub-headers
|
||||
display: none;
|
||||
.sidebar
|
||||
.depth-1
|
||||
.sidebar-heading
|
||||
font-size: 16px !important;
|
||||
color: #2c3e50 !important;
|
||||
font-weight: 600 !important;
|
||||
opacity 1 !important
|
||||
|
||||
</style>
|
||||
|
||||
@@ -125,7 +125,7 @@ a.toc-sidebar-link
|
||||
padding-top 0.25rem
|
||||
padding-bottom 0.25rem
|
||||
border-left none
|
||||
font-weight 300
|
||||
font-weight 400
|
||||
&.active
|
||||
font-weight 500
|
||||
.toc-sidebar-depth-4
|
||||
|
||||
@@ -1,5 +1,6 @@
|
||||
<template>
|
||||
<div
|
||||
|
||||
class="theme-container"
|
||||
:class="pageClasses"
|
||||
@touchstart="onTouchStart"
|
||||
@@ -81,6 +82,9 @@ export default {
|
||||
},
|
||||
|
||||
computed: {
|
||||
isIndexPage() {
|
||||
return this.$route.path === '/'
|
||||
},
|
||||
shouldShowNavbar () {
|
||||
const { themeConfig } = this.$site
|
||||
const { frontmatter } = this.$page
|
||||
@@ -130,13 +134,15 @@ export default {
|
||||
return resolveHeaders(this.$page)
|
||||
},
|
||||
|
||||
pageClasses () {
|
||||
pageClasses() {
|
||||
const userPageClass = this.$page.frontmatter.pageClass
|
||||
|
||||
return [
|
||||
{
|
||||
'no-navbar': !this.shouldShowNavbar,
|
||||
'sidebar-open': this.isSidebarOpen,
|
||||
'no-sidebar': !this.shouldShowSidebar
|
||||
'no-sidebar': !this.shouldShowSidebar,
|
||||
'not-index-content': !this.isIndexPage
|
||||
},
|
||||
userPageClass
|
||||
]
|
||||
|
||||
@@ -87,15 +87,13 @@
|
||||
IMYAI智能助手是一款集成多项先进AI技术的全能型工具平台,其核心特点如下:
|
||||
|
||||
- 多模型支持与技术领先性
|
||||
|
||||
- - - 覆盖全球顶尖模型:支持OpenAI全系列GPT模型(如GPT-4o)、Claude-3.5、Midjourney绘画模型、微软NewBing、阿里通义千问等国内外100+款大模型,涵盖文本生成、绘画、编程、多模态处理等场景。
|
||||
|
||||
- 覆盖全球顶尖模型:支持OpenAI全系列GPT模型(如GPT-4o)、Claude-3.5、Midjourney绘画模型、微软NewBing、阿里通义千问等国内外100+款大模型,涵盖文本生成、绘画、编程、多模态处理等场景。
|
||||
- GPT-4o性能优势:搭载最新GPT-4o模型,相比前代在编码能力提升30分以上,支持文件传输功能(如Claude-3-sonnet、清华智谱glm4-all多模态等),且价格更优。
|
||||
|
||||
- 多功能集成与创作工具
|
||||
|
||||
- - 全场景创作支持:
|
||||
|
||||
- - - 文本与编程:智能问答、文章改写、广告文案生成、代码调试与算法设计。
|
||||
- 全场景创作支持:
|
||||
- 文本与编程:智能问答、文章改写、广告文案生成、代码调试与算法设计。
|
||||
- 视觉创作:AI绘画(支持Midjourney动态全功能、DALL-E3文生图)、AI换脸、图像混合与局部重绘。
|
||||
- 多媒体创作:SunoAI音乐生成、Luma Video全功能视频创作。
|
||||
- 思维导图:自动生成结构化思维导图,支持编辑与导出。
|
||||
+12
-13
@@ -1,6 +1,5 @@
|
||||
## DeepSeek 提示词基本法则
|
||||
|
||||
官方提供了一些 prompt :https://api-docs.deepseek.com/zh-cn/prompt-library/
|
||||
> 官方提供了一些 prompt :https://api-docs.deepseek.com/zh-cn/prompt-library/
|
||||
|
||||
|
||||
|
||||
@@ -8,7 +7,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 一、提示词设计的黄金法则
|
||||
## 一、提示词设计的黄金法则
|
||||
|
||||
**1. 具体性为王**
|
||||
❌ 模糊提问:“写一篇市场报告”
|
||||
@@ -33,9 +32,9 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 二、行业级提示词模板库
|
||||
## 二、行业级提示词模板库
|
||||
|
||||
### 1. 学术科研
|
||||
**1. 学术科研**
|
||||
|
||||
**场景**:文献综述突破
|
||||
**模板**:
|
||||
@@ -50,7 +49,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 2. 编程开发
|
||||
**2. 编程开发**
|
||||
|
||||
**场景**:代码调试与优化
|
||||
**模板**:
|
||||
@@ -68,7 +67,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 3. 创意内容
|
||||
**3. 创意内容**
|
||||
|
||||
**场景**:短视频剧本创作
|
||||
**模板**:
|
||||
@@ -84,7 +83,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 4. 商业分析
|
||||
**4. 商业分析**
|
||||
|
||||
**场景**:竞品战略拆解
|
||||
**模板**:
|
||||
@@ -102,9 +101,9 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 三、高阶技巧:让AI“深度思考”
|
||||
## 三、高阶技巧:让AI“深度思考”
|
||||
|
||||
### 1. 分步思考链(Chain-of-Thought)
|
||||
**1. 分步思考链(Chain-of-Thought)**
|
||||
|
||||
**示例**:
|
||||
“请逐步推理:若2025年中国新能源汽车渗透率达到50%,对以下行业的影响路径是什么?
|
||||
@@ -119,7 +118,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 2. 多模态生成控制
|
||||
**2. 多模态生成控制**
|
||||
|
||||
**示例**:
|
||||
“生成一份‘智慧城市’技术架构图:
|
||||
@@ -132,7 +131,7 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
------
|
||||
|
||||
### 四、避坑指南
|
||||
## 四、避坑指南
|
||||
|
||||
**1. 避免“幻觉”**
|
||||
|
||||
@@ -167,4 +166,4 @@ DeepSeek作为前沿AI工具,其潜力远超“简单问答”——关键在
|
||||
|
||||
|
||||
|
||||
> 来源:https://post.smzdm.com/p/a34e74z5/
|
||||
> 来源:https://post.smzdm.com/p/a34e74z5/
|
||||
@@ -31,7 +31,7 @@
|
||||
| **DeepSeek-R1-70B** | 700亿 | 140GB | 2x A100 80GB/4x RTX 4090(多卡并行) | 必需 | 支持 | 科研机构/大型企业(金融预测、大规模数据分析)、高复杂度生成任务 |
|
||||
| **DeepSeek-671B** | 6710亿 | 512GB+(单卡显存需求极高,通常需要多节点分布式训练) | 8x A100/H100(服务器集群) | 必需 | 支持 | 国家级/超大规模 AI 研究(气候建模、基因组分析)、通用人工智能(AGI)探索 |
|
||||
|
||||
### 三、晓凡硬件配置
|
||||
### 三、硬件配置
|
||||
|
||||
- **CPU**:AMD Ryzen 7 5800H with Radeon Graphics 3.20 GHz
|
||||
- **内存**:16GB
|
||||
@@ -50,7 +50,7 @@
|
||||
|
||||
安装文件OllamaSetup.exe大约745MB。
|
||||
|
||||
注:如果下载过于缓慢可以使用**迅雷之类的加速下载**;(晓凡将软件打包放网盘了,有需要的小伙伴可在文章末尾自取)
|
||||
注:如果下载过于缓慢可以使用**迅雷之类的加速下载**;(将软件打包放网盘了,有需要的小伙伴可在文章末尾自取)
|
||||
|
||||
双击**OllamaSetup.exe进行。**
|
||||
|
||||
@@ -83,7 +83,7 @@
|
||||
|
||||
使用命令提示符与`DeepSeek`对话并不友好,为了更好的体验,我们可以安装`WebUI`,这里使用的是浏览器插件:**Page Assit**
|
||||
|
||||
(如果小伙伴找不到在哪下载`Page Assit`插件,晓凡打包放网盘了,可在文章末尾自取)
|
||||
(如果小伙伴找不到在哪下载`Page Assit`插件,打包放网盘了,可在文章末尾自取)
|
||||
|
||||
**启动ollama服务后,输入快捷键【ctrl + shift+L】快捷键即可打开WebUI页面**
|
||||
|
||||
@@ -38,7 +38,7 @@ DeepSeek官方提供的是满血版的AI,虽然它是开源的,但是官方
|
||||
|
||||
**核心界面全解析:**
|
||||
|
||||
1. **对话输入框**:像发微信一样打字,但记得按 `Enter` 发送(而不是微信的「发送」按钮,网页版按shift回车来换行,直接按回车是发送。) 感谢提醒 [@知乎用户770416](https://www.zhihu.com/people/099c99cc670629fbed4ac743b5d54f13)
|
||||
1. **对话输入框**:像发微信一样打字,但记得按 `Enter` 发送(而不是微信的「发送」按钮,网页版按shift回车来换行,直接按回车是发送。)
|
||||
2. **历史记录栏**:左侧列表显示所有对话,可右键「重命名对话」,方便查找(例如改为「毕业论文辅助」)
|
||||
3. **功能工具栏**:
|
||||
|
||||
@@ -62,19 +62,19 @@ DeepSeek官方提供的是满血版的AI,虽然它是开源的,但是官方
|
||||
|
||||
- ❌ **错误示例**:「帮我写点东西」
|
||||
- ✅ **正确示例**:「我需要一封求职邮件,应聘新媒体运营岗位,强调3年公众号运营经验」
|
||||
- **提供背景**
|
||||
2. **提供背景**
|
||||
- ❌ **错误示例**:「分析这个数据」
|
||||
- ✅ **正确示例**:「这是一家奶茶店过去三个月的销售数据,请分析周末和工作日的销量差异(附CSV数据)」
|
||||
- **指定格式**
|
||||
3. **指定格式**
|
||||
- ❌ **错误示例**:「给几个营销方案」
|
||||
- ✅ **正确示例**:「请用表格形式列出三种情人节咖啡店促销方案,包含成本预估和预期效果」
|
||||
- **控制长度**
|
||||
4. **控制长度**
|
||||
- ❌ **错误示例**:「详细说明」
|
||||
- ✅ **正确示例**:「请用200字以内解释区块链技术,让完全不懂技术的老人能听懂」
|
||||
- **及时纠正**
|
||||
5. **及时纠正**
|
||||
- **当回答不满意时,可以这样调整指令:**
|
||||
|
||||
- - 「这个方案成本太高,请提供预算控制在500元以内的版本」
|
||||
- 「这个方案成本太高,请提供预算控制在500元以内的版本」
|
||||
- 「请用更正式的语气重写第二段」
|
||||
|
||||
### 2.2 新手必学的魔法指令
|
||||
@@ -138,7 +138,7 @@ DeepSeek官方提供的是满血版的AI,虽然它是开源的,但是官方
|
||||
3. 请求逐行解释关键代码段
|
||||
4. 遇到报错直接粘贴错误信息
|
||||
|
||||
## 3.3 复杂任务自动化
|
||||
### 3.3 复杂任务自动化
|
||||
|
||||
**示例:批量Excel数据处理**
|
||||
|
||||
+35
-3
@@ -1,43 +1,75 @@
|
||||
## 3秒让DeepSeek写出爆款小红书
|
||||
|
||||
|
||||
不会用AI写笔记?直接套这个6步公式!
|
||||
|
||||
\-
|
||||
|
||||
📝 **DeepSeek脚本公式**
|
||||
|
||||
👉🏻 直接复制填空!👇
|
||||
|
||||
`【我是谁】`+
|
||||
|
||||
`【我需要】`+
|
||||
|
||||
`【给对象】`+
|
||||
|
||||
`【痛点关键词】`+
|
||||
|
||||
`【内容重点】`+
|
||||
|
||||
`【避雷要求】`
|
||||
|
||||
💡 **原理**:给AI精准"喂料",它才能吐出金子!
|
||||
|
||||
🎬 **万能模板(直接抄!)**
|
||||
|
||||
记住这1个万能脚本!🔥"
|
||||
|
||||
(例:职场人/宝妈/美妆党狂喜...)
|
||||
|
||||
**正文**:
|
||||
|
||||
但很多姐妹说AI写的像流水账?
|
||||
|
||||
其实只要用这个脚本模板👇
|
||||
|
||||
✅ **6步精准指令公式**:
|
||||
|
||||
1️⃣【我是谁】👉🏻 `XX领域/身份的博主`
|
||||
|
||||
2️⃣【我需要】👉🏻 `标题/互动话术/痛点文案`
|
||||
|
||||
3️⃣【给对象】👉🏻 `XX岁+有XX痛点的群体`
|
||||
|
||||
4️⃣【痛点关键词】👉🏻 `3-5个精准词`
|
||||
|
||||
(例:职场妈妈:没时间/怕麻烦/要高效)
|
||||
|
||||
5️⃣【内容重点】👉🏻 `必含数据/场景/对比`
|
||||
|
||||
(例:三步搞定/懒人必存/1分钟vs1小时)
|
||||
|
||||
6️⃣【避雷要求】👉🏻 `禁用XX/必须带XX`
|
||||
|
||||
(例:不用专业术语/每段加emoji)
|
||||
|
||||
**场景**:穿搭博主求选题
|
||||
|
||||
❌ 小白指令: "帮我找秋季穿搭灵感"
|
||||
|
||||
✅ 指令:
|
||||
|
||||
【我是谁】158小个子穿搭博主
|
||||
|
||||
【我需要】10个显高显瘦的秋季外套选题
|
||||
|
||||
【给对象】20-25岁梨形身材女生
|
||||
|
||||
【痛点关键词】胯宽/腿粗/五五分
|
||||
|
||||
【内容重点】附身高体重参考+价格区间
|
||||
|
||||
【避雷要求】不要网红款,要日常通勤款
|
||||
|
||||
|
||||
|
||||
> 来源:https://www.xiaohongshu.com/explore/67a71ff00000000029011801?source=webshare&xhsshare=pc_web&xsec_token=ABLdF6QKSCiRS-u0SAYSdLudIGd7AfZqEXaUs0r8OH_d8=&xsec_source=pc_share
|
||||
+9
-10
@@ -1,39 +1,38 @@
|
||||
## 人有多大胆,地有多大产:如何用DeepSeek写长篇小说-虎嗅网
|
||||
|
||||
## 人有多大胆,地有多大产:如何用DeepSeek写长篇小说
|
||||
|
||||
不是科学家或技术人士,所有AI对作者而言都是一个工具助手。大部分“专业”的评论可能不如让AI自行解释。
|
||||
|
||||
做点有趣的事,试着让Deepseek与作者合作写一篇长篇小说,具体过程如下。长图有点多,读者慢慢阅读,作者的点评会在截图之间,不要错过。
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/AV3BG6JbegX7wMJ9.webp" alt="" width="100%" />
|
||||
|
||||
作者其实一开始没有任何想法,deepseek给出的架构已经够震撼了,感觉是已经写好了一部长篇小说,倒过来回溯总结了整个架构。agent就是一个专项助手,deepseek允许使用者设置一个专项任务的agent来持续帮助使用者完成一个任务,甚至是非常宏大的任务。截至目前,不是每个面向个人用户的AI都允许设置这样的agent。
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/LmOvLPIDkkKqGKla.webp" alt="" width="100%" />
|
||||
|
||||
三大文明冲突仅仅是作者的一个模糊的想法,deepseek把它完全具象化了,从地图、核心冲突到主角特点全部都设计好了,如果有不满,可以细化调整,但作者没有调整,因为每一步都充满了意外。
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/4Z7bHRRuxCCUgqml.webp" alt="" width="100%" />
|
||||
|
||||
这是第一章的第一版,细节看点在于笔法,作者读网文小说不算多,不知上述大概处于什么水平?
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/Fu0uyagcALFiZEw4.webp" alt="" width="100%" />
|
||||
|
||||
作者想起来deepseek agent在第一幅截图里提到的“自研的文明演进系统”,很感兴趣,让deepseek进行了解释,看完之后,觉得拥有这个知识量的作者应该是人类社会的极少数人。
|
||||
|
||||

|
||||

|
||||
|
||||
完全按照agent的建议,模拟了这个虚拟世界的科技树发展。
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/pl6LQ6IqoGTU8EDR.webp" alt="" width="100%" />
|
||||
|
||||
这部分作者第一次进行了实质性干预。考虑到是复杂的文明冲突背景,作者要求引入Carroll Quigley的文明史观,来强化deepseek的“文明演进系统”。这是一个不小的挑战,因为Quigley的著作并没有任何中文版,中文网络世界中,仅有作者翻译过一部分Quigley的著作。即便在欧美学术界,也只有“文明史”这个很小众的领域才有Quigley的身影。但Deepseek直接找到了Quigley文明史观最核心的部分,引述并引入了The Evolution of Civilization的核心观念,将之适用于这部“长篇小说”。这种知识混搭能力,是托尔金这样的作家才具有的。
|
||||
|
||||

|
||||
<img src="https://pic.code-nav.cn/post_picture/1619930914211520514/IJccNuuwlbY1HHSw.webp" alt="" width="100%" />
|
||||
|
||||
在此基础上,作者要求改进写作方式,更加贴近史实,而不是倾向于虚构。改造只在一瞬间。
|
||||
|
||||

|
||||

|
||||
|
||||
然后要求扩写第一章至 1 万汉字,成品如上。事实上,可以同步要求形成英文版。
|
||||
|
||||
+1
-1
@@ -111,7 +111,7 @@ DeepSeek,是一款 **AI 助手应用**,也就是ChatGPT、OpenAI、豆包和
|
||||
|
||||

|
||||
|
||||
### 
|
||||

|
||||
|
||||
**②** 生成HTML代码
|
||||
|
||||
+15
-15
@@ -25,13 +25,13 @@
|
||||
|
||||
假设年化收益率10%(股市长期平均回报),每月定投:
|
||||
|
||||
- - 若每月投入5,000元,约需9年达到100万(复利计算)。
|
||||
- 若每月投入5,000元,约需9年达到100万(复利计算)。
|
||||
- 若每月投入3,000元,约需12年。
|
||||
- 核心逻辑:时间越久,复利效应越强。急功近利往往导致亏损。
|
||||
|
||||
2、风险与收益匹配:
|
||||
|
||||
- - 想快速赚100万(如3年内),需承担极高风险(杠杆、投机),但失败概率极大。
|
||||
- 想快速赚100万(如3年内),需承担极高风险(杠杆、投机),但失败概率极大。
|
||||
- 普通人建议选择“年化8%-15%”的稳健路径,避免本金大幅缩水。
|
||||
|
||||
### 第二步:选择适合自己的工具
|
||||
@@ -40,13 +40,13 @@
|
||||
|
||||
- 指数基金定投:
|
||||
|
||||
- - 标的选择:沪深300、中证500、纳斯达克100(如场内ETF:510300、510500)。
|
||||
- 标的选择:沪深300、中证500、纳斯达克100(如场内ETF:510300、510500)。
|
||||
- 策略:每月固定时间买入,低估时加仓,高估时减仓(参考PE/PB历史分位)。
|
||||
- 优势:费率低,分散风险,长期跑赢多数主动基金。
|
||||
|
||||
- 主动型基金筛选:
|
||||
|
||||
- - 筛选条件:
|
||||
- 筛选条件:
|
||||
- 示例:朱少醒的富国天惠、谢治宇的兴全合润。
|
||||
|
||||
1. 1. 基金经理任职超5年,年化收益>15%;
|
||||
@@ -55,24 +55,24 @@
|
||||
|
||||
- 行业基金(进阶):
|
||||
|
||||
- - 选择长期赛道(消费、医药、科技),但需低位布局,避免追高。
|
||||
- 选择长期赛道(消费、医药、科技),但需低位布局,避免追高。
|
||||
- 例如:中证医疗指数PE<30时定投,PE>50时分批卖出。
|
||||
|
||||
#### 2. 股票投资(需投入学习时间)
|
||||
|
||||
- 价值投资:
|
||||
|
||||
- - 选股标准:ROE>15%、毛利率>30%、负债率<50%、自由现金流稳定。
|
||||
- 选股标准:ROE>15%、毛利率>30%、负债率<50%、自由现金流稳定。
|
||||
- 案例:茅台、长江电力等长牛股,长期持有+分红再投。
|
||||
|
||||
- 成长股投资:
|
||||
|
||||
- - 关注行业渗透率(如新能源车<30%、AI<10%时介入)。
|
||||
- 关注行业渗透率(如新能源车<30%、AI<10%时介入)。
|
||||
- 结合PEG<1(市盈率/盈利增速)筛选,如宁德时代2020年高速增长期。
|
||||
|
||||
- 关键原则:
|
||||
|
||||
- - 单只股票仓位≤20%,行业持仓≤30%;
|
||||
- 单只股票仓位≤20%,行业持仓≤30%;
|
||||
- 避免频繁交易,税费和情绪损耗会吞噬收益。
|
||||
|
||||
### 第三步:构建投资组合(示例)
|
||||
@@ -83,33 +83,33 @@
|
||||
|
||||
1. 仓位控制:
|
||||
|
||||
- - 熊市(PE分位<30%)可加仓至90%;
|
||||
- 熊市(PE分位<30%)可加仓至90%;
|
||||
- 牛市(PE分位>70%)减仓至50%以下。
|
||||
|
||||
1. 止损纪律:
|
||||
|
||||
- - 单只基金/股票下跌20%强制止损(除非基本面未恶化)。
|
||||
- 单只基金/股票下跌20%强制止损(除非基本面未恶化)。
|
||||
- 整体账户回撤超15%时暂停买入,复盘策略。
|
||||
|
||||
1. 情绪管理:
|
||||
|
||||
- - 避免追涨杀跌(如2021年追高白酒、2022年割肉新能源)。
|
||||
- 避免追涨杀跌(如2021年追高白酒、2022年割肉新能源)。
|
||||
- 利用“逆向思维”:市场恐慌时买入(如2020年3月疫情底)。
|
||||
|
||||
### 第五步:加速策略(可选)
|
||||
|
||||
1. 提高本金:
|
||||
|
||||
- - 通过主业或副业增加收入,月投资额从5,000提升至1万,目标时间缩短30%。
|
||||
- 通过主业或副业增加收入,月投资额从5,000提升至1万,目标时间缩短30%。
|
||||
|
||||
1. 增强收益:
|
||||
|
||||
- - 可转债打新:每年无风险收益约3,000-5,000元(需多账户)。
|
||||
- 可转债打新:每年无风险收益约3,000-5,000元(需多账户)。
|
||||
- 网格交易:对指数ETF设置5%波动区间自动化买卖(需券商条件单功能)。
|
||||
|
||||
1. 套利机会:
|
||||
|
||||
- - 港股打新(低估值时参与,如2023年生物医药B类股);
|
||||
- 港股打新(低估值时参与,如2023年生物医药B类股);
|
||||
- 封闭基金折价套利(折价>8%时买入,到期按净值赎回)。
|
||||
|
||||
### 关键提醒
|
||||
@@ -122,7 +122,7 @@
|
||||
|
||||
- 学习资源:
|
||||
|
||||
- - 书籍:《聪明的投资者》《漫步华尔街》;
|
||||
- 书籍:《聪明的投资者》《漫步华尔街》;
|
||||
- 工具:天天基金APP(查估值、智能定投)。
|
||||
|
||||
### 总结路径
|
||||
+19
-19
@@ -102,19 +102,19 @@
|
||||
|
||||
1. **风险分散**
|
||||
|
||||
- - 地域分散:A股(20%)+ 港股(15%)+ 美股(15%)
|
||||
- 地域分散:A股(20%)+ 港股(15%)+ 美股(15%)
|
||||
- 资产分散:股票(50%)+ 债券(20%)+ 商品(15%)+ REITs(10%)+ 现金(5%)
|
||||
- 行业分散:科技(30%)+ 金融(15%)+ 能源(5%)+ 消费(10%)+ 其他(40%)
|
||||
|
||||
1. **收益增强**
|
||||
|
||||
- - 通过纳斯达克100ETF捕捉科技股长期增长
|
||||
- 通过纳斯达克100ETF捕捉科技股长期增长
|
||||
- 配置油气基金对冲通胀风险
|
||||
- REITs提供稳定现金流(年化分红4%+)
|
||||
|
||||
1. **风险控制**
|
||||
|
||||
- - 债券+现金占比25%提供安全垫
|
||||
- 债券+现金占比25%提供安全垫
|
||||
- 黄金ETF在市场恐慌时提供避险功能
|
||||
- 最大回撤严格控制在10%以内
|
||||
|
||||
@@ -124,13 +124,13 @@
|
||||
|
||||
1. **触发条件**
|
||||
|
||||
- - 单一资产涨跌幅超过±20%
|
||||
- 单一资产涨跌幅超过±20%
|
||||
- 每季度末进行例行调整
|
||||
- 市场出现极端波动(如VIX指数突破30)
|
||||
|
||||
1. **调整方法**
|
||||
|
||||
- - 卖出涨幅超标的资产,买入跌幅较大的资产
|
||||
- 卖出涨幅超标的资产,买入跌幅较大的资产
|
||||
- 保持股债比在50:25左右
|
||||
- 黄金仓位控制在8-12%区间
|
||||
|
||||
@@ -140,17 +140,17 @@
|
||||
|
||||
1. **买入时点**
|
||||
|
||||
- - 每月10日定投权益类资产(避开季末流动性紧张期)
|
||||
- 每月10日定投权益类资产(避开季末流动性紧张期)
|
||||
- 债券类资产一次性配置,持有到期策略
|
||||
|
||||
1. **交易渠道**
|
||||
|
||||
- - 通过券商账户购买ETF(佣金万2.5以下)
|
||||
- 通过券商账户购买ETF(佣金万2.5以下)
|
||||
- 基金类资产通过天天基金/支付宝等平台申购(费率1折)
|
||||
|
||||
1. **监控工具**
|
||||
|
||||
- - 使用且慢/蛋卷基金的组合管理功能
|
||||
- 使用且慢/蛋卷基金的组合管理功能
|
||||
- 设置涨跌提醒(单日波动超2%预警)
|
||||
|
||||
------
|
||||
@@ -169,17 +169,17 @@
|
||||
|
||||
1. **汇率风险**
|
||||
|
||||
- - QDII基金受汇率波动影响,建议选择美元份额
|
||||
- QDII基金受汇率波动影响,建议选择美元份额
|
||||
- 港股通持仓需缴纳20%红利税
|
||||
|
||||
1. **流动性风险**
|
||||
|
||||
- - REITs和油气基金流动性较低,建议分批买入
|
||||
- REITs和油气基金流动性较低,建议分批买入
|
||||
- 单日成交量低于1000万元的ETF谨慎参与
|
||||
|
||||
1. **政策风险**
|
||||
|
||||
- - 关注QDII额度变化,优先选择大基金公司产品
|
||||
- 关注QDII额度变化,优先选择大基金公司产品
|
||||
- 港股受国际政治因素影响较大,需动态调整仓位
|
||||
|
||||
------
|
||||
@@ -228,42 +228,42 @@
|
||||
|
||||
1. **沪深300指数基金(20%)**
|
||||
|
||||
- - 中国最好的300家公司集合(茅台、腾讯都在里面)
|
||||
- 中国最好的300家公司集合(茅台、腾讯都在里面)
|
||||
- 过去5年平均年赚8%,但最惨的时候亏过22%(所以要控制比例)
|
||||
|
||||
1. **招商债券基金(20%)**
|
||||
|
||||
- - 稳如老狗,年赚4-5%,最惨也就亏过1.5%
|
||||
- 稳如老狗,年赚4-5%,最惨也就亏过1.5%
|
||||
- 相当于理财的压舱石
|
||||
|
||||
1. **黄金ETF(10%)**
|
||||
|
||||
- - 不是让你买金条,是手机就能买卖的电子黄金
|
||||
- 不是让你买金条,是手机就能买卖的电子黄金
|
||||
- 战乱/危机时能救命,过去5年涨得比股票还猛
|
||||
|
||||
1. **物流仓库基金(10%)**
|
||||
|
||||
- - 相当于当包租公,收仓库租金
|
||||
- 相当于当包租公,收仓库租金
|
||||
- 每年分红4%,比存银行强
|
||||
|
||||
1. **香港科技ETF(15%)**
|
||||
|
||||
- - 阿里、美团、小米这些互联网巨头的打包价
|
||||
- 阿里、美团、小米这些互联网巨头的打包价
|
||||
- 现在打折卖(比美国同类便宜40%)
|
||||
|
||||
1. **纳斯达克100基金(15%)**
|
||||
|
||||
- - 苹果、微软、特斯拉的美国总部
|
||||
- 苹果、微软、特斯拉的美国总部
|
||||
- 过去5年最赚钱的品种,年化14%
|
||||
|
||||
1. **石油基金(5%)**
|
||||
|
||||
- - 跟国际油价挂钩,打仗通胀时能对冲
|
||||
- 跟国际油价挂钩,打仗通胀时能对冲
|
||||
- 波动大但占比小,就当买保险
|
||||
|
||||
1. **灵活备用金(5%)**
|
||||
|
||||
- - 存余额宝类似的理财,随时能取
|
||||
- 存余额宝类似的理财,随时能取
|
||||
- 遇到大跌可以抄底用
|
||||
|
||||
**怎么买最省心?**
|
||||
+1
-1
@@ -26,7 +26,7 @@
|
||||
- 通义千问:文档分析能力突出,但个性化内容生成较弱。
|
||||
- 国外模型:
|
||||
|
||||
- - GPT-4/Claude:功能全面且性能顶尖,但训练成本高昂(GPT-4约1亿美元),依赖云端算力,难以普惠化。
|
||||
- GPT-4/Claude:功能全面且性能顶尖,但训练成本高昂(GPT-4约1亿美元),依赖云端算力,难以普惠化。
|
||||
|
||||
|
||||
|
||||
+10
-10
@@ -33,7 +33,7 @@ DeepSeek 发布的 V3、R1-Zero、R1 三大模型,代表了一条从通用基
|
||||
- **核心能力**:通用文本生成、基础问答、多任务处理。
|
||||
- **短板暴露**:
|
||||
|
||||
- - 无法生成连贯的思维链(CoT)。
|
||||
- 无法生成连贯的思维链(CoT)。
|
||||
- 依赖监督微调(SFT),推理能力天花板低。
|
||||
|
||||
- **破局方向**:引入**强化学习**(**RL**),让模型通过奖励机制自主探索推理路径。
|
||||
@@ -43,7 +43,7 @@ DeepSeek 发布的 V3、R1-Zero、R1 三大模型,代表了一条从通用基
|
||||
- **设计理念**:**“不依赖人类标注,仅靠** **RL** **自我进化”**
|
||||
- **训练逻辑**:
|
||||
|
||||
- - **数据选择**:数学推导与代码执行(每一步可客观验证)。
|
||||
- **数据选择**:数学推导与代码执行(每一步可客观验证)。
|
||||
- **算法核心**:GRPO(组内奖励对比优化),避免训练额外评判模型。
|
||||
- **成果与代价**:推理指标超越 V3,但语言混杂、格式混乱。
|
||||
|
||||
@@ -79,7 +79,7 @@ DeepSeek-R1 的训练过程可以分为四大步骤,每一步都像是炼金
|
||||
- **目标**:防止 RL 初期盲目探索,奠定基础推理格式。
|
||||
- **核心操作**:
|
||||
|
||||
- - **数据精选**:少量高质量长思维链(Long-CoT)数据,包含清晰推理步骤。
|
||||
- **数据精选**:少量高质量长思维链(Long-CoT)数据,包含清晰推理步骤。
|
||||
- **SFT** **预热**:对 V3 微调,使其初步学会“抄写”标准答案。
|
||||
|
||||
*如同教孩童写字,先临摹字帖,再迈向自主创作。*
|
||||
@@ -98,7 +98,7 @@ GRPO 就像一位“裁判”,根据 DeepSeek-R1 的“答题”情况打分
|
||||
|
||||
- **算法核心**:GRPO 的三大创新设计
|
||||
|
||||
- - **组内基线估计**:同一批输出的奖励对比,降低训练开销。
|
||||
- **组内基线估计**:同一批输出的奖励对比,降低训练开销。
|
||||
- **规则奖励**:答案正确性、推理格式规范性(如步骤编号、符号统一)。
|
||||
- **语言一致性奖励**:强制中英文分离,解决 R1-Zero 的“语言混搭”问题。
|
||||
|
||||
@@ -114,7 +114,7 @@ GRPO 就像一位“裁判”,根据 DeepSeek-R1 的“答题”情况打分
|
||||
|
||||
- **拒绝采样(Rejection Sampling)**:
|
||||
|
||||
- - **生成**:模型输出推理过程。
|
||||
- **生成**:模型输出推理过程。
|
||||
- **筛选**:规则校验(格式)→ V3 模型二次过滤 → 保留优质数据。
|
||||
|
||||
- **CoT** **提示工程**:生成非推理任务数据(如写作、对话),增强泛化性。
|
||||
@@ -131,7 +131,7 @@ GRPO 就像一位“裁判”,根据 DeepSeek-R1 的“答题”情况打分
|
||||
|
||||
- **混合奖励信号**:
|
||||
|
||||
- - **规则奖励**:针对推理任务(如数学解题)。
|
||||
- **规则奖励**:针对推理任务(如数学解题)。
|
||||
- **人类偏好奖励**:引入 Helpfulness(有用性)与 Harmlessness(无害性)评估。
|
||||
|
||||
- **数据多样性**:覆盖多场景提示(客服、编程、创意写作),避免“过拟合推理”。
|
||||
@@ -146,15 +146,15 @@ GRPO 就像一位“裁判”,根据 DeepSeek-R1 的“答题”情况打分
|
||||
|
||||
1. **“无需** **SFT** **”意味着完全抛弃** **监督学习**?
|
||||
|
||||
1. 1. 事实:SFT 在冷启动和数据反哺阶段都是不可或缺的润滑剂,为 RL 提供了正确的格式指引。
|
||||
事实:SFT 在冷启动和数据反哺阶段都是不可或缺的润滑剂,为 RL 提供了正确的格式指引。
|
||||
|
||||
1. **RL** **训练成本必然高于** SFT?
|
||||
|
||||
1. 1. 事实:得益于 GRPO 算法的组内奖励对比机制,R1 的训练成本仅为传统 RLHF 的约 1/3。
|
||||
事实:得益于 GRPO 算法的组内奖励对比机制,R1 的训练成本仅为传统 RLHF 的约 1/3。
|
||||
|
||||
1. **推理模型必须依赖过程监督(PRM**)?
|
||||
|
||||
1. 1. 事实:DeepSeek-R1 证明,仅凭规则奖励和 GRPO 也能实现性能突破;不过 PRM 可在加速收敛上起到一定作用。
|
||||
事实:DeepSeek-R1 证明,仅凭规则奖励和 GRPO 也能实现性能突破;不过 PRM 可在加速收敛上起到一定作用。
|
||||
|
||||
此外,对于如下常见问题:
|
||||
|
||||
@@ -162,7 +162,7 @@ GRPO 就像一位“裁判”,根据 DeepSeek-R1 的“答题”情况打分
|
||||
- **Q2:DeepSeek-V3 是否已被淘汰?** V3 作为通用基座在非推理场景依然具有优势,而 R1 则是 V3 的“推理特化版”,二者各有侧重。
|
||||
- **Q3:普通开发者应如何选择模型?**
|
||||
|
||||
- - 通用任务:DeepSeek-V3
|
||||
- 通用任务:DeepSeek-V3
|
||||
- 复杂推理:DeepSeek-R1
|
||||
- 学术研究:R1-Zero(需具备相应权限)
|
||||
|
||||
+4
-4
@@ -73,11 +73,11 @@ https://github.com/deepseek-ai/DeepSeek-R1
|
||||
|
||||
1. **多样化奖励信号**:
|
||||
|
||||
- - **推理任务**:沿用规则奖励(数学、代码等)。
|
||||
- **通用任务**:使用神经奖励模型评估人类偏好(如最终答案的实用性、全响应的无害性)。
|
||||
- **推理任务**:沿用规则奖励(数学、代码等)。
|
||||
- **通用任务**:使用神经奖励模型评估人类偏好(如最终答案的实用性、全响应的无害性)。
|
||||
|
||||
1. **多提示分布训练**:结合不同场景的提示数据(如用户查询、角色扮演),确保模型适应多样化需求。
|
||||
2. **二次RL训练**:在收敛的检查点上进一步优化,最终得到兼具推理能力和通用性的DeepSeek-R1模型。
|
||||
2. **多提示分布训练**:结合不同场景的提示数据(如用户查询、角色扮演),确保模型适应多样化需求。
|
||||
3. **二次RL训练**:在收敛的检查点上进一步优化,最终得到兼具推理能力和通用性的DeepSeek-R1模型。
|
||||
|
||||
## 总结
|
||||
|
||||
+1
-1
@@ -19,7 +19,7 @@ DeepSeek-R1的训练流程确实包含多个阶段,其中强化学习(RL)
|
||||
|
||||
- **多阶段RL迭代**:例如,在推理导向的RL中,模型专注于数学、编程等结构化任务,通过基于规则的奖励(如答案正确性、格式规范)优化决策过程;在通用对齐RL中,结合人类偏好奖励提升输出的安全性和实用性。
|
||||
|
||||
- - **显著效果**:通过GRPO优化,模型在AIME 2024数学竞赛中的Pass@1得分从15.6%跃升至71.0%,代码生成任务的可运行率提升至85%。
|
||||
- **显著效果**:通过GRPO优化,模型在AIME 2024数学竞赛中的Pass@1得分从15.6%跃升至71.0%,代码生成任务的可运行率提升至85%。
|
||||
|
||||
3.**拒绝采样(RS)阶段**
|
||||
|
||||
+10
-7
@@ -35,13 +35,15 @@ c)**专家激活**:标准MoE架构对于输入数据激活的专家数量没
|
||||
|
||||
**1.2 创新的负载均衡策略:无辅助损失负载均衡和序列级负载均衡**
|
||||
|
||||
#### 1. **基本概念**:在MoE大模型训练过程中,输入数据会根据一定的路由规则分配到不同的专家模型进行处理,这个过程中可能会出现负载不均衡的情况,**即某些专家被频繁调用,而另一些专家则很少被使用**,这会导致训练效率和模型性能下降;
|
||||
#### 1. **基本概念**:
|
||||
在MoE大模型训练过程中,输入数据会根据一定的路由规则分配到不同的专家模型进行处理,这个过程中可能会出现负载不均衡的情况,**即某些专家被频繁调用,而另一些专家则很少被使用**,这会导致训练效率和模型性能下降;
|
||||
|
||||
#### 业界通常采用的负载均衡策略为引入专门的辅助损失函数来强制平衡专家之间的负载,例如通过惩罚专家之间的负载差异来促使模型均匀地使用各个专家,**额外引入的损失函数往往会导致模型复杂度增加、训练不稳定、发生与原本训练目标不一致等问题**;
|
||||
业界通常采用的负载均衡策略为引入专门的辅助损失函数来强制平衡专家之间的负载,例如通过惩罚专家之间的负载差异来促使模型均匀地使用各个专家,**额外引入的损失函数往往会导致模型复杂度增加、训练不稳定、发生与原本训练目标不一致等问题**;
|
||||
|
||||
#### 除了上述基于单 Token 的负载不均问题外,一个输入序列中的 Token 在专家间的分配情况也容易出现负载不均,即同一序列中的多个 Token 可能会集中分配给某些专家。
|
||||
除了上述基于单 Token 的负载不均问题外,一个输入序列中的 Token 在专家间的分配情况也容易出现负载不均,即同一序列中的多个 Token 可能会集中分配给某些专家。
|
||||
|
||||
2. **优化方法**:DeepSeek-V3 采用无辅助损失负载均衡技术,通过直接在路由机制中融入负载均衡逻辑,**避免了引入辅助损失函数**,实现了仅通过对路由决策动态调整就实现专家负载均衡的效果;同时训练过程**辅以序列级负载均衡策略**,确保了每个序列内的专家负载均衡。
|
||||
#### 2. **优化方法**:
|
||||
DeepSeek-V3 采用无辅助损失负载均衡技术,通过直接在路由机制中融入负载均衡逻辑,**避免了引入辅助损失函数**,实现了仅通过对路由决策动态调整就实现专家负载均衡的效果;同时训练过程**辅以序列级负载均衡策略**,确保了每个序列内的专家负载均衡。
|
||||
|
||||
a)**无辅助损失负载均衡**:DeepSeek-V3 为每个专家引入了一个可学习的偏置项,在训练过程中它会随着专家负载情况进行动态更新,当门控网络计算输入 Token 与各专家的匹配得分时,**该偏置项会动态调整每个专家的匹配得分**,基于得分和对各专家利用率的实时监测(例如在一定时间窗口内专家处理的 Token 数量、计算资源占用时长等),动态调整路由策略,将输入 Token 实时分配给负载较低的专家,这种方法不仅负载均衡效果好,而且避免了引入辅助损失函数带来的衍生问题。
|
||||
|
||||
@@ -89,14 +91,14 @@ c)**计算资源利用率**:MoE 模型中的不同专家可能具有不同的
|
||||
|
||||
1. 1. **前向传递**:通常按顺序执行 **ATTN(计算流)、DISPATCH(通信流)、MLP(计算流)、COMBINE(通信流)** 操作。
|
||||
|
||||
- - ATTN(计算流):指注意力机制计算,使大模型能够捕捉文本等数据中的依赖关系,提升模型的性能和泛化能力。
|
||||
- ATTN(计算流):指注意力机制计算,使大模型能够捕捉文本等数据中的依赖关系,提升模型的性能和泛化能力。
|
||||
- DISPATCH(通信流):指数据或任务在不同GPU节点之间的传递,提高整个训练系统的并行度和效率。
|
||||
- MLP(计算流):即多层感知机计算,由输入层、输出层和一个或多个隐藏层构成,利用梯度下降法更新权重参数。
|
||||
- COMBINE(通信流):指将不同GPU节点上将计算结果进行合并的通信操作。
|
||||
|
||||
ii. **反向传递**:需要执行 **COMBINE(通信流)、MLP_B(计算流)、MLP_W(计算流)、DISPATCH(通信流)、ATTN_B(计算流)、ATTN_W(计算流)** 操作:
|
||||
|
||||
- - COMBINE(通信流):定义与前向传递相同,此处特指反向传递时的数据汇总,以便进行全局参数更新。
|
||||
- COMBINE(通信流):定义与前向传递相同,此处特指反向传递时的数据汇总,以便进行全局参数更新。
|
||||
- MLP_B(计算流):此处的B指的是Bias,指的是反向传播中对于偏执项的计算,以便更新大模型的偏执参数。
|
||||
- MLP_W(计算流):此处的W指的是Weight,指的是反向传播中对于权重参数的计算,用于更新权重参数。
|
||||
- DISPATCH(通信流):在反向计算中,DISPATCH 的作用仍然是负责数据或任务的分发。
|
||||
@@ -143,7 +145,8 @@ b)**加速模型训练**:首先由于内存占用降低,模型可以处理
|
||||
|
||||
**3.1 Moe 路由的All2All优化设计:网络拓扑优化与资源分配优化**
|
||||
|
||||
#### **1.基本概念:** 在MoE大模型训练中,需要将训练数据按照数据类型或特征分配给最合适的专家模型进行处理,**此时常用到两种数据路由方案**,一种是All to All通信方案,另一种是基于 Magetron 实现的All Reduce和Reduce Scatter通信方案,其优缺点大致如下:
|
||||
#### **1.基本概念:**
|
||||
在MoE大模型训练中,需要将训练数据按照数据类型或特征分配给最合适的专家模型进行处理,**此时常用到两种数据路由方案**,一种是All to All通信方案,另一种是基于 Magetron 实现的All Reduce和Reduce Scatter通信方案,其优缺点大致如下:
|
||||
|
||||
a)**All to All通信**:在数据传输时,根据实际传输的数据量来开辟相应大小的显存空间;这种方案的**优势是显存开销小,劣势是由于是点对点通信、通信效率相对较低**。
|
||||
|
||||
-5
@@ -1,9 +1,4 @@
|
||||
# DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入
|
||||

|
||||
|
||||
DeepSeek 视觉中国 资料图
|
||||
|
||||
DeepSeek成为了海内外各大云厂商的宠儿。
|
||||
|
||||
1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。截至2月5日,国内外已有众多云平台宣布上线DeepSeek- R1大模型。
|
||||
|
||||
@@ -1,7 +1,7 @@
|
||||
# DeepSeek带飞科大讯飞?
|
||||
DeepSeek 越来越火爆,但与此同时,DeepSeek“服务繁忙”的状况不仅没有好转,还在进一步加剧。
|
||||
|
||||
据**字母榜(ID:wujicaijing)** 实际测试,目前如果选择深度思考和联网搜索模式,DeepSeek会直接以弹窗形式发送一条“服务器繁忙,请稍后重试”的提醒,而不再像以往那样在对话框中给予回复。
|
||||
据实际测试,目前如果选择深度思考和联网搜索模式,DeepSeek会直接以弹窗形式发送一条“服务器繁忙,请稍后重试”的提醒,而不再像以往那样在对话框中给予回复。
|
||||
|
||||
**因服务“繁忙”而无法使用DeepSeek的用户,也由此越来越多地外溢到了接入DeepSeek 的其他厂商平台上。**
|
||||
|
||||
+5
-1
@@ -86,7 +86,11 @@ R1要想稳定运行,如今核心在于推理侧的储备和优化之能力。
|
||||
|
||||
与此同时,卡顿也说明DS本身的算力储备很可能也没有SemiAnalysis所述庞大,幻方基金公司要用卡,DeepSeek训练团队也要用卡,能排出来给用户的卡一直不多。按照目前发展情形看,短期内DeepSeek未必有动力花钱租服务,继而免费提供给用户更好的体验,他们更可能等到第一波C端商业模式梳理清晰之后,再考虑服务租赁的议题,这也意味着,卡顿还会持续不短的时间。
|
||||
|
||||
“他们大概需要两步动作:1)做付费机制,限制免费用户模型用量;2)找云服务厂商合作,用上别人的GPU资源。”开发者陈云飞给出的临时解法在业界颇有共识。
|
||||
他们大概需要两步动作:
|
||||
|
||||
1)做付费机制,限制免费用户模型用量;
|
||||
|
||||
2)找云服务厂商合作,用上别人的GPU资源。”开发者陈云飞给出的临时解法在业界颇有共识。
|
||||
|
||||
但目前来看,DeepSeek对自己这个“服务器繁忙”问题显得并不太着急。做为一家追逐AGI的公司,DeepSeek似乎不愿太着眼于这蜂拥而来的用户流量。可能用户们在未来不短时间里还是要习惯面对“服务器繁忙”的界面了。
|
||||
|
||||
+1
-4
@@ -24,11 +24,8 @@ OpenAI通过GPT-4赢得了AI发展的第一阶段,但接下来的构建应用
|
||||
|
||||
在Mensch眼中,DeepSeek是“一个与我们非常相似的玩家”,甚至称其为“中国的Mistral”。“Mistral肩负着法国和欧洲与美国竞争的希望,筹集的资金已经创下了欧洲初创公司的纪录:自2023年成立以来,融资额已超过10亿欧元,估值达到60亿欧元。但是微软已经投资了Mistral,而且它发布的Mistral Large模型已经变成闭源。
|
||||
|
||||

|
||||
|
||||
(图片来源:ChatGPT)
|
||||
|
||||
欧洲正式加入AI全球竞赛
|
||||
**欧洲正式加入AI全球竞赛**
|
||||
|
||||
欧洲以对高科技的监管著称。从GDPR到人工智能法,欧洲的立法比创新要快得多。但是,欧洲也很快看到它与美国的高科技差距越来越大,而且在数字技术和人工智能方面被中国超越。
|
||||
|
||||
-1
@@ -64,7 +64,6 @@
|
||||
|
||||

|
||||
|
||||
图源/DeepSeek GitHub页面
|
||||
|
||||
还有人认为,DeepSeek R1 技惊四座的亮相,以及手机玩家们所展现出的热情迎合,更说明着后者重注AI大模型自研的现状可能被改变。
|
||||
|
||||
-1
@@ -4,7 +4,6 @@
|
||||
|
||||
很多人焦虑:“AI时代会不会淘汰普通人?”但我想说:**与其害怕被取代,不如主动驾驭工具。** 今天我们就来聊聊,普通人如何借力DeepSeek这类AI工具,在内容创作、副业变现、职场升级中实现“低成本逆袭”。
|
||||
|
||||

|
||||
|
||||
___
|
||||
|
||||
@@ -24,8 +24,6 @@ Deepseek风靡中国,轰动世界,成为春节期间中国社会的一股滚
|
||||
|
||||

|
||||
|
||||
日本内阁官房长官林芳正
|
||||
|
||||
那么,日本政府目前是如何看待DeepSeek的呢?
|
||||
|
||||
2 月 3 日,日本政府的个人信息保护委员会在其网站上发表声明指出,Deepseek 的隐私政策只有中文和英文版,日本用户很难理解其内容。而且包含个人信息的数据存储在中国的服务器上,并根据中国的法律法规处理这些数据,存在风险。
|
||||
-5
@@ -10,15 +10,10 @@
|
||||
|
||||
在12日晚的直播中,雷军来到小米公司食堂当起了“吃播”,介绍并品尝了湖北特色的米团、四川特色的红糖糍粑元宵、浙江台州的糟粳等,当他品尝五仁汤圆时开始面露难色,“吃出了五仁月饼的味道!我要赶紧吃个黑芝麻汤圆。”随后,“雷军吃五仁汤圆破防了”登上热搜。
|
||||
|
||||

|
||||
|
||||
对此,网友打趣式地喊话小米,要求推出“联名款汤圆”:骁龙8Gen3芯片联名的黑芝麻款,澎湃OS加持的流沙款,还有限量版"五仁概念款"(注:上述联名均为小米旗下产品)。
|
||||
|
||||
在直播中,雷军带大家参观了小米食堂,介绍其面积一共11800平方米,可以容纳4000多人同时用餐,还曾经创下过一顿午餐16000人用餐的记录。食堂的价格也颇为实惠:早餐平均为5.27元/人,午餐平均为16.81元/人,晚餐平均为16.79元/人,三餐的客单均价为14.25元/人,并表示,小米是在用产品的思路做食堂,接受全体员工的监督。
|
||||
|
||||

|
||||
|
||||
雷军现场走访小米食堂
|
||||
|
||||
雷军还回应了多个网友关心的话题。
|
||||
|
||||
@@ -0,0 +1,178 @@
|
||||
# Deepseek
|
||||
|
||||
> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)
|
||||
|
||||
## 关于DeepSeek
|
||||
|
||||
[什么是 DeepSeek](关于DeepSeek/什么是%20DeepSeek.md)
|
||||
|
||||
[DeepSeek 发展历程](关于DeepSeek/DeepSeek%20发展历程.md)
|
||||
|
||||
[DeepSeek 创始团队介绍](关于DeepSeek/DeepSeek%20创始团队介绍.md)
|
||||
|
||||
## DeepSeek使用指南
|
||||
|
||||
[DeepSeek 本地部署教程](DeepSeek使用指南/DeepSeek%20本地部署教程.md)
|
||||
|
||||
[DeepSeek API 使用指南](DeepSeek使用指南/DeepSeek%20API%20使用指南.md)
|
||||
|
||||
[DeepSeek 多种使用连接方式推荐](DeepSeek使用指南/DeepSeek%20多种使用连接方式推荐.md)
|
||||
|
||||
[🔥DeepSeek 小白快速上手指南](DeepSeek使用指南/🔥DeepSeek%20小白快速上手指南.md)
|
||||
|
||||
[官方 DeepSeek R1 满血版使用指南](DeepSeek使用指南/官方%20DeepSeek%20R1%20满血版使用指南.md)
|
||||
|
||||
[如何在iPhone上用语音调用Deepseek](DeepSeek使用指南/如何在iPhone上用语音调用Deepseek.md)
|
||||
|
||||
[普通人能用DeepSeek做什么?20个实用建议](DeepSeek使用指南/普通人能用DeepSeek做什么?20个实用建议.md)
|
||||
|
||||
[DeepSeek 提示词基本法则](DeepSeek使用指南/DeepSeek%20提问技巧/DeepSeek%20提示词基本法则.md)
|
||||
|
||||
[吐血整理!DeepSeek神级指令,好用到爆!](DeepSeek使用指南/DeepSeek%20提问技巧/吐血整理!DeepSeek神级指令,好用到爆!.md)
|
||||
|
||||
[DeepSeek不好用?那是你还不知道这些指令!](DeepSeek使用指南/DeepSeek%20提问技巧/DeepSeek不好用?那是你还不知道这些指令!.md)
|
||||
|
||||
[普通人也能轻松掌握的 20 个 DeepSeek 高频提示词(2025版)](DeepSeek使用指南/DeepSeek%20提问技巧/普通人也能轻松掌握的%2020%20个%20DeepSeek%20高频提示词(2025版).md)
|
||||
|
||||
|
||||
## DeepSeek应用场景
|
||||
|
||||
[DeepSeek一句话搞定修图难题](DeepSeek应用场景/DeepSeek%20+%20创意设计/DeepSeek一句话搞定修图难题.md)
|
||||
|
||||
[普通人如何通过炒股买基金赚到100万?](DeepSeek应用场景/DeepSeek%20+%20理财/普通人如何通过炒股买基金赚到100万?.md)
|
||||
|
||||
[3秒让DeepSeek写出爆款小红书](DeepSeek应用场景/DeepSeek%20+%20内容创作/3秒让DeepSeek写出爆款小红书.md)
|
||||
|
||||
[利用deepseek建立专属销售知识库](DeepSeek应用场景/DeepSeek%20+%20办公效率/利用deepseek建立专属销售知识库.md)
|
||||
|
||||
[如何利用DeepSeek进行高效内容创作](DeepSeek应用场景/DeepSeek%20+%20内容创作/如何利用DeepSeek进行高效内容创作.md)
|
||||
|
||||
[deepseek+数字人王炸组合使用方法](DeepSeek应用场景/DeepSeek%20+%20创意设计/deepseek+数字人王炸组合使用方法.md)
|
||||
|
||||
[WPS里装上deepseek,简直就是办公神器](DeepSeek应用场景/DeepSeek%20+%20办公效率/WPS里装上deepseek,简直就是办公神器.md)
|
||||
|
||||
[法律人保姆级deepseek使用指南(附指令版)](DeepSeek应用场景/DeepSeek%20+%20办公效率/法律人保姆级deepseek使用指南(附指令版).md)
|
||||
|
||||
[DeepSeek装进VSCode,编程非常丝滑!](DeepSeek应用场景/DeepSeek%20+%20编程开发/DeepSeek装进VSCode,编程非常丝滑!.md)
|
||||
|
||||
[DeepSeek R1 + 个人知识库,直接起飞!](DeepSeek应用场景/DeepSeek%20+%20办公效率/DeepSeek%20R1%20+%20个人知识库,直接起飞!.md)
|
||||
|
||||
[如何用DeepSeek更高效地工作:10个实用技巧](DeepSeek应用场景/DeepSeek%20+%20办公效率/如何用DeepSeek更高效地工作:10个实用技巧.md)
|
||||
|
||||
[人有多大胆,地有多大产:如何用DeepSeek写长篇小说](DeepSeek应用场景/DeepSeek%20+%20内容创作/人有多大胆,地有多大产:如何用DeepSeek写长篇小说.md)
|
||||
|
||||
[手把手教你在word中接入deepseek,秒生文档材料](DeepSeek应用场景/DeepSeek%20+%20办公效率/手把手教你在word中接入deepseek,秒生文档材料.md)
|
||||
|
||||
[用DeepSeek做小红书真的太牛了!轻轻松松打造爆款笔记](DeepSeek应用场景/DeepSeek%20+%20内容创作/用DeepSeek做小红书真的太牛了!轻轻松松打造爆款笔记.md)
|
||||
|
||||
[教你用DeepSeek+Clien,从0到1开发一个APP](DeepSeek应用场景/DeepSeek%20+%20编程开发/教你用DeepSeek+Clien,从0到1开发一个APP.md)
|
||||
|
||||
[这怕是全网最强的 DeepSeek 图片教程吧,赶紧收藏了!](DeepSeek应用场景/DeepSeek%20+%20创意设计/这怕是全网最强的%20DeepSeek%20图片教程吧,赶紧收藏了!.md)
|
||||
|
||||
[用 deepseek 做 AI 视频,绝了,和抄作业一样简单!](DeepSeek应用场景/DeepSeek%20+%20创意设计/用%20deepseek%20做%20AI%20视频,绝了,和抄作业一样简单!.md)
|
||||
|
||||
[DeepSeek嵌入到Excel,提升10倍工作效率,太牛了!](DeepSeek应用场景/DeepSeek%20+%20办公效率/DeepSeek嵌入到Excel,提升10倍工作效率,太牛了!.md)
|
||||
|
||||
[DeepSeek配合KIMI,自动生成PPT,感觉自己要失业了!](DeepSeek应用场景/DeepSeek%20+%20办公效率/DeepSeek配合KIMI,自动生成PPT,感觉自己要失业了!.md)
|
||||
|
||||
[用Deepseek回答:如果有100万闲钱,几年内不用,该怎么理财?](DeepSeek应用场景/DeepSeek%20+%20理财/用Deepseek回答:如果有100万闲钱,几年内不用,该怎么理财?.md)
|
||||
|
||||
[绝绝子!用deepseek做AI视频,涨粉10W+(附保姆级教程)](DeepSeek应用场景/DeepSeek%20+%20创意设计/绝绝子!用deepseek做AI视频,涨粉10W+(附保姆级教程).md)
|
||||
|
||||
[用DeepSeek写文章?这4个骚操作让你躺平也能出爆款!(含提示词)](DeepSeek应用场景/DeepSeek%20+%20内容创作/用DeepSeek写文章?这4个骚操作让你躺平也能出爆款!(含提示词).md)
|
||||
|
||||
[DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!](DeepSeek应用场景/DeepSeek%20+%20编程开发/DeepSeek接入Python,一般电脑也能飞速跑,确实可以封神了!.md)
|
||||
|
||||
|
||||
## DeepSeek资源汇总
|
||||
|
||||
[DeepSeek 学习资料](DeepSeek资源汇总/DeepSeek%20学习资料.md)
|
||||
|
||||
[DeepSeek 官方链接](DeepSeek资源汇总/DeepSeek%20官方链接.md)
|
||||
|
||||
[DeepSeek 开源项目](DeepSeek资源汇总/DeepSeek%20开源项目.md)
|
||||
|
||||
|
||||
## DeepSeek技术解析
|
||||
|
||||
[DeepSeek的优势与不足](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek的优势与不足.md)
|
||||
|
||||
[一文详解 DeepSeek 技术架构](DeepSeek技术解析/DeepSeek%20技术分析/一文详解%20DeepSeek%20技术架构.md)
|
||||
|
||||
[DeepSeek-R1的四个训练阶段](DeepSeek技术解析/DeepSeek%20模型训练/DeepSeek-R1的四个训练阶段.md)
|
||||
|
||||
[DeepSeek-V3 高效训练关键技术分析](DeepSeek技术解析/DeepSeek%20模型训练/DeepSeek-V3%20高效训练关键技术分析.md)
|
||||
|
||||
[DeepSeek最强专业拆解:清交复教授超硬核解读](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek最强专业拆解:清交复教授超硬核解读.md)
|
||||
|
||||
[DeepSeek技术解读:从V3到R1的MoE架构创新](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek技术解读:从V3到R1的MoE架构创新.md)
|
||||
|
||||
[DeepSeek 爆火逻辑、行业影响及对未来AI发展的启示](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek%20爆火逻辑、行业影响及对未来AI发展的启示.md)
|
||||
|
||||
[DeepSeek vs. ChatGPT:谁才是真正的王者?](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek%20vs.%20ChatGPT:谁才是真正的王者?.md)
|
||||
|
||||
[DeepSeek-R1 技术全景解析:从原理到实践的“炼金术配方”](DeepSeek技术解析/DeepSeek%20技术分析/DeepSeek-R1%20技术全景解析:从原理到实践的“炼金术配方”.md)
|
||||
|
||||
[DeepSeek-R1的训练流程强化学习(RL)阶段采用了GRPO算法](DeepSeek技术解析/DeepSeek%20模型训练/DeepSeek-R1的训练流程强化学习(RL)阶段采用了GRPO算法.md)
|
||||
|
||||
[DeepSeek华丽文风从何而来?业内人士:训练数据、训练策略和迭代优化缺一不可](DeepSeek技术解析/DeepSeek%20模型训练/DeepSeek华丽文风从何而来?业内人士:训练数据、训练策略和迭代优化缺一不可.md)
|
||||
|
||||
|
||||
## Deepseek行业资讯
|
||||
|
||||
[DeepSeek被封杀了](Deepseek行业资讯/2025-02/DeepSeek被封杀了.md)
|
||||
|
||||
[DeepSeek宣布涨价!](Deepseek行业资讯/2025-02/DeepSeek宣布涨价!.md)
|
||||
|
||||
[DeepSeek,紧急声明](Deepseek行业资讯/2025-02/DeepSeek,紧急声明.md)
|
||||
|
||||
[日本如何看待Deepseek](Deepseek行业资讯/2025-02/日本如何看待Deepseek.md)
|
||||
|
||||
[DeepSeek带飞科大讯飞?](Deepseek行业资讯/2025-02/DeepSeek带飞科大讯飞?.md)
|
||||
|
||||
[DeepSeek如何搅动AI产业?](Deepseek行业资讯/2025-02/DeepSeek如何搅动AI产业?.md)
|
||||
|
||||
[运营商全面接入DeepSeek意味着什么?](Deepseek行业资讯/2025-02/运营商全面接入DeepSeek意味着什么?.md)
|
||||
|
||||
[vivo官宣:将深度融合满血版DeepSeek](Deepseek行业资讯/2025-02/vivo官宣:将深度融合满血版DeepSeek.md)
|
||||
|
||||
[不在场的DeepSeek,是巴黎AI峰会真正的主角](Deepseek行业资讯/2025-02/不在场的DeepSeek,是巴黎AI峰会真正的主角.md)
|
||||
|
||||
[深度求索正在物色韩国人工智能人才,展开确保人才的战争](Deepseek行业资讯/2025-02/深度求索正在物色韩国人工智能人才,展开确保人才的战争.md)
|
||||
|
||||
[清华大学:普通人如何抓住DeepSeek红利2025](Deepseek行业资讯/2025-02/清华大学:普通人如何抓住DeepSeek红利2025.md)
|
||||
|
||||
[看短剧、“交朋友”,DeepSeek挤进中老年社交圈](Deepseek行业资讯/2025-02/看短剧、“交朋友”,DeepSeek挤进中老年社交圈.md)
|
||||
|
||||
[爆冷,DeepSeek出局,苹果AI国行版将与阿里合作](Deepseek行业资讯/2025-02/爆冷,DeepSeek出局,苹果AI国行版将与阿里合作.md)
|
||||
|
||||
[多家车企接入AI大模型DeepSeek 智能汽车再进一步](Deepseek行业资讯/2025-02/多家车企接入AI大模型DeepSeek%20智能汽车再进一步.md)
|
||||
|
||||
[DeepSeek预测:未来10年,就业前景最好的10个专业](Deepseek行业资讯/2025-02/DeepSeek预测:未来10年,就业前景最好的10个专业.md)
|
||||
|
||||
[外资机构看DeepSeek:提振中国股市 机会藏在这些领域](Deepseek行业资讯/2025-02/外资机构看DeepSeek:提振中国股市%20机会藏在这些领域.md)
|
||||
|
||||
[DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入](Deepseek行业资讯/2025-02/DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入.md)
|
||||
|
||||
[点赞收藏!DeepSeek在GitHub星标量已超OpenAI](Deepseek行业资讯/2025-02/点赞收藏!DeepSeek在GitHub星标量已超OpenAI.md)
|
||||
|
||||
[DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事](Deepseek行业资讯/2025-02/DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事.md)
|
||||
|
||||
[争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?](Deepseek行业资讯/2025-02/争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?.md)
|
||||
|
||||
[雷军:钦佩DeepSeek取得的成就,每个人可能都要学习AI知识](Deepseek行业资讯/2025-02/雷军:钦佩DeepSeek取得的成就,每个人可能都要学习AI知识.md)
|
||||
|
||||
[vivo与荣耀相继接入DeepSeek:AI深度融合引领手机创新潮流](Deepseek行业资讯/2025-02/vivo与荣耀相继接入DeepSeek:AI深度融合引领手机创新潮流.md)
|
||||
|
||||
[价值千万美元的“AI.com”,会是谁给DeepSeek公司使用的呢](Deepseek行业资讯/2025-02/价值千万美元的“AI.com”,会是谁给DeepSeek公司使用的呢.md)
|
||||
|
||||
[如何利用DeepSeek翻身?抓住AI红利,普通人也能逆袭的3个方向](Deepseek行业资讯/2025-02/如何利用DeepSeek翻身?抓住AI红利,普通人也能逆袭的3个方向.md)
|
||||
|
||||
[被DeepSeek刺激到了?文心一言、ChatGPT同时宣布:免费! ](Deepseek行业资讯/2025-02/被DeepSeek刺激到了?文心一言、ChatGPT同时宣布:免费!%20.md)
|
||||
|
||||
[DeepSeek“金融朋友圈” 从“争先”到“恐后”,从“好用”到“用好”](Deepseek行业资讯/2025-02/DeepSeek“金融朋友圈”%20从“争先”到“恐后”,从“好用”到“用好”.md)
|
||||
|
||||
|
||||
|
||||
> 你全面的 AI 知识库,一网打尽最新 AI 资讯,都在 [https://ai.codefather.cn](https://ai.codefather.cn)
|
||||
|
||||
@@ -36,13 +36,12 @@
|
||||
|
||||
- **2023 年 7 月**:
|
||||
|
||||
- - **公司成立**
|
||||
- **公司成立**
|
||||
杭州深度求索人工智能基础技术研究有限公司(DeepSeek)正式成立,隶属于幻方量化。团队凭借在量化交易中积累的深度学习和大数据经验,开始向通用大模型研发转型,目标是解决中文语境下的 AI 应用需求,同时应对中美技术竞争背景下的国产自主研发挑战。
|
||||
|
||||
- **初步产品发布与探索阶段(2023 年末)**
|
||||
- **2023 年 11 月**:
|
||||
|
||||
- - **DeepSeek Coder 发布**
|
||||
- **DeepSeek Coder 发布**
|
||||
这是 DeepSeek 的首个产品,专注于编程辅助、代码生成与自动补全,标志着团队在技术迁移和专业场景应用上的初步尝试。
|
||||
- **DeepSeek-LLM 系列发布**
|
||||
随后推出的通用大语言模型产品,开始尝试与国际主流 LLM(如 Llama 系列)接轨,同时针对中文和特定专业领域进行优化。
|
||||
@@ -50,8 +49,7 @@
|
||||
### **产品细分与技术扩展(2024 年)**
|
||||
|
||||
- **2024 年初至中期**:
|
||||
|
||||
- - **DeepSeek-MoE(1 月)**
|
||||
- **DeepSeek-MoE(1 月)**
|
||||
引入了专家混合模型(MoE)架构,通过“共享专家”与“路由专家”的设计,既保证了通用知识的捕捉,也能高效地处理特定领域的输入。
|
||||
- **DeepSeek-Math(4 月)**
|
||||
专注于数学推理,推出了多个版本(Base、Instruct、RL),利用强化学习和专用奖励机制(如过程奖励模型)大幅提升在数学问题上的表现。
|
||||
@@ -61,8 +59,7 @@
|
||||
对编程辅助模型进行了升级,进一步提高了代码生成的准确性和上下文理解能力。
|
||||
|
||||
- **2024 年后期**:
|
||||
|
||||
- - **DeepSeek-V2.5(9 月至 12 月)**
|
||||
- **DeepSeek-V2.5(9 月至 12 月)**
|
||||
作为 V2 系列的升级版,V2.5 融合了语言与代码模型的优势,提供了更好的稳定性和响应速度。
|
||||
- **DeepSeek-V3(12 月)**
|
||||
发布了 DeepSeek-V3-Base 及聊天版本,主要特点包括超长上下文支持(最高 128K tokens)、进一步优化的 MLA 以及更精细的 MoE 架构设计,大幅降低了训练成本,同时提升了模型生成质量。
|
||||
@@ -70,8 +67,7 @@
|
||||
### **商业化爆发与生态扩展(2025 年及以后)**
|
||||
|
||||
- **2025 年初**:
|
||||
|
||||
- - **DeepSeek-R1-Lite-Preview(11 月 2024 发布,2025 年初推广)**
|
||||
- **DeepSeek-R1-Lite-Preview(11 月 2024 发布,2025 年初推广)**
|
||||
针对复杂推理任务推出了 R1 系列预览版本,该模型在数学、逻辑推理和编程等方面表现出色,为后续正式版的推出奠定了基础。
|
||||
- **DeepSeek-R1 正式发布(2025 年 1 月)**
|
||||
在经过大量 SFT(监督微调)与强化学习(采用 GRPO 等算法)的训练后,DeepSeek-R1 在推理能力上取得了与国际主流模型(如 OpenAI o1)相当的表现,并通过移动端聊天机器人迅速走红。
|
||||
@@ -91,8 +87,7 @@
|
||||
- **V2.5**:作为对 V2 的改进,进一步整合了语言模型与代码模型的优势,在响应速度、生成质量以及训练成本上实现了更优平衡。
|
||||
- **DeepSeek-V3(2024 年 12 月)**
|
||||
- V3 系列是 DeepSeek 的又一重大升级版本,主要突破包括:
|
||||
|
||||
- - **上下文扩展**:支持高达 128K tokens 的上下文处理,使模型能处理超长文本任务;
|
||||
- **上下文扩展**:支持高达 128K tokens 的上下文处理,使模型能处理超长文本任务;
|
||||
- **架构优化**:在 MLA、MoE、以及多 token 预测技术上进行了全面优化,极大地降低了训练成本并提升了推理效率;
|
||||
- **应用场景**:不仅提升了通用文本生成能力,同时在专业任务(如数学推理、编程辅助)上表现更为突出。
|
||||
|
||||
@@ -107,8 +102,7 @@
|
||||
|
||||
1. **深度优化基础架构**
|
||||
DeepSeek 已在 Transformer 架构上通过引入多头潜在注意力(MLA)、混合专家模型(MoE)以及低精度混合训练等技术,实现了大幅降低训练与推理成本的目标。未来,DeepSeek 可能会继续沿着这条路深入:
|
||||
|
||||
- - 持续改进 MoE 架构和专家路由策略,使得模型在保持参数规模庞大的同时,每个 token 仅激活一小部分参数,进一步提高计算效率。
|
||||
- 持续改进 MoE 架构和专家路由策略,使得模型在保持参数规模庞大的同时,每个 token 仅激活一小部分参数,进一步提高计算效率。
|
||||
- 推动强化学习与模型蒸馏技术的进步,通过更简单高效的奖励机制(如 GRPO 算法),使得模型在复杂推理和长链思考上的能力不断突破。
|
||||
|
||||
1. **多模态与跨领域融合**
|
||||
@@ -138,6 +132,6 @@
|
||||
|
||||
> 参考:[https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E6%B1%82%E7%B4%A2](https://zh.wikipedia.org/wiki/深度求索)
|
||||
>
|
||||
> https://blog.csdn.net/lly576403061/article/details/145490147
|
||||
> [https://blog.csdn.net/lly576403061/article/details/145490147](https://blog.csdn.net/lly576403061/article/details/145490147)
|
||||
>
|
||||
> https://api-docs.deepseek.com/zh-cn/updates
|
||||
> [https://blog.csdn.net/lly576403061/article/details/145490147](https://api-docs.deepseek.com/zh-cn/updates)
|
||||
@@ -1,6 +1,4 @@
|
||||
## 什么是 DeepSeek?有什么核心功能?
|
||||
|
||||
## 什么是 DeepSeek?
|
||||
## 什么是 DeepSeek
|
||||
|
||||
DeepSeek(深度求索)是一款由国内团队开发的开源人工智能工具库,专注于提供高效易用的AI模型训练与推理能力。它既包含预训练大语言模型(如DeepSeek-R1系列),也提供配套工具链,助力开发者快速实现AI应用落地。
|
||||
|
||||
Some files were not shown because too many files have changed in this diff Show More
Reference in New Issue
Block a user