Commit Graph

258 Commits

Author SHA1 Message Date
KMnO4-zx
de9d9e0048 update readme 2025-12-04 10:58:17 +08:00
Logan Zou
7b091acc64 Merge pull request #133 from zxuuuustupid/patch-1
fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
2025-11-18 10:48:07 +08:00
不要葱姜蒜
88f31c0d14 Merge pull request #136 from jackyzzy/main
修复Agent在处理信息格式时的错误
2025-11-07 17:53:28 +08:00
KMnO4-zx
21bac613c0 修正 AI 普惠课程的机构名称描述 2025-11-07 15:18:30 +08:00
KMnO4-zx
63e88022f3 添加 AI 普惠课程报名信息 2025-11-07 15:01:16 +08:00
jackyzzy
1c0a0c22e1 修复Agent在处理信息格式时的错误 2025-11-05 11:27:06 +08:00
KMnO4-zx
3afabec1a8 update readme 2025-10-17 20:25:33 +08:00
KMnO4-zx
72b41341e1 Add: Exter Chapter LLM-generation-method 2025-10-17 17:11:05 +08:00
KMnO4-zx
b9172031c8 修正 .env_example 文件中的平台名称描述 2025-10-07 10:55:59 +08:00
不要葱姜蒜
46b509c9c1 Merge pull request #132 from JX446/patch-2
Update 第七章 大模型应用.md
2025-10-07 10:53:45 +08:00
Zhixu Duan
4ed47f3918 fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
这是一个简单的文档修复,解决了 `第二章 Transformer架构.md` 文件中的两个显示问题。

1.  **公式修复 (2.2.3节):** 公式 `$Z_j^{i}$` 因空格问题未能正确显示,现已修复。
2.  **矩阵格式修复 (2.3.2节):** 一个矩阵被错误地显示成了一行。现已通过换行进行格式化,使其能够以正确的矩阵形式显示。
2025-10-02 12:26:44 +08:00
JX446
fc6c8c81ee Update 第七章 大模型应用.md
轨迹->硅基
2025-09-21 21:11:23 +08:00
KMnO4-zx
9c461438c7 feat:部分章节添加章节引言 2025-09-16 22:11:05 +08:00
不要葱姜蒜
50bd19efb4 Merge pull request #126 from Sheeran02/patch-1
Update requirements.txt
2025-09-13 17:20:51 +08:00
施旭伦
712415e0a7 Update requirements.txt
torchdata的DataPipes在最新版本中被废弃
2025-09-12 17:05:31 +08:00
Logan Zou
9098d6527f Update 第二章 Transformer架构.md 2025-08-28 10:19:34 +08:00
Logan Zou
550d9bd40c Update 第三章 预训练语言模型.md 2025-08-28 10:18:30 +08:00
Logan Zou
59ea8f65ad Clarify BERT's position encoding in chapter 3 2025-08-28 10:15:14 +08:00
Logan Zou
edbcd3ad38 Update 第二章 Transformer架构.md 2025-08-22 23:49:20 +08:00
Logan Zou
76b3cb848f Add files via upload 2025-08-22 23:48:08 +08:00
KMnO4-zx
6ce019cb2e docs(CDDRS): 更新文献引用格式并添加作者和关键词信息 2025-08-21 21:49:11 +08:00
不要葱姜蒜
0e09304c88 Merge pull request #114 from Hongru0306/main
Add `CDDRS` and corresponding information in `README.md` and `README_en.md`.
2025-08-21 20:10:16 +08:00
Oneb1
5ab392358e Update README.md 2025-08-21 20:05:56 +08:00
Hongru0306
f30ddbcd1a CDDRS 2025-08-21 19:59:29 +08:00
KMnO4-zx
d35df306ed refactor: 将参数名从keyargs改为kwargs以符合惯例
修改forward方法的参数命名,使其更符合Python常用命名规范
2025-08-07 19:37:01 +08:00
KMnO4-zx
ebe52dc086 docs: 更新文档中的图片文件 2025-08-07 12:40:08 +08:00
KMnO4-zx
0428271b7f fix: 替换硬编码的API密钥为占位符文本 2025-08-06 21:25:08 +08:00
Logan Zou
590363587c Update transformer.py 2025-08-04 10:16:50 +08:00
KMnO4-zx
b7e1a26255 docs: 更新README和vLLM思考预算文档链接
更新README.md文件,添加新的Extra Chapter文章链接。同时修正vLLM思考预算文档中的环境镜像链接,提供可访问的URL
2025-08-03 17:23:54 +08:00
KMnO4-zx
9a882a92ed feat(vllm-thinking-budget): 添加思考预算功能实现及文档
- 实现基于vLLM的思考预算功能,通过迭代生成和特定词插入引导模型深入思考
- 添加相关图片资源和详细说明文档,包括论文背景、代码实现和结果分析
2025-08-03 17:21:49 +08:00
Logan Zou
d278182a90 Update 第二章 Transformer架构.md 2025-07-30 20:52:28 +08:00
KMnO4-zx
18d1f56840 增加 Qwen3-"VL" 超小中文多模态模型拼接微调的链接,并更新贡献者信息 2025-07-30 11:00:59 +08:00
不要葱姜蒜
3a8eb17848 Merge pull request #100 from ShaohonChen/add-qwen-smolvlm
Extra Chapter: 增加多模态模型拼接教程
2025-07-30 10:33:11 +08:00
ShaohonChen
f192a4ecd4 修复错误文件夹拼写 2025-07-30 10:07:13 +08:00
ShaohonChen
c889b864a9 增加多模态模型拼接教程 2025-07-30 10:05:49 +08:00
Logan Zou
b7d3e0678e Update 第二章 Transformer架构.md 2025-07-28 17:40:17 +08:00
Logan Zou
a110181cf8 Update transformer.py 2025-07-28 17:39:34 +08:00
KMnO4-zx
9bdf9ed202 docs: 更新README中的PDF下载链接 2025-07-27 22:00:19 +08:00
Logan Zou
1d226be0ff Update 第二章 Transformer架构.md v1.0.1 2025-07-25 16:20:46 +08:00
Logan Zou
5ac954f813 Update transformer.py 2025-07-25 16:20:31 +08:00
Logan Zou
747c935b18 Update transformer.py 2025-07-25 16:18:46 +08:00
Logan Zou
9ef7bcb27c Update 第二章 Transformer架构.md 2025-07-25 16:18:30 +08:00
Logan Zou
679cbc43c0 Update 第二章 Transformer架构.md 2025-07-25 16:17:16 +08:00
Logan Zou
5a9d9c3111 Update transformer.py 2025-07-25 16:16:58 +08:00
Logan Zou
435661a5d5 Update transformer.py 2025-07-25 16:15:16 +08:00
Logan Zou
1c8ce38bb9 Update 第二章 Transformer架构.md 2025-07-25 16:14:58 +08:00
Logan Zou
139ffd84b2 Update 第二章 Transformer架构.md 2025-07-25 16:12:57 +08:00
KMnO4-zx
2bebf8dddc docs: 更新README添加新贡献者及文章链接 2025-07-25 09:12:42 +08:00
不要葱姜蒜
120254b2fd Merge pull request #92 from xinala-781/main
extra-chapter:text-data-processing
2025-07-25 09:09:07 +08:00
KMnO4-zx
324b79de91 refactor: 移除重复的目录创建逻辑 2025-07-25 09:07:17 +08:00