274 Commits

Author SHA1 Message Date
Founce
5dd78a0fe8 fix(chapter5): align labels/attention_mask semantics and add padding-aware batch generation (#170) 2026-02-26 15:34:10 +08:00
KMnO4-zx
827808c1e3 新增对 .obsidian 和 .claude 目录的忽略规则 2026-02-25 21:16:40 +08:00
Li Xu
973ae3c8a5 Update 第二章 Transformer架构.md 修正2.3.2 位置编码中对符号 i 定义的说明 (#140) 2026-02-25 21:03:09 +08:00
inf Lu
85d8c83ca4 fix: correct LayerNorm class indentation (#144) 2026-02-25 21:00:57 +08:00
Genghong Hu
8908c4a8c3 fix: typo of torch dimension (#151) 2026-02-25 20:56:19 +08:00
yuqi zhou
77aff4b66a 新增dropout层描述,防止初学者歧义 (#153) 2026-02-25 20:55:11 +08:00
xbsheng
45f826b6d8 doc: 7B -> 70亿 (#159) 2026-02-25 20:49:06 +08:00
ZW Zhang
cf5809bfbf Merge pull request #160 from Hanguangwu/main
fix: typo
2026-02-25 20:46:59 +08:00
不要葱姜蒜
4935557ec0 Merge pull request #165 from Curricane/fix_fnn_describe
修正 FNN 的描述
2026-02-25 20:45:34 +08:00
chenmch
723d618114 修正 FNN 的描述 2026-02-05 14:29:00 +08:00
KMnO4-zx
55735f3cf2 更新 Happy-LLM PDF 下载链接至 v1.0.2,并添加 PPT 资源下载说明 2026-01-29 14:36:56 +08:00
不要葱姜蒜
07355dfeb6 Merge pull request #155 from sjjjoaps/main
优化了大规模数据读取逻辑,解决了一次性加载所有数据导致内存占用过大以及训练过程中内存占用持续上升的问题
v1.0.2
2026-01-03 11:28:55 +08:00
sjjjoaps
dce7904c96 同步更改第五章教学描述情况。优化了数据加载的逻辑 2026-01-03 10:02:13 +08:00
sjjjoaps
94e6e4a5be 优化了大规模数据读取逻辑,解决了一次性加载所有数据导致内存占用过大以及训练过程中内存占用持续上升的问题 2026-01-02 11:30:42 +08:00
不要葱姜蒜
47164fcca5 Merge pull request #154 from 1985312383/main
增加暗黑模式切换和图片点击放大功能
2025-12-25 16:13:25 +08:00
柯慕灵
7b83aa6118 Implement dark mode styles in index.html
Added dark mode styles and functionality to the documentation.
2025-12-25 16:04:19 +08:00
KMnO4-zx
de9d9e0048 update readme 2025-12-04 10:58:17 +08:00
Logan Zou
7b091acc64 Merge pull request #133 from zxuuuustupid/patch-1
fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
2025-11-18 10:48:07 +08:00
不要葱姜蒜
88f31c0d14 Merge pull request #136 from jackyzzy/main
修复Agent在处理信息格式时的错误
2025-11-07 17:53:28 +08:00
KMnO4-zx
21bac613c0 修正 AI 普惠课程的机构名称描述 2025-11-07 15:18:30 +08:00
KMnO4-zx
63e88022f3 添加 AI 普惠课程报名信息 2025-11-07 15:01:16 +08:00
jackyzzy
1c0a0c22e1 修复Agent在处理信息格式时的错误 2025-11-05 11:27:06 +08:00
KMnO4-zx
3afabec1a8 update readme 2025-10-17 20:25:33 +08:00
KMnO4-zx
72b41341e1 Add: Exter Chapter LLM-generation-method 2025-10-17 17:11:05 +08:00
KMnO4-zx
b9172031c8 修正 .env_example 文件中的平台名称描述 2025-10-07 10:55:59 +08:00
不要葱姜蒜
46b509c9c1 Merge pull request #132 from JX446/patch-2
Update 第七章 大模型应用.md
2025-10-07 10:53:45 +08:00
Zhixu Duan
4ed47f3918 fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
这是一个简单的文档修复,解决了 `第二章 Transformer架构.md` 文件中的两个显示问题。

1.  **公式修复 (2.2.3节):** 公式 `$Z_j^{i}$` 因空格问题未能正确显示,现已修复。
2.  **矩阵格式修复 (2.3.2节):** 一个矩阵被错误地显示成了一行。现已通过换行进行格式化,使其能够以正确的矩阵形式显示。
2025-10-02 12:26:44 +08:00
JX446
fc6c8c81ee Update 第七章 大模型应用.md
轨迹->硅基
2025-09-21 21:11:23 +08:00
KMnO4-zx
9c461438c7 feat:部分章节添加章节引言 2025-09-16 22:11:05 +08:00
不要葱姜蒜
50bd19efb4 Merge pull request #126 from Sheeran02/patch-1
Update requirements.txt
2025-09-13 17:20:51 +08:00
施旭伦
712415e0a7 Update requirements.txt
torchdata的DataPipes在最新版本中被废弃
2025-09-12 17:05:31 +08:00
Logan Zou
9098d6527f Update 第二章 Transformer架构.md 2025-08-28 10:19:34 +08:00
Logan Zou
550d9bd40c Update 第三章 预训练语言模型.md 2025-08-28 10:18:30 +08:00
Logan Zou
59ea8f65ad Clarify BERT's position encoding in chapter 3 2025-08-28 10:15:14 +08:00
Logan Zou
edbcd3ad38 Update 第二章 Transformer架构.md 2025-08-22 23:49:20 +08:00
Logan Zou
76b3cb848f Add files via upload 2025-08-22 23:48:08 +08:00
KMnO4-zx
6ce019cb2e docs(CDDRS): 更新文献引用格式并添加作者和关键词信息 2025-08-21 21:49:11 +08:00
不要葱姜蒜
0e09304c88 Merge pull request #114 from Hongru0306/main
Add `CDDRS` and corresponding information in `README.md` and `README_en.md`.
2025-08-21 20:10:16 +08:00
Oneb1
5ab392358e Update README.md 2025-08-21 20:05:56 +08:00
Hongru0306
f30ddbcd1a CDDRS 2025-08-21 19:59:29 +08:00
KMnO4-zx
d35df306ed refactor: 将参数名从keyargs改为kwargs以符合惯例
修改forward方法的参数命名,使其更符合Python常用命名规范
2025-08-07 19:37:01 +08:00
KMnO4-zx
ebe52dc086 docs: 更新文档中的图片文件 2025-08-07 12:40:08 +08:00
KMnO4-zx
0428271b7f fix: 替换硬编码的API密钥为占位符文本 2025-08-06 21:25:08 +08:00
Logan Zou
590363587c Update transformer.py 2025-08-04 10:16:50 +08:00
KMnO4-zx
b7e1a26255 docs: 更新README和vLLM思考预算文档链接
更新README.md文件,添加新的Extra Chapter文章链接。同时修正vLLM思考预算文档中的环境镜像链接,提供可访问的URL
2025-08-03 17:23:54 +08:00
KMnO4-zx
9a882a92ed feat(vllm-thinking-budget): 添加思考预算功能实现及文档
- 实现基于vLLM的思考预算功能,通过迭代生成和特定词插入引导模型深入思考
- 添加相关图片资源和详细说明文档,包括论文背景、代码实现和结果分析
2025-08-03 17:21:49 +08:00
Logan Zou
d278182a90 Update 第二章 Transformer架构.md 2025-07-30 20:52:28 +08:00
KMnO4-zx
18d1f56840 增加 Qwen3-"VL" 超小中文多模态模型拼接微调的链接,并更新贡献者信息 2025-07-30 11:00:59 +08:00
不要葱姜蒜
3a8eb17848 Merge pull request #100 from ShaohonChen/add-qwen-smolvlm
Extra Chapter: 增加多模态模型拼接教程
2025-07-30 10:33:11 +08:00
ShaohonChen
f192a4ecd4 修复错误文件夹拼写 2025-07-30 10:07:13 +08:00