Founce
|
5dd78a0fe8
|
fix(chapter5): align labels/attention_mask semantics and add padding-aware batch generation (#170)
|
2026-02-26 15:34:10 +08:00 |
|
KMnO4-zx
|
827808c1e3
|
新增对 .obsidian 和 .claude 目录的忽略规则
|
2026-02-25 21:16:40 +08:00 |
|
Li Xu
|
973ae3c8a5
|
Update 第二章 Transformer架构.md 修正2.3.2 位置编码中对符号 i 定义的说明 (#140)
|
2026-02-25 21:03:09 +08:00 |
|
inf Lu
|
85d8c83ca4
|
fix: correct LayerNorm class indentation (#144)
|
2026-02-25 21:00:57 +08:00 |
|
Genghong Hu
|
8908c4a8c3
|
fix: typo of torch dimension (#151)
|
2026-02-25 20:56:19 +08:00 |
|
yuqi zhou
|
77aff4b66a
|
新增dropout层描述,防止初学者歧义 (#153)
|
2026-02-25 20:55:11 +08:00 |
|
xbsheng
|
45f826b6d8
|
doc: 7B -> 70亿 (#159)
|
2026-02-25 20:49:06 +08:00 |
|
ZW Zhang
|
cf5809bfbf
|
Merge pull request #160 from Hanguangwu/main
fix: typo
|
2026-02-25 20:46:59 +08:00 |
|
不要葱姜蒜
|
4935557ec0
|
Merge pull request #165 from Curricane/fix_fnn_describe
修正 FNN 的描述
|
2026-02-25 20:45:34 +08:00 |
|
chenmch
|
723d618114
|
修正 FNN 的描述
|
2026-02-05 14:29:00 +08:00 |
|
KMnO4-zx
|
55735f3cf2
|
更新 Happy-LLM PDF 下载链接至 v1.0.2,并添加 PPT 资源下载说明
|
2026-01-29 14:36:56 +08:00 |
|
不要葱姜蒜
|
07355dfeb6
|
Merge pull request #155 from sjjjoaps/main
优化了大规模数据读取逻辑,解决了一次性加载所有数据导致内存占用过大以及训练过程中内存占用持续上升的问题
v1.0.2
|
2026-01-03 11:28:55 +08:00 |
|
sjjjoaps
|
dce7904c96
|
同步更改第五章教学描述情况。优化了数据加载的逻辑
|
2026-01-03 10:02:13 +08:00 |
|
sjjjoaps
|
94e6e4a5be
|
优化了大规模数据读取逻辑,解决了一次性加载所有数据导致内存占用过大以及训练过程中内存占用持续上升的问题
|
2026-01-02 11:30:42 +08:00 |
|
不要葱姜蒜
|
47164fcca5
|
Merge pull request #154 from 1985312383/main
增加暗黑模式切换和图片点击放大功能
|
2025-12-25 16:13:25 +08:00 |
|
柯慕灵
|
7b83aa6118
|
Implement dark mode styles in index.html
Added dark mode styles and functionality to the documentation.
|
2025-12-25 16:04:19 +08:00 |
|
KMnO4-zx
|
de9d9e0048
|
update readme
|
2025-12-04 10:58:17 +08:00 |
|
Logan Zou
|
7b091acc64
|
Merge pull request #133 from zxuuuustupid/patch-1
fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
|
2025-11-18 10:48:07 +08:00 |
|
不要葱姜蒜
|
88f31c0d14
|
Merge pull request #136 from jackyzzy/main
修复Agent在处理信息格式时的错误
|
2025-11-07 17:53:28 +08:00 |
|
KMnO4-zx
|
21bac613c0
|
修正 AI 普惠课程的机构名称描述
|
2025-11-07 15:18:30 +08:00 |
|
KMnO4-zx
|
63e88022f3
|
添加 AI 普惠课程报名信息
|
2025-11-07 15:01:16 +08:00 |
|
jackyzzy
|
1c0a0c22e1
|
修复Agent在处理信息格式时的错误
|
2025-11-05 11:27:06 +08:00 |
|
KMnO4-zx
|
3afabec1a8
|
update readme
|
2025-10-17 20:25:33 +08:00 |
|
KMnO4-zx
|
72b41341e1
|
Add: Exter Chapter LLM-generation-method
|
2025-10-17 17:11:05 +08:00 |
|
KMnO4-zx
|
b9172031c8
|
修正 .env_example 文件中的平台名称描述
|
2025-10-07 10:55:59 +08:00 |
|
不要葱姜蒜
|
46b509c9c1
|
Merge pull request #132 from JX446/patch-2
Update 第七章 大模型应用.md
|
2025-10-07 10:53:45 +08:00 |
|
Zhixu Duan
|
4ed47f3918
|
fix(docs): 修复第二章 Transformer架构.md 中的公式和矩阵显示错误
这是一个简单的文档修复,解决了 `第二章 Transformer架构.md` 文件中的两个显示问题。
1. **公式修复 (2.2.3节):** 公式 `$Z_j^{i}$` 因空格问题未能正确显示,现已修复。
2. **矩阵格式修复 (2.3.2节):** 一个矩阵被错误地显示成了一行。现已通过换行进行格式化,使其能够以正确的矩阵形式显示。
|
2025-10-02 12:26:44 +08:00 |
|
JX446
|
fc6c8c81ee
|
Update 第七章 大模型应用.md
轨迹->硅基
|
2025-09-21 21:11:23 +08:00 |
|
KMnO4-zx
|
9c461438c7
|
feat:部分章节添加章节引言
|
2025-09-16 22:11:05 +08:00 |
|
不要葱姜蒜
|
50bd19efb4
|
Merge pull request #126 from Sheeran02/patch-1
Update requirements.txt
|
2025-09-13 17:20:51 +08:00 |
|
施旭伦
|
712415e0a7
|
Update requirements.txt
torchdata的DataPipes在最新版本中被废弃
|
2025-09-12 17:05:31 +08:00 |
|
Logan Zou
|
9098d6527f
|
Update 第二章 Transformer架构.md
|
2025-08-28 10:19:34 +08:00 |
|
Logan Zou
|
550d9bd40c
|
Update 第三章 预训练语言模型.md
|
2025-08-28 10:18:30 +08:00 |
|
Logan Zou
|
59ea8f65ad
|
Clarify BERT's position encoding in chapter 3
|
2025-08-28 10:15:14 +08:00 |
|
Logan Zou
|
edbcd3ad38
|
Update 第二章 Transformer架构.md
|
2025-08-22 23:49:20 +08:00 |
|
Logan Zou
|
76b3cb848f
|
Add files via upload
|
2025-08-22 23:48:08 +08:00 |
|
KMnO4-zx
|
6ce019cb2e
|
docs(CDDRS): 更新文献引用格式并添加作者和关键词信息
|
2025-08-21 21:49:11 +08:00 |
|
不要葱姜蒜
|
0e09304c88
|
Merge pull request #114 from Hongru0306/main
Add `CDDRS` and corresponding information in `README.md` and `README_en.md`.
|
2025-08-21 20:10:16 +08:00 |
|
Oneb1
|
5ab392358e
|
Update README.md
|
2025-08-21 20:05:56 +08:00 |
|
Hongru0306
|
f30ddbcd1a
|
CDDRS
|
2025-08-21 19:59:29 +08:00 |
|
KMnO4-zx
|
d35df306ed
|
refactor: 将参数名从keyargs改为kwargs以符合惯例
修改forward方法的参数命名,使其更符合Python常用命名规范
|
2025-08-07 19:37:01 +08:00 |
|
KMnO4-zx
|
ebe52dc086
|
docs: 更新文档中的图片文件
|
2025-08-07 12:40:08 +08:00 |
|
KMnO4-zx
|
0428271b7f
|
fix: 替换硬编码的API密钥为占位符文本
|
2025-08-06 21:25:08 +08:00 |
|
Logan Zou
|
590363587c
|
Update transformer.py
|
2025-08-04 10:16:50 +08:00 |
|
KMnO4-zx
|
b7e1a26255
|
docs: 更新README和vLLM思考预算文档链接
更新README.md文件,添加新的Extra Chapter文章链接。同时修正vLLM思考预算文档中的环境镜像链接,提供可访问的URL
|
2025-08-03 17:23:54 +08:00 |
|
KMnO4-zx
|
9a882a92ed
|
feat(vllm-thinking-budget): 添加思考预算功能实现及文档
- 实现基于vLLM的思考预算功能,通过迭代生成和特定词插入引导模型深入思考
- 添加相关图片资源和详细说明文档,包括论文背景、代码实现和结果分析
|
2025-08-03 17:21:49 +08:00 |
|
Logan Zou
|
d278182a90
|
Update 第二章 Transformer架构.md
|
2025-07-30 20:52:28 +08:00 |
|
KMnO4-zx
|
18d1f56840
|
增加 Qwen3-"VL" 超小中文多模态模型拼接微调的链接,并更新贡献者信息
|
2025-07-30 11:00:59 +08:00 |
|
不要葱姜蒜
|
3a8eb17848
|
Merge pull request #100 from ShaohonChen/add-qwen-smolvlm
Extra Chapter: 增加多模态模型拼接教程
|
2025-07-30 10:33:11 +08:00 |
|
ShaohonChen
|
f192a4ecd4
|
修复错误文件夹拼写
|
2025-07-30 10:07:13 +08:00 |
|