xinala-781
|
631f3e1252
|
Add files via upload
|
2025-07-19 16:38:01 +08:00 |
|
xinala-781
|
e30d1b023f
|
Delete Extra-Chapter/happyllm-note directory
|
2025-07-19 16:35:24 +08:00 |
|
xinala-781
|
0c62cdf91b
|
Merge branch 'datawhalechina:main' into main
|
2025-07-19 16:35:05 +08:00 |
|
不要葱姜蒜
|
eaeb79de63
|
Merge pull request #86 from xile42/fix-typo
fix: typo
|
2025-07-15 18:47:37 +08:00 |
|
xile42
|
906c9cc332
|
fix: typo
|
2025-07-15 17:41:44 +08:00 |
|
KMnO4-zx
|
cbe7245d6d
|
feat: 添加 Extra-Chapter 贡献者信息及 Transformer 模块设计解读链接
|
2025-07-14 10:42:31 +08:00 |
|
不要葱姜蒜
|
73f9d2a8b5
|
Merge pull request #82 from ditingdapeng/feat/transformer-architecture
feat: add extra-chapter transformer-architecture
|
2025-07-14 10:35:24 +08:00 |
|
dapeng
|
887ffc1c11
|
feat: add extra-chapter transformer-architecture
feat: update picture to center
|
2025-07-14 10:30:38 +08:00 |
|
不要葱姜蒜
|
87cd11bb0f
|
Merge pull request #80 from 0-yy-0/fix
修正部分内容
|
2025-07-14 10:00:41 +08:00 |
|
xinala-781
|
3597fcd9bc
|
Merge branch 'datawhalechina:main' into main
|
2025-07-13 23:09:55 +08:00 |
|
gaoliye
|
2f73221275
|
修正部分内容
|
2025-07-13 21:39:50 +08:00 |
|
KMnO4-zx
|
3e2df600ab
|
fix: 修正文档中错误的<BoS>标签为<BOS>
|
2025-07-13 20:50:03 +08:00 |
|
xinala-781
|
2d56d6aba5
|
Delete Extra-Chapter/happyllm-note/README.md
|
2025-07-13 17:00:37 +08:00 |
|
xinala-781
|
48845d6508
|
Add files via upload
|
2025-07-13 16:59:50 +08:00 |
|
xinala-781
|
ba2dca96c4
|
README
|
2025-07-13 15:57:25 +08:00 |
|
xinala-781
|
82fba276f8
|
补充训练数据集
权重太大了只能自己在本地跑一下,设备:RTX4060,运行时间30min
|
2025-07-13 15:56:57 +08:00 |
|
xinala-781
|
1519252f54
|
Happyllm课后项目实践与习题补充
|
2025-07-13 15:47:12 +08:00 |
|
xinala-781
|
615abaab9f
|
Delete happyllm-note directory
|
2025-07-13 15:46:28 +08:00 |
|
xinala-781
|
fdc2e0cc85
|
Happy_LLM课后实践项目与习题补充
|
2025-07-13 15:45:47 +08:00 |
|
KMnO4-zx
|
932d5c15e6
|
docs(chapter7): 调整RAG文档结构,将文档加载和切分步骤移到向量化之前
|
2025-07-12 11:47:16 +08:00 |
|
KMnO4-zx
|
441cfb6f07
|
docs: 更新README中Extra Chapter的路径和标题
将第八章大模型Blog的路径和标题更新为Extra Chapter LLM Blog,保持命名一致性
|
2025-07-12 00:46:10 +08:00 |
|
KMnO4-zx
|
418ac68375
|
docs(README): 更新README中的Extra Chapter说明和PR规范
更新README.md中的Extra Chapter部分,添加了日期标记并格式化说明文本。同时新增Extra-Chapter/Readme.md文件,详细说明Extra Chapter的目的、内容类型和PR贡献规范。
新增Extra-Chapter/Readme.md文件,包含:
- Extra Chapter的设立目的和内容类型
- PR贡献规范(目录结构、文件命名、内容质量要求)
- PR commit message模板
|
2025-07-11 22:31:49 +08:00 |
|
KMnO4-zx
|
47046ee0ea
|
update notebook
|
2025-07-11 22:12:59 +08:00 |
|
KMnO4-zx
|
e7c8f8c5c7
|
refactor: 清理Jupyter notebook中的输出结果以减小文件大小
|
2025-07-11 22:11:27 +08:00 |
|
KMnO4-zx
|
3faa3bba3c
|
docs(notebook): 更新Jupyter notebook内核和语言信息
更新notebook的kernelspec显示名称为'nlp'并添加语言信息,同时补充Python版本号
|
2025-07-11 22:06:10 +08:00 |
|
KMnO4-zx
|
79ce117769
|
docs: 添加第八章大模型Blog及微调小模型案例
在README.md中添加第八章大模型Blog章节,并新增Extra-Chapter目录包含微调小模型的实践案例,展示小模型在特定任务中的价值
|
2025-07-11 22:04:23 +08:00 |
|
KMnO4-zx
|
6a57e65fc3
|
update readme
|
2025-07-10 14:52:46 +08:00 |
|
KMnO4-zx
|
ed8879e80c
|
docs(chapter2): 修复Transformer文档中的格式和空格问题
|
2025-07-10 10:23:13 +08:00 |
|
KMnO4-zx
|
4a8feba16b
|
docs: 更新README中的star-history图片并添加trendshift徽章
- 替换README文件中的star-history图片
- 删除旧的star-history图片文件
- 在docs/README中添加trendshift徽章
|
2025-07-06 09:41:25 +08:00 |
|
KMnO4-zx
|
fdba985389
|
docs: 调整章节标题层级结构
|
2025-07-06 09:38:24 +08:00 |
|
KMnO4-zx
|
c017cc4eaf
|
docs: 在README.md中添加Trendshift徽章
|
2025-07-06 09:36:45 +08:00 |
|
KMnO4-zx
|
c0373e2f22
|
docs: 在README.md中添加Trendshift徽章链接
|
2025-07-06 09:36:01 +08:00 |
|
KMnO4-zx
|
505b22b834
|
docs(chapter5): 修正LLaMA2模型文档中的表述错误
|
2025-07-04 09:13:55 +08:00 |
|
KMnO4-zx
|
d5e84523ef
|
docs(chapter5): 修正章节5.3.2标题中的拼写错误
|
2025-07-04 09:10:21 +08:00 |
|
KMnO4-zx
|
f50df92095
|
refactor(RAG): 改进文本分块逻辑以正确处理长行和空格
重构文本分块算法,保留空格并优化长行处理
使用token级别分割避免跨单词分割问题
添加覆盖内容逻辑以保持上下文连贯性
|
2025-07-04 09:07:52 +08:00 |
|
KMnO4-zx
|
5c474e4730
|
docs(chapter5): 修正章节编号错误并保持一致性
|
2025-07-04 09:01:45 +08:00 |
|
不要葱姜蒜
|
4112cf0f01
|
Merge pull request #66 from Zeyi-Lin/main
update: chapter 6 use swanlab
|
2025-07-03 19:43:24 +08:00 |
|
ZeYi Lin
|
daac10cb67
|
add requirements
|
2025-07-03 19:42:02 +08:00 |
|
ZeYi Lin
|
c342402a9b
|
fix name
|
2025-07-03 18:23:12 +08:00 |
|
ZeYi Lin
|
08a0fa8c3e
|
update code
|
2025-07-03 18:21:26 +08:00 |
|
ZeYi Lin
|
db3a162cd8
|
chapter 6 use swanlab
|
2025-07-03 18:18:44 +08:00 |
|
KMnO4-zx
|
0d2471d3ee
|
docs(chapter7): update content
|
2025-06-28 10:43:44 +08:00 |
|
不要葱姜蒜
|
a5e7622e1f
|
Merge pull request #55 from gift-is-coding/patch-1
Update 前言.md
|
2025-06-27 12:28:24 +08:00 |
|
Tiff Wu
|
ebc0f077d3
|
Update 前言.md
Typo of Language
|
2025-06-27 11:24:30 +07:00 |
|
KMnO4-zx
|
643226e252
|
docs(chapter5): 更新tokenizer训练数据加载说明
使用出门问问序列猴子开源数据集替代wikitext数据集,并添加JSONL文件读取方法
|
2025-06-26 11:02:10 +08:00 |
|
KMnO4-zx
|
d8150c8e7b
|
docs: 更新项目star历史图表并移除多余的语言切换链接
- 用新的star历史图表(2025624)替换旧的(2025612)
- 从docs/README.md中移除中英文切换链接
|
2025-06-24 16:21:03 +08:00 |
|
Logan Zou
|
edb73c7aeb
|
Update 第二章 Transformer架构.md
|
2025-06-24 10:54:02 +08:00 |
|
Logan Zou
|
71f8d48290
|
Update 第二章 Transformer架构.md
|
2025-06-23 11:09:04 +08:00 |
|
Logan Zou
|
98a122e323
|
Update 第二章 Transformer架构.md
add pre-norm
|
2025-06-23 11:02:23 +08:00 |
|
Logan Zou
|
5f2ccc44bf
|
Update 第二章 Transformer架构.md
fix arg bug
|
2025-06-23 10:53:45 +08:00 |
|