KMnO4-zx
|
4a8feba16b
|
docs: 更新README中的star-history图片并添加trendshift徽章
- 替换README文件中的star-history图片
- 删除旧的star-history图片文件
- 在docs/README中添加trendshift徽章
|
2025-07-06 09:41:25 +08:00 |
|
KMnO4-zx
|
fdba985389
|
docs: 调整章节标题层级结构
|
2025-07-06 09:38:24 +08:00 |
|
KMnO4-zx
|
c017cc4eaf
|
docs: 在README.md中添加Trendshift徽章
|
2025-07-06 09:36:45 +08:00 |
|
KMnO4-zx
|
c0373e2f22
|
docs: 在README.md中添加Trendshift徽章链接
|
2025-07-06 09:36:01 +08:00 |
|
KMnO4-zx
|
505b22b834
|
docs(chapter5): 修正LLaMA2模型文档中的表述错误
|
2025-07-04 09:13:55 +08:00 |
|
KMnO4-zx
|
d5e84523ef
|
docs(chapter5): 修正章节5.3.2标题中的拼写错误
|
2025-07-04 09:10:21 +08:00 |
|
KMnO4-zx
|
f50df92095
|
refactor(RAG): 改进文本分块逻辑以正确处理长行和空格
重构文本分块算法,保留空格并优化长行处理
使用token级别分割避免跨单词分割问题
添加覆盖内容逻辑以保持上下文连贯性
|
2025-07-04 09:07:52 +08:00 |
|
KMnO4-zx
|
5c474e4730
|
docs(chapter5): 修正章节编号错误并保持一致性
|
2025-07-04 09:01:45 +08:00 |
|
不要葱姜蒜
|
4112cf0f01
|
Merge pull request #66 from Zeyi-Lin/main
update: chapter 6 use swanlab
|
2025-07-03 19:43:24 +08:00 |
|
ZeYi Lin
|
daac10cb67
|
add requirements
|
2025-07-03 19:42:02 +08:00 |
|
ZeYi Lin
|
c342402a9b
|
fix name
|
2025-07-03 18:23:12 +08:00 |
|
ZeYi Lin
|
08a0fa8c3e
|
update code
|
2025-07-03 18:21:26 +08:00 |
|
ZeYi Lin
|
db3a162cd8
|
chapter 6 use swanlab
|
2025-07-03 18:18:44 +08:00 |
|
KMnO4-zx
|
0d2471d3ee
|
docs(chapter7): update content
|
2025-06-28 10:43:44 +08:00 |
|
不要葱姜蒜
|
a5e7622e1f
|
Merge pull request #55 from gift-is-coding/patch-1
Update 前言.md
|
2025-06-27 12:28:24 +08:00 |
|
Tiff Wu
|
ebc0f077d3
|
Update 前言.md
Typo of Language
|
2025-06-27 11:24:30 +07:00 |
|
KMnO4-zx
|
643226e252
|
docs(chapter5): 更新tokenizer训练数据加载说明
使用出门问问序列猴子开源数据集替代wikitext数据集,并添加JSONL文件读取方法
|
2025-06-26 11:02:10 +08:00 |
|
KMnO4-zx
|
d8150c8e7b
|
docs: 更新项目star历史图表并移除多余的语言切换链接
- 用新的star历史图表(2025624)替换旧的(2025612)
- 从docs/README.md中移除中英文切换链接
|
2025-06-24 16:21:03 +08:00 |
|
Logan Zou
|
edb73c7aeb
|
Update 第二章 Transformer架构.md
|
2025-06-24 10:54:02 +08:00 |
|
Logan Zou
|
71f8d48290
|
Update 第二章 Transformer架构.md
|
2025-06-23 11:09:04 +08:00 |
|
Logan Zou
|
98a122e323
|
Update 第二章 Transformer架构.md
add pre-norm
|
2025-06-23 11:02:23 +08:00 |
|
Logan Zou
|
5f2ccc44bf
|
Update 第二章 Transformer架构.md
fix arg bug
|
2025-06-23 10:53:45 +08:00 |
|
Logan Zou
|
3950b06a5f
|
Update transformer.py
fix arg bug
|
2025-06-23 10:53:25 +08:00 |
|
Logan Zou
|
185a212acd
|
Update 第二章 Transformer架构.md
|
2025-06-23 10:50:16 +08:00 |
|
Logan Zou
|
bd3fb6cf48
|
Update transformer.py
fix dim bug
|
2025-06-23 10:48:56 +08:00 |
|
KMnO4-zx
|
3b24a9fd1e
|
docs: 更新README和文档内容,添加模型下载链接
- 在README中新增模型下载章节,包含ModelScope链接
- 更新模型示例代码中的默认检查点路径
- 优化训练脚本的注释和参数说明
- 添加中文文档的模型下载和体验地址
- 修复文档中的训练时长和设备信息
|
2025-06-22 10:05:36 +08:00 |
|
KMnO4-zx
|
b421894dcc
|
docs(chapter3): 修正T5模型中RMSNorm公式的描述和参数说明
|
2025-06-21 13:36:42 +08:00 |
|
KMnO4-zx
|
fc19776feb
|
docs(chapter4): 修正章节编号错误
|
2025-06-21 13:35:09 +08:00 |
|
KMnO4-zx
|
30f3f01619
|
refactor(dataset): 使用tokenizer动态生成a_sequence并替换硬编码值
fix(ddp_sft_full): 修正参数默认值和优化器类型
docs(ddp_pretrain): 添加详细注释和优化参数描述
|
2025-06-21 11:39:40 +08:00 |
|
KMnO4-zx
|
21bc50882a
|
docs: 更新README文件中的徽章样式和链接
- 将徽章样式从for-the-badge改为flat
- 添加GitHub Project和SwanLab项目链接
- 更新第六章状态为进行中
|
2025-06-21 11:37:30 +08:00 |
|
KMnO4-zx
|
4fcb1924dd
|
docs: 更新第六章状态为进行中
|
2025-06-20 23:02:40 +08:00 |
|
KMnO4-zx
|
fe07d0ede1
|
feat(RAG): 更新RAG模块代码和文档
refactor: 简化Embeddings和LLM类实现,移除不必要依赖
docs: 更新文档内容,添加硅基流动API使用说明
chore: 更新requirements.txt依赖版本
|
2025-06-20 22:53:23 +08:00 |
|
KMnO4-zx
|
0eea57b11f
|
docs: 修复章节2中Embedding层的拼写错误
|
2025-06-20 15:04:23 +08:00 |
|
KMnO4-zx
|
dcdf98df22
|
docs(chapter7): 修正图7.10的标题描述
|
2025-06-20 12:17:39 +08:00 |
|
KMnO4-zx
|
2b9b53a383
|
docs: 调整文档中图片位置并删除重复内容
|
2025-06-20 12:15:19 +08:00 |
|
KMnO4-zx
|
28636a0f9b
|
feat(Agent): 新增维基百科搜索和温度查询工具并实现web界面
- 添加search_wikipedia和get_current_temperature工具函数
- 实现基于Streamlit的web交互界面
- 更新requirements.txt添加相关依赖
- 修复PROMPT_TEMPLATE变量名拼写错误
- 移除不再使用的工具函数
- 添加web界面截图到文档
|
2025-06-20 12:14:19 +08:00 |
|
不要葱姜蒜
|
cdf10fea16
|
Merge pull request #43 from MengYue-MK2000/main
更新Windows下载Datasets的方法
|
2025-06-20 00:40:12 +08:00 |
|
MengYue-MK2000
|
b1ac936d36
|
created windows_download_dataset.sh, deleted original changes in download_dataset.sh
|
2025-06-19 17:52:24 +08:00 |
|
Reagan Zhang
|
18ff1a73a8
|
Update download_dataset.sh
Update Mac installation for modelscope
|
2025-06-19 16:09:59 +08:00 |
|
Reagan Zhang
|
56fb0c34d4
|
Update download_dataset.sh
|
2025-06-19 16:06:05 +08:00 |
|
KMnO4-zx
|
2601c45444
|
docs(chapter5): 修复LLaMA2 Attention结构图中图片链接格式
|
2025-06-18 16:33:43 +08:00 |
|
KMnO4-zx
|
2fca30c239
|
docs(chapter5): 更新LLaMA2注意力机制图示
|
2025-06-18 16:32:07 +08:00 |
|
KMnO4-zx
|
ce535629ca
|
docs(chapter5): 更新模型文档并添加数据处理脚本
- 更新LLaMA2模型文档,修正图片引用和编号
- 添加Attention结构示意图
- 新增数据处理脚本download_dataset.sh和deal_dataset.py
- 优化文档中的代码示例说明
|
2025-06-18 16:26:33 +08:00 |
|
KMnO4-zx
|
ada2e0c44f
|
fix(download.py): 修复解压命令未指定目标目录的问题
|
2025-06-18 12:34:52 +08:00 |
|
KMnO4-zx
|
5d25cb0992
|
docs: 更新README中图片路径引用
|
2025-06-17 17:18:34 +08:00 |
|
KMnO4-zx
|
20a4bde837
|
docs(chapter1): 在NLP基础概述中添加词汇表说明
|
2025-06-17 17:10:45 +08:00 |
|
KMnO4-zx
|
1f46fc1dd5
|
docs: 更新文档中的图片链接为绝对路径
将所有文档中的相对图片路径替换为完整的GitHub raw链接,确保图片在文档中能够正确显示
|
2025-06-17 17:07:09 +08:00 |
|
KMnO4-zx
|
6dd4815b1e
|
docs(chapter4): 修正大语言模型章节中的公式格式和空格
统一公式前后空格格式,提高文档可读性
|
2025-06-17 12:21:31 +08:00 |
|
KMnO4-zx
|
d49819cd9d
|
docs(chapter4): 修正奖励模型公式中的数学符号和格式错误
修复公式中的数学符号显示问题,包括 KL 散度计算和奖励函数中的点乘符号
|
2025-06-17 12:16:06 +08:00 |
|
KMnO4-zx
|
08ee8ef753
|
docs(chapter2): 修正自注意力机制文档中的错别字
|
2025-06-15 09:45:06 +08:00 |
|