Skip to content

Latest commit

 

History

History
3 lines (3 loc) · 198 Bytes

readme.md

File metadata and controls

3 lines (3 loc) · 198 Bytes

包含自定义词表,以及自己实现的tokenize,detokenize。
pretrain_pipeline.py是流式输入数据。
各个程序直接使用Python运行即可,具体配置到代码里调整。