中文混淆语料生成:1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。
-
Notifications
You must be signed in to change notification settings - Fork 0
中文混淆语料生成,可用于训练或测试中文纠错模型。1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。
License
currenttime/chinese_confusion
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
中文混淆语料生成,可用于训练或测试中文纠错模型。1.支持字符级别的形近字及音近字。2.支持双字词语的音近字生成。3.结合字符和词语级别,随机生成句子级别中文混淆语料。
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published