🤓 ASR 如何使用自己的语料在预训练模型上 finetune #1972
Replies: 6 comments 10 replies
-
请问预训练模型是怎么加载的呢 是否可以选择性的加载其他的预训练模型 |
Beta Was this translation helpful? Give feedback.
-
哪个是index文件?就是1、2、3.json 这种吗?这种json文件里面就几个字段,需要改什么? |
Beta Was this translation helpful? Give feedback.
-
假如我有很多数据,如何才能不使用预训练模型,而完全基于自己的数据训练新的模型。 |
Beta Was this translation helpful? Give feedback.
-
@makeukus 默认情况就是完全基于自己的数据训练的。按照数据集目录->模型结构去找示例就行了。 |
Beta Was this translation helpful? Give feedback.
-
如果我用tts 文字转成语音,然后构造自己语音片段和文字对应关系数据集,不知这种tts生成的音频数据是否可以做微调?声音的音色音调这些会对模型效果有影响吗? |
Beta Was this translation helpful? Give feedback.
-
I want to fine tune an asr model trained on librispeech with my own dataset specific to a domain, since it's said to use the vocab of the existing model to keep it consistent, but I want to append my vocabulary to the existing one, how do I do it? |
Beta Was this translation helpful? Give feedback.
-
先说一下 example 中数据处理的步骤:
如果你已经可以生成自己的 manifest 文件了,但是自己构建的 manifest 文件使用的词表长度和预训练模型的词表长度不一致,而你还希望用完整的预训练模型。那么,你可以在生成 manifest 文件的时候使用预训练的词表。也就是说,处理数据的时候,使用如下脚本:
Beta Was this translation helpful? Give feedback.
All reactions