输入tokens转文本 #73

panhu · 2024-11-06T02:59:50Z

是否可以将音频输入的tokens转文本，输出语音识别的文本结果

sixsixcoder · 2024-11-07T06:35:12Z

输出中包含文本信息和语音编码的token信息，你可以hack输出然后进行二次开发

panhu · 2024-11-07T08:56:31Z

感谢回复，我想请问下，当glm_model需要生成的答案很长的话，需要等待较长时间才有答复。想请教的是glm_model是否是流式生成还是一次性生成

sixsixcoder · 2024-11-07T09:44:35Z

GLM-4-voice默认支持流式生成，你可以在文件model_server.py中找到，
处理返回的流式内容

@app.post("/generate_stream")
async def generate_stream(request: Request):
    params = await request.json()

    generator = worker.generate_stream_gate(params)
    return StreamingResponse(generator)

panhu · 2024-11-13T08:24:25Z

感谢回复，当我参考web_demo进行流式测试时，能感觉到明显的卡顿感，貌似是因为固定的batch_size，让流不流畅？不知道我理解的对不对？有没有更好的解决方法

zRzRzRzRzRzRzR assigned sixsixcoder Nov 7, 2024

panhu mentioned this issue Nov 15, 2024

流式测试 #98

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

输入tokens转文本 #73

输入tokens转文本 #73

panhu commented Nov 6, 2024

sixsixcoder commented Nov 7, 2024

panhu commented Nov 7, 2024

sixsixcoder commented Nov 7, 2024

panhu commented Nov 13, 2024 •

edited

Loading

输入tokens转文本 #73

输入tokens转文本 #73

Comments

panhu commented Nov 6, 2024

sixsixcoder commented Nov 7, 2024

panhu commented Nov 7, 2024

sixsixcoder commented Nov 7, 2024

panhu commented Nov 13, 2024 • edited Loading

panhu commented Nov 13, 2024 •

edited

Loading