新版本中我们全面上线了LLM知识库问答服务。为了保障服务的稳定性,每个机器人每月有 1000次 大模型调用配额(自启用日起计算)
- 超过配额后将停止LLM文档问答和问答增强的能力,基础的“常用问答”服务仍可维持。
- 配额仅在未被“常用问答”和“任务技能”召回,且可以检索到内容相关性时消耗
- 建议优先配置常用问题库,既能降低LLM消耗,又能提升回答精准度。
功能上线后我们陆续收到开发者反馈,大模型配额不够满足实际业务的使用,希望进一步扩容。
考虑到资源公平分配,我们将开放邮件申请通道。并在评估后,提升对应机器人的大模型配额。
发送邮件至:wechatopenai@tencent.com
邮件标题【LLM配额申请】并提供以下信息:
1. 1、机器人ID
2. 2、月调用量预估
3. 3、应用场景说明