首页 > 教程攻略 > ai资讯 >如何在扣子中接入零一万物Yi系列模型作为创意写作内核

如何在扣子中接入零一万物Yi系列模型作为创意写作内核

来源:互联网 时间:2026-06-12 13:09:16

要在扣子(Coze)中使用零一万物Yi系列模型(比如Yi-1.5-9B-Chat、Yi-34B-Chat这样的),有一个雷区:平台默认不支持直接下拉选择。所以,得通过自定义HTTP插件来调用Yi模型的API——这是核心思路。

如何在扣子中接入零一万物Yi系列模型作为创意写作内核

说白了,你没法直接在Bot设置里选,必须自己部署服务,或者借助OpenRouter、Fireworks.ai这类第三方平台,走自定义插件+HTTP请求的路径。下面拆开来说。

确认Yi模型可用的API端点

零一万物目前还没有开放公共的SaaS版Yi模型API。所以,可行的方案是:要么自己用vLLM或llama.cpp部署一套,要么用已经支持Yi的第三方托管平台,比如OpenRouter、Fireworks.ai。这里有一个需要特别留意的地方:

如果打算用OpenRouter,得先在账户里开通Yi-34B-Chat的访问权限,否则请求直接返回403,白忙一场。

怎么验证API能不能用?很简单。用curl或者Postman,向 https://api.openrouter.ai/v1/chat/completions 发一个POST请求,请求头(Header)里带上 Authorization: Bearer sk-xxx,请求体(Body)里指定 model=zero-one-ai/Yi-34B-Chat。如果返回的状态码是200,并且响应体里确实有 choices[0].message.content 字段,那这条路就走通了。

创建HTTP请求插件

进入Bot编辑页面,找到「插件」菜单,点「创建插件」,类型选「HTTP请求」。

先填基本信息:插件名字可以叫“Yi创意写作内核”,描述里写清楚用途,比如“调用Yi-34B模型生成故事开头、人设草稿、对白润色等内容”。认证方式选「Bearer Token」,Token值填你在OpenRouter上拿到的密钥,或者私有服务的API Key。

接着配置请求细节:URL填 https://api.openrouter.ai/v1/chat/completions,方法选POST,请求头里加一项 Content-Type: application/json。请求体的模板可以这样写:

{ "model": "zero-one-ai/Yi-34B-Chat", "messages": [ { "role": "system", "content": "你是一名专注创意写作的资深编辑,语言风格灵动、具画面感,不使用列表、不解释原理,直接输出成品文本。" }, { "role": "user", "content": "{{input}}" } ], "temperature": 0.85, "max_tokens": 1024 }

配置Bot工作流调用插件

在Bot的「工作流」里新建一个节点,类型选「插件」,然后搜索并选中刚才创建的那个“Yi创意写作内核”插件。

第一步:加一个「用户输入」节点,变量名设为 user_prompt

第二步:把这个变量连到插件节点上,在插件参数里,把 input 字段绑定为 {{user_prompt}}

第三步:接着加一个「条件分支」节点。用来判断插件返回的结果里是否包含 choices 数组,并且数组长度至少为1。如果不符合条件,就走「失败路径」,返回一句提示,比如“Yi模型暂时不可用,请稍后重试”。

第四步:在成功路径上,用JSONPath提取 $.choices[0].message.content,这就是最终要回复给用户的内容。这一步不做,Bot就会原样返回整个API响应体,用户看到的是一堆乱码JSON——usage、id这些冗余字段全出来了,体验非常糟糕。

设计提示词工程层(可选,但强烈推荐)

方法一:在Bot的「提示词」设置里,system prompt可以这样写:

“你负责接收用户关于小说/剧本/广告文案的原始需求,将其转译为适配Yi模型理解的指令格式。例如用户说‘写一个赛博朋克风咖啡馆老板的独白’,你要生成:‘以第一人称视角,写一段200字内的独白,主角是经营义体改装咖啡馆的前网军,语气疲惫但暗藏讥诮,加入霓虹雨声和机械臂故障的细节’。”

方法二:在调用插件之前,加一个「代码」节点,用Ja vaScript动态拼接指令。举个例子:如果检测到用户输入里带“古风”两个字,就自动追加一句“使用文言短句,避免现代词汇”;如果带“儿童”,就追加“禁用隐喻与多音字,每句不超过12个字,押ang韵”。

需要特别警惕的是,Yi-34B对中文长文本的理解能力确实很强,但对那些“不要做什么”的否定指令,表现并不稳定。所以,所有约束条件都推荐用正向表述。比如,“只输出纯对话,不含动作描写”就比“不要写动作”要可靠得多。