VITA在腾讯TokenHub平台上怎么使用?
摘要:
腾讯云TokenHub平台是VITA模型的官方接入渠道。以下内容将详细说明如何在TokenHub平台上开通VITA服务、获取API密钥、调用API接口,以及通过ADP平台进行无代码配置接入。

一、腾讯云TokenHub平台简介
腾讯云TokenHub平台,简单说,就是腾讯云提供的一个模型服务平台。用户在这里可以开通VITA多模态理解模型服务、拿到API密钥,然后通过兼容OpenAI API协议的接口直接调用。
在TokenHub平台上,VITA模型的调用名称是youtu-vita。目前提供两个可用模型,关键要看你的场景是否需要处理音频:
可选模型 | 介绍 |
|---|---|
vita-video-3.0 | 支持视频画面(不含音频)和图片。如果不需要处理音频,这个模型是首选。 |
vita-video-long | 支持视频(含画面和音频)和图片。需要处理音频时,必须选它。 |
二、开通VITA服务步骤
2.1 第一步:登录腾讯云控制台
先访问腾讯云官网,登录你的腾讯云控制台。
2.2 第二步:进入TokenHub平台
在控制台里,找到并进入“腾讯云TokenHub平台”页面。
2.3 第三步:创建API密钥
进入平台后,创建一个API密钥。需要提醒的是,每个账号会赠送100万免费Token额度,足够用来测试和评估VITA的各项能力。
2.4 第四步:开始调用
拿到密钥后,就可以根据API接入文档进行接口调用了。VITA API兼容OpenAI API协议,直接用OpenAI SDK就能接入。
三、API接入说明
3.1 接口基础信息
配置过程其实不复杂,核心参数如下:
接口协议:兼容OpenAI Completions API协议
BaseURL:https://tokenhub.tencentmaas.com/v1
接口路径:/chat/completions
请求方式:POST
调用方式:支持流式或非流式,根据需要选择
授权方式:Bearer Token
3.2 请求参数说明
参数名 | 必选 | 类型 | 描述 |
|---|---|---|---|
model | 是 | String | 模型名称,可选值: |
messages | 是 | Array | 需要理解的内容。 |
stream | 否 | Boolean | 是否启用流式输出,取值范围 |
temperature | 否 | Float | 输出随机性,取值范围 |
top_p | 否 | Float | 输出多样性(核采样),取值范围 |
max_tokens | 否 | Integer | 限制最大输出Token数。 |
stop | 否 | Array of String | 指定输出停止序列,最多4个。 |
3.3 messages参数结构
messages是一个数组,每个元素包含role和content字段:
字段 | 必选 | 类型 | 描述 |
|---|---|---|---|
role | 是 | String | 角色,固定为 |
content | 是 | Array | 需要理解的内容。 |
而content本身也是一个数组,每个元素包含type字段和对应的内容字段:
字段 | 必选 | 类型 | 描述 |
|---|---|---|---|
type | 是 | String | 输入类型,可选值: |
text | 是 | String | 自定义的理解指令。 |
image_url | 否 | Object | 需要理解的图片信息。 |
video_url | 否 | Object | 需要理解的视频信息。 |
四、调用示例
4.1 示例1:输入为视频
代码语言:bash
复制
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-long","messages": [{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "
如果视频不含音频,建议使用vita-video-3.0模型。
4.2 示例2:输入为图片
代码语言:bash
复制
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-3.0","messages": [{"role": "user", "content": [{"type": "image_url", "image_url": {"url": "
4.3 示例3:使用OpenAI SDK接入
代码语言:python
复制
from openai import OpenAIclient = OpenAI(api_key="YOUR_API_KEY",base_url="https://tokenhub.tencentmaas.com/v1")response = client.chat.completions.create(model="vita-video-long",messages=[{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "
五、输入文件格式要求
5.1 视频输入限制
封装格式:MP4、MOV、A VI、WebM
编码格式:H.264、H.265
文件大小:默认最大100MB,特殊情况下(白名单)可支持最大600MB
一次请求仅支持1个视频
5.2 图片输入限制
封装格式:JPG、JPEG、PNG、WebP
文件大小:单图最大10MB
一次请求最多10张图片
另外值得注意的是,YT-VITA支持一次传入多张图片(最多10张),而HY-Vision系列模型一次仅可传入单张图片。
六、总结
在腾讯云TokenHub平台上使用VITA模型,主要就两种方式:一是直接调用兼容OpenAI API协议的接口,适合有开发能力的用户;二是通过ADP平台进行无代码配置接入,适合希望快速上线的用户。