首页 > 教程攻略 > ai教程 >VITA在腾讯TokenHub平台上怎么使用?

VITA在腾讯TokenHub平台上怎么使用?

来源:互联网 时间:2026-06-24 07:19:59

摘要:

腾讯云TokenHub平台是VITA模型的官方接入渠道。以下内容将详细说明如何在TokenHub平台上开通VITA服务、获取API密钥、调用API接口,以及通过ADP平台进行无代码配置接入。

VITA在腾讯TokenHub平台上怎么使用?

一、腾讯云TokenHub平台简介

腾讯云TokenHub平台,简单说,就是腾讯云提供的一个模型服务平台。用户在这里可以开通VITA多模态理解模型服务、拿到API密钥,然后通过兼容OpenAI API协议的接口直接调用。

在TokenHub平台上,VITA模型的调用名称是youtu-vita。目前提供两个可用模型,关键要看你的场景是否需要处理音频:

可选模型

介绍

vita-video-3.0

支持视频画面(不含音频)和图片。如果不需要处理音频,这个模型是首选。

vita-video-long

支持视频(含画面和音频)和图片。需要处理音频时,必须选它。

二、开通VITA服务步骤

2.1 第一步:登录腾讯云控制台

先访问腾讯云官网,登录你的腾讯云控制台。

2.2 第二步:进入TokenHub平台

在控制台里,找到并进入“腾讯云TokenHub平台”页面。

2.3 第三步:创建API密钥

进入平台后,创建一个API密钥。需要提醒的是,每个账号会赠送100万免费Token额度,足够用来测试和评估VITA的各项能力。

2.4 第四步:开始调用

拿到密钥后,就可以根据API接入文档进行接口调用了。VITA API兼容OpenAI API协议,直接用OpenAI SDK就能接入。

三、API接入说明

3.1 接口基础信息

配置过程其实不复杂,核心参数如下:

接口协议:兼容OpenAI Completions API协议
BaseURL:https://tokenhub.tencentmaas.com/v1
接口路径:/chat/completions
请求方式:POST
调用方式:支持流式或非流式,根据需要选择
授权方式:Bearer Token

3.2 请求参数说明

参数名

必选

类型

描述

model

String

模型名称,可选值:vita-video-3.0vita-video-long。在TokenHub平台上也可以用youtu-vita,两者等价。

messages

Array

需要理解的内容。

stream

Boolean

是否启用流式输出,取值范围true / false,默认false

temperature

Float

输出随机性,取值范围[0.0, 2.0]

top_p

Float

输出多样性(核采样),取值范围[0.0, 1.0]

max_tokens

Integer

限制最大输出Token数。

stop

Array of String

指定输出停止序列,最多4个。

3.3 messages参数结构

messages是一个数组,每个元素包含rolecontent字段:

字段

必选

类型

描述

role

String

角色,固定为user(用户)。

content

Array

需要理解的内容。

content本身也是一个数组,每个元素包含type字段和对应的内容字段:

字段

必选

类型

描述

type

String

输入类型,可选值:text(文本指令)、image_url(图片)、video_url(视频)。

text

String

自定义的理解指令。

image_url

Object

需要理解的图片信息。

video_url

Object

需要理解的视频信息。

四、调用示例

4.1 示例1:输入为视频

代码语言:bash

复制

curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-long","messages": [{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "

如果视频不含音频,建议使用vita-video-3.0模型。

4.2 示例2:输入为图片

代码语言:bash

复制

curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' -H 'Authorization: Bearer YOUR_API_KEY' -H 'Content-Type: application/json' -d '{"model": "vita-video-3.0","messages": [{"role": "user", "content": [{"type": "image_url", "image_url": {"url": ""}},{"type": "image_url", "image_url": {"url": ""}},{"type": "text", "text": "请描述图片的内容"}]}],"stream": false}'

4.3 示例3:使用OpenAI SDK接入

代码语言:python

复制

from openai import OpenAIclient = OpenAI(api_key="YOUR_API_KEY",base_url="https://tokenhub.tencentmaas.com/v1")response = client.chat.completions.create(model="vita-video-long",messages=[{"role": "user", "content": [{"type": "video_url", "video_url": {"url": "

五、输入文件格式要求

5.1 视频输入限制

封装格式:MP4、MOV、A VI、WebM
编码格式:H.264、H.265
文件大小:默认最大100MB,特殊情况下(白名单)可支持最大600MB
一次请求仅支持1个视频

5.2 图片输入限制

封装格式:JPG、JPEG、PNG、WebP
文件大小:单图最大10MB
一次请求最多10张图片

另外值得注意的是,YT-VITA支持一次传入多张图片(最多10张),而HY-Vision系列模型一次仅可传入单张图片。

六、总结

在腾讯云TokenHub平台上使用VITA模型,主要就两种方式:一是直接调用兼容OpenAI API协议的接口,适合有开发能力的用户;二是通过ADP平台进行无代码配置接入,适合希望快速上线的用户。

相关阅读