首页 > 教程攻略 > ai资讯 >阶跃AI多模态功能应用:利用图片识别快速生成表格数据

阶跃AI多模态功能应用:利用图片识别快速生成表格数据

来源:互联网 时间:2026-07-03 08:17:06

先把碟片或书脊竖着排成一排,在自然光下拍照,单张图片别超过40个脊标。然后上传到跃问App,输入CSV指令,或者用飞书多维表格的捷径批量处理,最后人工校对导出。

家里堆积如山的DVD、蓝光碟和旧书,想变成可排序可搜索的电子清单,又不想手动敲标题?用阶跃AI的多模态功能,拍张照就能生成结构化表格,识别准确率足够高,操作路径也很清晰。

准备藏品与拍照

关键前提:碟片或书籍要竖着排成一排,露出完整的书脊或碟盒侧标。横放或堆叠的话,文字被遮挡,AI识别失败率会陡增。

自然光充足的地方拍摄,避免玻璃反光、手指遮挡或阴影覆盖文字区域。单张照片最多40个脊标,超了容易漏识,宁可多拍几张,也别贪多。

必须保证每行文字清晰可辨。模糊或倾斜超过15度的照片,AI会直接跳过整行不识别。

上传图片并调用Step-1o Vision

打开跃问App,点右下角的“+”号,选“图片创作”,从相册里把刚拍的照片传上去。上传完后,在输入框里直接写指令:“请识别图中所有实体物品的标题、作者/发行方、年份,按三列输出为CSV格式,不要额外解释。”

注意,不能只说“提取文字”——那样AI很可能给你一段描述,而不是表格结构。指定CSV格式,就能直接粘贴到Excel或飞书多维表格,省去二次整理的功夫。

批量处理多张图(飞书多维表格捷径法)

第一步:打开飞书多维表格,新建一个字段,类型选“图片”,然后点击右侧的“字段捷径”图标。

第二步:勾选“阶跃星辰|图像理解”,在Prompt模板里删掉默认描述,换成:“提取本图中所有物品名称及对应年份,输出为两列JSON数组,键名为title和year。”

第三步:一次性上传5到8张藏品照片,点击“运行捷径”,表格就会自动填充结果,每张图对应一行,字段值实时更新。

飞书这个功能是免费的,不过单次最多处理10张图,超了要分批。如果某张图识别异常,系统会在对应行标红提示,点击就能重新触发识别。

校对与导出

逐行检查AI输出的标题有没有错字,比如《三体》被误写成《三休》,年份有没有错位——AI常把条形码数字当成发行年。重点核对那些封面相似的碟片。

确认无误后,在多维表格里全选数据,右键点击“导出为CSV”,用Excel打开就能排序、筛选、加颜色标签了。

这一步千万别跳过——AI再强也依赖图像质量,人工扫一眼只要5分钟,比后期返工两小时省力多了。

相关下载