阶跃AI多模态功能应用：利用图片识别快速生成表格数据

来源：互联网时间：2026-07-03 08:17:06

先把碟片或书脊竖着排成一排，在自然光下拍照，单张图片别超过40个脊标。然后上传到跃问App，输入CSV指令，或者用飞书多维表格的捷径批量处理，最后人工校对导出。

家里堆积如山的DVD、蓝光碟和旧书，想变成可排序可搜索的电子清单，又不想手动敲标题？用阶跃AI的多模态功能，拍张照就能生成结构化表格，识别准确率足够高，操作路径也很清晰。

准备藏品与拍照

关键前提：碟片或书籍要竖着排成一排，露出完整的书脊或碟盒侧标。横放或堆叠的话，文字被遮挡，AI识别失败率会陡增。

自然光充足的地方拍摄，避免玻璃反光、手指遮挡或阴影覆盖文字区域。单张照片最多40个脊标，超了容易漏识，宁可多拍几张，也别贪多。

打开跃问App，点右下角的“+”号，选“图片创作”，从相册里把刚拍的照片传上去。上传完后，在输入框里直接写指令：“请识别图中所有实体物品的标题、作者/发行方、年份，按三列输出为CSV格式，不要额外解释。”

注意，不能只说“提取文字”——那样AI很可能给你一段描述，而不是表格结构。指定CSV格式，就能直接粘贴到Excel或飞书多维表格，省去二次整理的功夫。

第一步：打开飞书多维表格，新建一个字段，类型选“图片”，然后点击右侧的“字段捷径”图标。

第二步：勾选“阶跃星辰｜图像理解”，在Prompt模板里删掉默认描述，换成：“提取本图中所有物品名称及对应年份，输出为两列JSON数组，键名为title和year。”

第三步：一次性上传5到8张藏品照片，点击“运行捷径”，表格就会自动填充结果，每张图对应一行，字段值实时更新。

飞书这个功能是免费的，不过单次最多处理10张图，超了要分批。如果某张图识别异常，系统会在对应行标红提示，点击就能重新触发识别。

逐行检查AI输出的标题有没有错字，比如《三体》被误写成《三休》，年份有没有错位——AI常把条形码数字当成发行年。重点核对那些封面相似的碟片。

确认无误后，在多维表格里全选数据，右键点击“导出为CSV”，用Excel打开就能排序、筛选、加颜色标签了。

这一步千万别跳过——AI再强也依赖图像质量，人工扫一眼只要5分钟，比后期返工两小时省力多了。