通过分析线上用户的 AI 视频生成请求,构建多模态标签、视频质量评估与场景分析框架,为模型、产品、数据方向的迭代提供决策输入。
团队的大方向仍然是卷模型能力。但距离线上用户请求和行为反馈最近的团队,是 DA 团队。
用户 Prompt
输入图片 / 视频
模型生成结果
Excel / 样本数据
分析任务需求
团队级打标产品
数据上传
Prompt 配置
批量调度
结果导出
标签树
维度设计
输出 Schema
Prompt 模板
文本理解
图片理解
视频理解
Good / Bad Case
任务拆解
证据提取
多轮判断
结果校验
结构化标签
结果表
Prompt 模板库
标签树资产
样本案例库
用户意图分析
产品分析
场景分析
Good / Bad Case
数据补齐判断
模型优化支持
不是“需要打标签”这么简单,而是工具、框架和模型能力同时到了边界。
对普通分析师和整个团队来说,批量调用模型、调 Prompt、处理多模态输入和解析结果,本身就是一套复杂工程。
现在的痛点不是没人打标签,而是标签五花八门,各打各的,结构很散。
复杂多模态判断,
已经触及模型上限。
判断一个 AI 视频是否真正可用,往往涉及长上下文、时序关系、多模态参考和质量标准。单轮调用会漏判、误判,或者给出不稳定结论。
从个人脚本走向团队级打标产品,把接口调用、批量处理、重试、解析和模型适配封装起来。
它经历了产品构想、MVP 验证、架构设计与开发,再到真实用户反馈驱动的持续迭代。
传统打标常常要 1-2 周:取数、拆字段、写脚本、调接口、清洗结果,分析师很难把这件事变成日常能力。
非开发背景同学不熟 API、批处理、结构化输出和多模态输入,脚本能力无法团队化。
先搭出最短链路:选列、写指令、试跑小样本、确认效果,再启动全量打标。
MVP 验证重点不是功能堆满,而是确认分析师是否真的能不用代码完成一次打标。
分析师看到的是上传 Excel、填写 Prompt、查看结果;背后则由前端、后端、云服务和数据库共同支撑,让一次打标任务可以被运行、追踪、复用和沉淀。
面向分析师的任务配置、Excel 上传、试标、结果回查和模板管理界面。
承接任务创建、批量调度、失败重试、结果解析和模型调用适配。
后端服务部署在 Cloud Run,前端通过 Firebase Hosting 承载,模型接入 Vertex AI。
保存任务、样本、标签结果、Prompt 模板、回查记录和结构化输出。
可标的功能不是一次想完整,而是在使用中不断暴露新的摩擦点,再用产品能力接住。
先试标少量样本,在线回查原文与结果,用统计分布判断质量,再把成熟 Prompt 放进模板库。
面对 700+ 节点标签树,直接一次性让模型判断会带来上下文溢出和错判。
不再把标签当成一堆字段,而是把用户输入、画面元素、意图和业务应用放进同一条链路。
这类请求看起来只是一个 Prompt,但实际同时包含素材类型、主体参考、动作控制、镜头控制、风格偏好和质量评估标准。
单轮调用已经触及多模态理解模型的能力上限,所以复杂内容判断必须被拆成可规划、可取证、可复核的工作流。
可标先降低团队打标成本;更关键的是,标签体系把线上用户需求转成业务反馈,反哺模型训练和行业判断。