收藏

分享

回答

置顶各位大佬帮帮我？精选热门

2022-05-2117419浏览问题模块：开放讨论问题

数据集里的视频特征是转换成了Patch?,frame_mask又是啥？

分享

1 个回答

Ting
2022-05-21
加粗
标红
插入代码
插入链接
插入图片
上传视频
请登录后发表内容
关闭
新增或编辑超链接
链接地址
确认取消
关闭
插入视频
视频链接
确认取消
发表
视频帧特征是由 Swin-Transformer 模型提取的。每个视频帧会提取出一个768维的向量，每个视频最多32帧（1秒1帧，超出截断）
baseline 代码中的 frame_mask 是用于指示哪些帧是可用的。因为模型要求输入为32帧，但是有些视频不足32帧。frame_mask 为 1 表示可用，为0表示不可用。
你好，麻烦通过点击下方“反馈信息”按钮，提供出现问题的。
待楼主反馈
2022-05-21
有用
回复
关闭
请选择投诉理由
广告内容
违法违规
恶意灌水内容
其他

请登录后发表内容

相关问题

问题标签

#微信大数据挑战赛