-->

谷歌发布800万个YouTube url数据集用于视频研究

文章特色图片

为了帮助视频研究人员和学生,谷歌发布了一个 800万个YouTube视频url的数据集 代表了超过50万小时的视频. 这是迄今为止最大的视频库(第二大的是一个包含100万个体育视频的数据集, 谷歌在声明中指出), 这将对视频建模架构和表示学习等领域的研究人员有很大的帮助.

“我们相信这个数据集可以大大加快视频理解的研究,因为它使研究人员和学生在没有大数据或大机器的情况下以前所未有的规模进行研究,软件工程师Sudheendra Vijayanarasimhan和Paul Natsev写道.

因为大多数研究人员不会有大量的存储和CPU能力来处理这样的数据集, Google对视频进行了预处理,并从1个视频帧中每秒提取一个视频帧.90亿视频帧. 然后对集合进行压缩,使其适合于1.5tb硬盘.

该数据集由观看次数超过1000次的公共视频组成. 使用频率分析对视频中识别的物体进行标记, 自动过滤, 以及人类的验证. 视频被分成24个顶级垂直(如下图所示). 欲了解更多关于谷歌如何创建该集合的详细信息,请阅读其 技术报告

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
相关文章

FameBit现在是谷歌/YouTube的一部分,连接品牌与人才

谷歌收购了一家成立三年的初创公司,该公司提供自助服务市场,公司可以在这里雇佣视频影响者.

YouTube将谷歌首选扩展到热门视频

各大品牌现在可以在当天最热门的视频片段上获得他们的信息, 不管那些片段是什么, 谷歌首选.