-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

SMW 17:微软媒体 & 机器学习

文章特色图片

在过去的12-18个月里,针对媒体的机器学习有了很大的发展, 微软认知服务工具现在提供全文音频转录, 人脸检测, 视频稳定, 视频光学字符识别, 面对修订, 运动检测, 面部情绪检测, 视频摘要, 内容审核, VOD内容的对象检测. 在流媒体西部周四, 微软负责通信和媒体的首席软件开发工程师安迪·比奇(Andy Beach)分享了该公司为内容所有者所做的事情, 开发人员, 数据科学家可以使用人工智能工具,轻松索引和搜索数小时的视频内容.

这些工具将从视频内容中提取元数据,并对元数据中发现的信息进行管理. 智能输出到一个嵌入式播放器, 一组小部件为查看器提供交互功能,比奇说。. “我们创建了一系列与机器学习相关的api,并将其产品化,使任何人都可以轻松入门."

这些“产品”将有助于提高内容的可发现性, 增强用户粘性, 希望能增加内容价值. 在线婚恋公司Match.com尝试了人工智能工具进行内容审核, 识别过于淫秽的视频或图像,不宜发布. Nexx.电视使用人工智能工具构建了一个更好的广告用例, analyzing its content's full text metadata to deliver targeted ad overlays; i.e., 如果内容是关于汽车的, 它可以即时将相关广告与视频内容进行匹配,从而提供更加个性化的广告覆盖. 

训练人工智能

第一步是训练人工智能. “第一个版本是可以的,但不是很好,因为你必须训练它,”比奇说. 例如, 识别一段内容中的所有人, 人工智能需要了解每个人是谁. 然而,一旦完成了这一点,就可以使用比奇所说的人类热图. 一个特定的人的所有实例都可以在一个视频片段中识别出来, 然后在视频滚动条中以图形方式表示. 在下面的图表中, 茱莉亚·怀特出现了4%的视频, 观众可以直接进入她出现的每一个片段. 在她的剪辑中使用的最常见的关键词也显示在屏幕上,这些也是可点击的.

出版商:即插即用

微软提供了三种口味的人工智能产品. 最容易使用的是内容发布者. “上传内容,我们会将其编入索引, 创建所有元数据, 创建一个全文可搜索的成绩单, 并提供小部件,以便您可以提供自定义内容的交互式观看体验,比奇说。. 视频内容的分析可以在接近实时的情况下完成, 十分钟的内容, 大概需要十分钟来处理.

开发人员:定制

微软有一个菜单选项,允许开发人员访问部分或全部视频AI api. 这些api专注于计算机视觉, 内容审核, 识别情绪, 人脸识别, 全文视频索引, Bing的演讲, 以及说话人识别.

数据科学家:基础设施

给那些想自己滚的人, 机器学习平台可供数据科学家训练他们自己的神经网络. “你可以使用我们的平台作为基础设施来进行计算或处理,”Beach说.

无论用户偏好是什么,他们都可以获得40个小时的免费访问权限来试用他们的工具 http://vi.Microsoft.com/

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
提及的公司及供应商