二零一七年十一月三日
By Nadine Krefetz 特约编辑
专题文章

SMW 17:微软媒体 & 机器学习

在过去的12-18个月里，针对媒体的机器学习有了很大的发展, 微软认知服务工具现在提供全文音频转录, 人脸检测, 视频稳定, 视频光学字符识别, 面对修订, 运动检测, 面部情绪检测, 视频摘要, 内容审核, VOD内容的对象检测. 在流媒体西部周四, 微软负责通信和媒体的首席软件开发工程师安迪·比奇(Andy Beach)分享了该公司为内容所有者所做的事情, 开发人员, 数据科学家可以使用人工智能工具，轻松索引和搜索数小时的视频内容.

这些工具将从视频内容中提取元数据，并对元数据中发现的信息进行管理. 智能输出到一个嵌入式播放器, 一组小部件为查看器提供交互功能,比奇说。. “我们创建了一系列与机器学习相关的api，并将其产品化，使任何人都可以轻松入门."

这些“产品”将有助于提高内容的可发现性, 增强用户粘性, 希望能增加内容价值. 在线婚恋公司Match.com尝试了人工智能工具进行内容审核, 识别过于淫秽的视频或图像，不宜发布. Nexx.电视使用人工智能工具构建了一个更好的广告用例, analyzing its content's full text metadata to deliver targeted ad overlays; i.e., 如果内容是关于汽车的, 它可以即时将相关广告与视频内容进行匹配，从而提供更加个性化的广告覆盖.

训练人工智能

第一步是训练人工智能. “第一个版本是可以的，但不是很好，因为你必须训练它，”比奇说. 例如, 识别一段内容中的所有人, 人工智能需要了解每个人是谁. 然而，一旦完成了这一点，就可以使用比奇所说的人类热图. 一个特定的人的所有实例都可以在一个视频片段中识别出来, 然后在视频滚动条中以图形方式表示. 在下面的图表中, 茱莉亚·怀特出现了4%的视频, 观众可以直接进入她出现的每一个片段. 在她的剪辑中使用的最常见的关键词也显示在屏幕上，这些也是可点击的.