-->
获得免费通行证,加入我们的流媒体连接-2月19日至22日; 现在注册!

可搜索视频:精确搜索,精确定位

大洪水始于小雨滴的噼里啪啦声,网络上的视频也是如此. 的小, 我们今天在网站上看到的不稳定视频很快就会变成全画幅视频, 全动态视频集成到许多, 如果不是大多数, 企业和娱乐网站. 就像雅虎一样, 激发, Alta Vista让我们可以浏览数十亿字的网络文本, 视频搜索引擎也将使我们能够浏览数百万小时的基于网络的流媒体视频.

在视频搜索中使用了多种技术——文本分析, 语音识别, 语言处理, 视频分析, 甚至人脸识别. 可用的视频搜索技术使用这些方法中的一种或组合-通常根据要搜索的视频类型进行调整. 通过将所有这些技术结合在一起,可以实现真正有效的搜索. “你现在可以设置非常复杂的搜索,卡洛斯·蒙塔尔沃说, 负责产品和营销的副总裁 Virage公司.它是一家视频搜索提供商,拥有包括CNN、ABC新闻和CNET在内的一系列令人印象深刻的客户. “例如, 把麦克斯的所有节目都找出来, 在屏幕上, 卡洛斯的声音在屏幕外采访麦克斯, 他们正在CNN频道上谈论经济.你可以找到那个片段."

视频内容本身就很吸引人, 这种精准度可以对用户产生更强的吸引力,对流媒体广告客户也有同样强大的激励, 谁可以用它来针对那些通过他们使用的搜索词揭示自己商业倾向的消费者.


基于文本的搜索方法

视频搜索应用相对较新,但其概念是基于较老的技术. 事实上, 旧的基于文本的“查找和替换”技术的复杂版本构成了当今尖端视频搜索引擎的基本组成部分.

亚瑟王的神剑技术 维也纳, VA, 他在模式识别业务领域有18年的经验,在世界各地的大型政府机构和企业内部网中部署了文本检索软件, 是为数不多的视频搜索先驱之一吗. 大卫Nunnerly, 王者之剑媒体服务集团的高级副总裁, 指出的那样, “尽管我们在互联网上做视频搜索, 它仍然是99%的文本. 在一天结束时,人们输入一个文本查询来找到他们想要的东西. 他们想要回视频,但实际的索引和搜索是文本. 如果你没有一个好的文本引擎,你真的不能做好的视频搜索."

可搜索的文本索引可以从已经附加到视频的文本元数据中派生出来, 比如字幕, 或者通过使用语音到文本的引擎,比如由 Lernout & HauspieIBM、微软等. 在诸如广播之类的受控环境中, 培训, 或者企业传播, 语音识别开发人员声称准确率高达90%. “(语音识别)不是一个完美的系统, 但如果你只是想推导一个用于搜索的索引, 那就不必如此了,克里希纳·潘达拉说, 联合创始人及副主席 MediaSite是视频搜索引擎领域的另一个主要参与者. “这不是听写测试. 我们在玩线索游戏,问题是你能在视频中收集到多少线索?"

Virage的Montalvo也认为视频搜索并不需要完美的精确度才能有效. “如果我们有一段视频说, “下午好, 我是山姆·唐纳森,在最高法院的台阶上为您报道, 今天法官判定克林顿藐视法庭,我在那段视频中只认出了“Sam Donaldson”。, “最高法院”, “克林顿”, 和“有罪”, 我现在可以用这四个搜索词来找到那个片段,他说. “我不需要百分百准确的文字记录来获取剪辑."

一旦获得文本,就可以对其进行分析,以确定主题的变化. MediaSite的Pendyala解释道, 语言处理技术根据单词的频率和与大量历史文本的相关性来评分. 例如, “space”这个词在一部关于太空旅行的电影中不会得到很高的评价,因为它会被到处使用.Excalibur的nunnly提供了另一个例子:“如果我输入‘熊猫在中国,我们的语义网络将允许我区分“中国”这个国家和“中国”茶杯,他说. “它明白‘中国’有不同的含义,你可以用不同的方式利用这一点."


音频分析:随机应变

Virage还提供了一个独立的分析引擎,可以识别视频存档中每个不同的说话者. 使用这种技术, 单个新闻故事或公司演讲可以通过注意演讲者的变化来区分. “事实证明,每个人都有一个独特的语言‘签名’,”蒙塔尔沃说. “因此,与此同时,我们正在将语音转换为文本, 我们把说话人标记为山姆或者卡洛斯或者其他什么人. 你可以试着改变你的声音,但没关系. 它仍然能识别你的语音,准确率超过90%."

语音并不是音轨中唯一可以用作搜索视频元数据的信息. Virage提供了一个音频分类引擎,可以识别独特的音频信号-掌声, 笑声, 一声枪响, 或者是一首商业广告歌. 蒙塔尔沃指出:“这些音频信号通常与视频事件联系在一起. 例如,笑声的音轨总是与一个笑话联系在一起. 搜索每一个笑的轨道,你现在可以搜索每一个笑话在情景喜剧. 或者某个产品有相关的广告曲, 你可以发现广告歌播放了四次,并且知道广告播放了四次, 因为广告歌只和广告一起播放."


视频算法:分析视频模式

分析视觉信息的第一步是将视频分割成可管理的离散片段序列,由视频缩略图的“故事板”表示. 使用像素分析算法,将每一帧与前一帧进行比较, 剪辑首先根据场景转换(如剪切)进行分段, 褪色和溶解. 王者之剑的尼姑莉解释道, “我们有一个寻找‘切断’阈值的算法, [用于修饰]有多少像素发生了变化, 还有“渐隐”阈值, 寻找像素在亮度和亮度方面的变化. 每一种效果背后都有一个算法,可以用数学方法比较像素,并实时运行."

不同类型的视频内容反映出不同的细分模式, 并且算法的灵敏度可以进行相应的调整. MediaSite的Pendyala举了一个例子:“当你看足球时, 这很容易分割——整个动作在演出前停止. 在这种情况下,你要做动作分析,当它停止时,那就是戏剧的开始."

《百家乐软件》则更进一步,它提供了与许多不同类型的视频相对应的预定义算法设置. "There aren't a lot of cuts within sporting events; there are a lot of big, 扫着锅跟着跑过田野的人,丹·阿甘说, 营销副总裁. “但在音乐视频或电视剧中,为了制造悬念,会有很多剪辑. 因此,通过增加或减少各种算法的灵敏度,你可以提高这些不同类型的准确性. 你可以把它们想象成预设. 这对顾客来说是件省时的事."

其他视觉事件,如变焦和灯光变化,也可以用来分割视频. 《百家乐软件》的nunnly提供了这样一个例子:“想象一下,你已经消化并分析了晚间新闻的视频. 在那个视频中, 通常会有一个主播的形象,在一个图形的角落插入一个新闻故事. 你可以以此为线索, 你得到的可能是相同的锚, 但是不同的故事有不同的图形. 所以你基本上已经建立了一种为不同的故事找到切入点的方法."

Virage最近宣布了两项新的分析技术——能够读取在视频上键入的屏幕文本(比如一个人的名字), 运动时间和比分, 或者一个节目的名字)以及识别面孔的能力. 后者对广播特别有用, 企业沟通, 销售及培训, 以及会议行业, 大部分的视频内容都是由说话的头组成的. “人脸识别算法会查看眼睛、鼻子和面部那部分的独特几何形状和特征向量,蒙塔尔沃说. “所以它并不真正受到面部毛发变化的影响, 不管是长发, 短的头发, 或胡子, 甚至衰老, 因为你脸上的那部分变化不大. 这其实很准确."


视频搜索

广播新闻机构是最早采用网络视频搜索功能的机构之一. 用户可以输入关键字来快速定位他们感兴趣的故事——这是一种方便的方式,用户可以个性化他们的视频新闻,并随时观看. 但是,这种增加的便利是否证明开发或授权一个有效的视频搜索引擎所付出的所有努力——更不用说费用了? 答案就在于人们期待已久的电视与互联网的“融合”, 以及它刺激电子商务的潜力.

CNET的模式可能预示着未来的融合媒体技术. 这家在线内容先驱的科技相关电视节目时长比其他任何网络都要长. 当你搜索掌上电脑的时候, 你不仅会得到评论, 用户组, and buyer's guides; you also get video from CNET's vast library. 视频搜索功能使CNET的电视材料变得非常集中, 个人, 以及网站上的互动内容.

视频搜索引擎的开发者们押注,基于搜索标准投放广告的能力将推动对其产品的需求. “如果互联网要继续依靠广告模式发展, 它将基于目标广告, 选择性的广告, 以及与社区相关的广告, 而不是我们从广播空间了解到的插页式广告,蒙塔尔沃说. “如果用户根据特定关键词搜索片段,就向他展示这则广告. 如果他看到了相同的片段,但基于不同的关键字,给他看一个不同的广告. 使用可搜索视频的个人可以提取他们想要的视频, 取决于他们如何调出那段视频, 内容提供商可以针对并选择具有该吸引力的广告. 它变得不那么侵扰,更吸引人."


企业角度

视频搜索对于网络上电子商务的扩展同样重要, 企业内部网对视频搜索功能的需求可能会使公共互联网的需求相形见绌. 根据Virage的说法, 波音公司已经存档了超过400万小时的视频,并制作了100多个,每年新增000小时. 洛克希德/马丁公司仅在培训和交流方面就有超过30万小时. 让这些庞大的视频档案易于搜索和供成千上万的公司员工访问的价值并不需要太多的想象力.

例如,可口可乐、宝洁等公司 & 甘布尔和通用汽车每年制作多达1万小时的焦点小组镜头. 然后花费在分析视频上的钱是投入制作时的三倍. 今天, 这是一个人类的过程——人们看录像带, 来回穿梭, 看看人们如何评价他们的产品. 带视频搜索, 个别产品经理和工程师可以很快看到他们想要什么, 当他们需要的时候.


快进

目前可搜索视频的应用只是冰山一角. 随着视频的普及, 互联网上易于获取的百家乐软件, 提供搜索技术和提供可搜索内容的公司的潜力将急剧增长.

可预见的应用有很多. 你可能已经决定在后院建造一个“自己动手”的锦鲤池塘. 为什么不登录网络,搜索一个“如何”的视频呢? 或者想象一下,你在厨房里摆弄着酒焖鸡. 你可能想看一段视频,看看朱莉娅·查尔德说的“用白兰地烧鸡”到底是什么意思.“我们甚至还没有开始探索视频点播的无数使用方式. 但正如蒙塔尔沃所观察到的,“所有模拟的东西都将走向数字化,内容将成为货币. 就像任何货币一样,如果你找不到它,你就没有它."

流媒体覆盖
免费的
合资格订户
现在就订阅 最新一期 过去的问题
提及的公司及供应商