公海彩船6600
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 帮助企业解答网站类型的一篇文章绝对值得一看

    2026-05-31 13:26

    平时在企业老说网站建设,那么企业网站建设有几种类型呢?现在网站建设分为了很多种,根据企业的需求不同,所以网站建设的类型也不一样,下面公海彩船6600小编就来说一下常见的几种网站建设类型。1、产品展

  • 极具“现实感”的网站界面设计要素

    2026-05-19 13:34

    关于网站开发如何设计微网站界面,公海彩船6600专业人士说用户体验占了很大一部分。如今各种微端使用量正在逐步增大,那么网站建设同样也需要量体设计。我们在设计网站时首先会考虑到如何提高用户停留时间、

  • 公海彩船6600网站建设中策划阶段的重要性

    2026-05-15 08:58

    在进行网站建设设计之前,首先要对市场及同行业进行分析,然后确定网站设计的目的及其功能,并针对网站设计规模、费用和建设周期及最后的网站推广进行详尽的规划。最终可以使网站建设按计划有序地进行,才

  • CB Insights报告:2018年12个AI趋势

    2026-05-13 23:12

    其中关于中美双雄时代的趋势,量子位之前已经专文搬运过,其中核心要点是:2017年数据显示,中国AI创业公司融资比美国还多。在2017年,全球AI创业公司总共融资125亿美元,其中48%的资金

  • 互联网医疗架起“问诊”高速路

    2026-05-11 08:42

    疫情期间,一位美籍华人不幸在美国纽约感染了新冠肺炎,在当地医疗资源紧张的情况下,通过线上网站开发平台,他联系到在中国武汉抗疫一线的呼吸科专家苏远,在医生的指导下,与病毒斗争了12天后

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-05-14 07:01
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。