MSCBSC 移动通信论坛
搜索
登录注册
网络优化工程师招聘专栏 4G/LTE通信工程师最新职位列表 通信实习生/应届生招聘职位

  • 阅读:862
  • 回复:0
自主思考 语音技术真能听懂复杂命令?
mao_mao
论坛副管
鎵嬫満鍙风爜宸查獙璇


 发短消息    关注Ta 

C友·铁杆勋章   管理·勤奋勋章   C友·进步勋章   管理·优秀勋章   C友·贡献勋章   “灌水之王”   纪念勋章·七周年   管理·标兵勋章   活动·积极勋章   财富勋章·财运连连   财富勋章·大富豪   财富勋章·小财主   专家·终级勋章   财富勋章·神秘富豪   C友·登录达人   纪念勋章·五周年   财富勋章·富可敌国   财富勋章·财神   财富勋章·富甲一方   财富勋章·钻石王老五   活动·第二届通信技术杯   纪念勋章·六周年   活动·摄影达人   纪念勋章·八周年   纪念勋章·九周年   纪念勋章·十周年   C友·技术大神  
积分 428896
帖子 85070
威望 5085510 个
礼品券 5423 个
专家指数 3546
注册 2009-4-24
专业方向  移动通信
回答问题数 0
回答被采纳数 0
回答采纳率 0%
 
发表于 2016-08-10 14:32:20  只看楼主 

  语音助手极大的解放了人类的双手,当双手双眼被占用时,当无法在键盘上输入时,当打字不方便时,只需说出你的指令,应用便会自动进行下一步操作,就像请别人帮忙一样方便。不过对待语音助手可不能像对待朋友那般随意,你说出的指令要非常清晰,除了发音要字正腔圆之外,还要直接表达出指令的含义,这是由于语音助手不具备逻辑思考能力,它无法像人类一样去“理解”,语音助手背后的语音技术就显得尤为重要了。

  前一段时间,搜狗发布了“知 音”引擎,它是一种可以令人机交互更加自然的语音技术,有了它的帮助手机上的语音助手,以及其它支持语音输入功能的应用可以理解逻辑更为复杂的指令,而不 再需要“慢慢说”,甚至当你的指令有前后顺序和层级关系时它也能听懂,这就好比机器突然有了大脑一样。

  纠错

  其实当前的语 音技术是有一定的纠错能力的,比如使用语音输入时,当用户说出某个词语后应用会通过发音来判断是哪些文字,但在用户说出全部内容时,前面的某些词语还会继 续进行修正。不过一旦文字上屏就不能再次修改了,只能通过手动的方法删除,麻烦不说,也失去了语音输入的意义。

  搜狗输入法中已经接入了“知音”引擎,它具备理解纠错指令的能力,如果用户发现哪里输入错误,可以通过语音的方式来修改。受到环境、口音、语速等影响,语音输入时听错字是很正常的,通过实际测试来检验一下搜狗输入法语音输入的纠错能力。

  全部指令如下:

  “今天晚上七点,我和他一起去大望路吃饭,那边儿好停车”

  “女字旁的她”

  “把七点改为六点”

  “把大望路改成国贸”

  “叫上张爽一起去吧”

  “立早章”

  “删掉那边儿好停车”

  可以看到无论是输入时还是后期纠错,应用所给出的结果是完全正确的,语音修改也变成了一件很简单的操作。不仅如此,它还能够听懂用户发出的纠错指令并替换掉错误的内容,解决了听错字的问题。

  据搜狗语音交互技术中心负责人王砚峰表示,搜狗语音可以支持的文法数目在3万个以上,修改的成功率可达到80%,这些主要得益于丰富的词库数据、拆字库、用户输入的语料以及大量的百科知识图谱。而这些数据的来源除了语义系统架构之外,还有搜狗旗下支持语音的产品。

  逻辑指令

  上文中提到,大多数语音指令只能采用“单线程处理”,也就是说一个指令只能对应一项功能,且不同的指令之间不能有逻辑关系。但是搜狗“知音”引擎表示可 以做到。前面提到语音输入多用于双手不便打字的情况下,比如驾车时,语音导航是一个非常重要的助手。通常来说,使用语音导航时发出的指令逻辑性比较强,举 个例子:“我要去首都机场”,导航其实是不知道你要去哪个航站楼的,但搭载了“知音”引擎后,导航会直接请用户再发出更具体的指令,比如说出几号航站楼, 或者直接说出航班号,“知音”引擎会以此为依据,进一步确认目的地。

  在一些与我们生活更为贴近的方面,知音”引擎也在发挥作用,当用户发出“今天天气怎么样?”的指令时,由于意思明确非常容易理解,但当用户在给出答案之后再发出“那明天呢?”的指令时,通过语音技术的理解也可以正确给出明天的天气预报。

   对于人类来说,刚才的两句对话是有逻辑关系的,听者非常容易就能明白“那明天呢?”指的是明天的天气,但对于机器来说这并不简单,基于对多轮对话技术的语义理解能力,“知音”引擎技术能识别出这两条指令的前后关系,还是不错的。

  注意:这项技术还在不断的完善和优化中,它无法达到人类的思维能力和水准,对于逻辑关系太复杂的指令还不能正确识别。

  目前搜狗旗下部分应用已经搭载了“知音”引擎技术,比如搜狗的车载导航以及输入法等等,它还在升级的过程当中,未来可能会有更多的应用接入“知音”引擎,同时搜狗也表示愿意和能力更强的合作伙伴一起提升语音输入的交互体验。


扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 2、回复“ZGDX”免费领取《中国电信5G NTN技术白皮书
  • 3、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 4、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 5、回复“5GX3”免费领取《 R16 23501-g60 5G的系统架构1
  • 6、回复“iot6”免费领取《【8月30号登载】物联网创新技术与产业应用蓝皮书——物联网感知技术及系统应用
  • 7、回复“6G31”免费领取《基于云网融合的6G关键技术白皮书
  • 8、回复“IM6G”免费领取《6G典型场景和关键能力白皮书
  • 对本帖内容的看法? 我要点评

     
    [充值威望,立即自动到帐] [VIP贵宾权限+威望套餐] 另有大量优惠赠送活动,请光临充值中心
    充值拥有大量的威望和最高的下载权限,下载站内资料无忧

    快速回复主题    
    标题
    内容
     上传资料请点左侧【添加附件】

    当前时区 GMT+8, 现在时间是 2024-04-28 15:10:59
    渝ICP备11001752号  Copyright @ 2006-2016 mscbsc.com  本站统一服务邮箱:mscbsc@163.com

    Processed in 0.319003 second(s), 13 queries , Gzip enabled
    TOP
    清除 Cookies - 联系我们 - 移动通信网 - 移动通信论坛 - 通信招聘网 - Archiver