本月累计签到次数:

今天获取 积分

机器人的发展现状

机器人的发展现状

674 浏览

让机器人开口说话,依然令人头疼

机械自动化类 品管人生 2016-11-07 10:55 发表了文章 来自相关话题

对大部分人而言,机器人不能说话,那就不能代表是机器人。但说到机器人的说话能力,那就涉及到智能语音与语义,扯到语音与语义,这是让行业人士都头疼的问题。

 
虽然我们在实验室里测试,机器人的说话能力可以达到预期的效果,比如,在测试过程中,你问一个问题,机器人回答一个问题,这基本上符合要求。

 
但是要让机器人进入终端各种市场,面临的问题是非常大的。


主要是噪音问题,语音企业说在安静的场所下,语音的识别率可以达到95%以上,但是在现实生活中,到处充满着噪音,所以很难达到要求。

 
从一线市场反应的情况是,就算机器人进入到家庭,一个是电视机的播放声,导致机器人经常被唤醒;一个是让机器人处在一个四周都是玻璃门的环境中,识音效果是非常糟糕的;另外,我们人与人之间的对话是有停顿的,但是与机器人之间的对话还要控制好停顿的时间,需要把语言整理的比较顺畅才可以。

 
所以种种原因导致机器人进入终端市场,体验感非常差。这就是目前我们所面临的情况。

 
在这次1号机器人网研讨会上,很多嘉宾都清楚语音与语义的问题点出在哪里,虽然现在我们把智能语音分成语音与语义,但是这两者都将归为统一,这是趋势。

[login]
因为在产品使用的过程中,用户不能容忍语音编出来的文字,是非常不准确的,如果错误率高,那就是一个伪功能的产品。

 
所以不管是语音或语义企业,去收购团队也好,还是自己研发也好,语音与语义终归要一体化。

 
另外,大部分机器人企业基本上都接触过主流的语音与语义企业,都清楚每家都各有优缺点,例如:深圳市捷通华声科技有限公司(简称:捷通华声)可以对语言模型进行定制,在这一点上,科大讯飞股份有限公司(简称:科大讯飞)可以提供声学定制,但对于语言模型就显得很尴尬。


当我们用语音模型的时候,在音、字完全不对的情况下,这些东西就只能在后台纠错,这个纠错本身就是数据。

 
总的来说,目前不管是语音企业还是语义企业,提供产品还是很难达到预期效果的,深圳市狗尾草智能科技有限公司(简称:狗尾草)CTO王昊奋说:“很多情况下,不能单靠语音企业,语音企业要更加的开放,然后语义企业需要更积极的往前端迈一步,只有双方交集更紧密,这个生态圈才会更好。”

 
另外在语义方面,小i机器人是走在行业的前面,因为数据库很庞大,但对于机器人企业而言,不需要这么多的数据库,因为产品基本上都是场景驱动,只要达到听的少,说的自然就足够了。

 
从机器人企业这边反馈而来,其实现在语音企业的解决方案都很类似,在技术差不多的情况下,优势就体现在数据库。


在数据库方面,各家都有自己的优势,例如:科大讯飞的优势体现在教育领域,捷通华声的优势体现在高铁领域,苏州思必驰信息科技有限公司(简称“思必驰”)优势体现在车载领域,北京云知声信息技术有限公司(简称:云知声)的优势在医院应用领域等等。


所以在语义方面,走向专业化也是一个趋势,图灵机器人是针对通用领域,但目前瓶颈也是在通用型对话领域,图灵机器人技术总监孙永超说:“通用型是没有边界,我们现在能达到80%以上的语义理解准确率,但是达到80%以后,就很难提升了,所以现在图灵机器人下一步的重点将会聚焦在儿童领域。”


在语音与语义领域,我们还存在很多的技术难题,很多时候不只是识别声音,还有场景识别,包括:在家庭里,婴儿的哭声、电话的铃声、还有其他非人的声音等等。这些东西都需要再进行处理。

 
总之,现在还不能叫人工智能的时代,叫人工智障时代。
 

因为机器人更擅长大数据,只会计算,不会算计,只有智商,没有情商,现在的机器人还只是冰冷冷的东西,只会用一种调子讲话,离用户的期望还是很大的。


另外,还有降噪问题,目前是没有根本的解决方案,只能做一些技术上的改进。
 

深圳市中智科创机器人有限公司(简称:中智科创)市场部营销副总经理彭勋禄说:“针对语音与语义,我们也是希望有一家企业能提供解决方案,但是我们发现很难用起来,主要的原因是,我们设计的场景跟客户设计的场景会有很大的区别,如果我们在这上面做二次开发的代价是,比我们自己研发投入,其实是差不多的。”


王昊奋说:“甚至我们自己研发去做,情况还不会更坏,后续产品迭代会更有好处。”


特别是在麦克风阵列上,降噪是绕不过去的问题,如果短期内没有更好的解决方案,那么在成本上是我们需要去突破的。

 
目前麦克风阵列五麦的价格差不多是200元/个,但是对于做儿童陪伴机器人的企业而言,希望麦克风阵列价格能够控制在100元/个以内,这是需要语音企业去突破的。
[/login]
 
 
 
 
 
来源:1号机器人
智造家提供 查看全部
1.1_.jpg


对大部分人而言,机器人不能说话,那就不能代表是机器人。但说到机器人的说话能力,那就涉及到智能语音与语义,扯到语音与语义,这是让行业人士都头疼的问题。

 
虽然我们在实验室里测试,机器人的说话能力可以达到预期的效果,比如,在测试过程中,你问一个问题,机器人回答一个问题,这基本上符合要求。

 
但是要让机器人进入终端各种市场,面临的问题是非常大的。


主要是噪音问题,语音企业说在安静的场所下,语音的识别率可以达到95%以上,但是在现实生活中,到处充满着噪音,所以很难达到要求。

 
从一线市场反应的情况是,就算机器人进入到家庭,一个是电视机的播放声,导致机器人经常被唤醒;一个是让机器人处在一个四周都是玻璃门的环境中,识音效果是非常糟糕的;另外,我们人与人之间的对话是有停顿的,但是与机器人之间的对话还要控制好停顿的时间,需要把语言整理的比较顺畅才可以。

 
所以种种原因导致机器人进入终端市场,体验感非常差。这就是目前我们所面临的情况。

 
在这次1号机器人网研讨会上,很多嘉宾都清楚语音与语义的问题点出在哪里,虽然现在我们把智能语音分成语音与语义,但是这两者都将归为统一,这是趋势。

[login]
因为在产品使用的过程中,用户不能容忍语音编出来的文字,是非常不准确的,如果错误率高,那就是一个伪功能的产品。

 
所以不管是语音或语义企业,去收购团队也好,还是自己研发也好,语音与语义终归要一体化。

 
另外,大部分机器人企业基本上都接触过主流的语音与语义企业,都清楚每家都各有优缺点,例如:深圳市捷通华声科技有限公司(简称:捷通华声)可以对语言模型进行定制,在这一点上,科大讯飞股份有限公司(简称:科大讯飞)可以提供声学定制,但对于语言模型就显得很尴尬。


当我们用语音模型的时候,在音、字完全不对的情况下,这些东西就只能在后台纠错,这个纠错本身就是数据。

 
总的来说,目前不管是语音企业还是语义企业,提供产品还是很难达到预期效果的,深圳市狗尾草智能科技有限公司(简称:狗尾草)CTO王昊奋说:“很多情况下,不能单靠语音企业,语音企业要更加的开放,然后语义企业需要更积极的往前端迈一步,只有双方交集更紧密,这个生态圈才会更好。”

 
另外在语义方面,小i机器人是走在行业的前面,因为数据库很庞大,但对于机器人企业而言,不需要这么多的数据库,因为产品基本上都是场景驱动,只要达到听的少,说的自然就足够了。

 
从机器人企业这边反馈而来,其实现在语音企业的解决方案都很类似,在技术差不多的情况下,优势就体现在数据库。


在数据库方面,各家都有自己的优势,例如:科大讯飞的优势体现在教育领域,捷通华声的优势体现在高铁领域,苏州思必驰信息科技有限公司(简称“思必驰”)优势体现在车载领域,北京云知声信息技术有限公司(简称:云知声)的优势在医院应用领域等等。


所以在语义方面,走向专业化也是一个趋势,图灵机器人是针对通用领域,但目前瓶颈也是在通用型对话领域,图灵机器人技术总监孙永超说:“通用型是没有边界,我们现在能达到80%以上的语义理解准确率,但是达到80%以后,就很难提升了,所以现在图灵机器人下一步的重点将会聚焦在儿童领域。”


在语音与语义领域,我们还存在很多的技术难题,很多时候不只是识别声音,还有场景识别,包括:在家庭里,婴儿的哭声、电话的铃声、还有其他非人的声音等等。这些东西都需要再进行处理。

 
总之,现在还不能叫人工智能的时代,叫人工智障时代。
 

因为机器人更擅长大数据,只会计算,不会算计,只有智商,没有情商,现在的机器人还只是冰冷冷的东西,只会用一种调子讲话,离用户的期望还是很大的。


另外,还有降噪问题,目前是没有根本的解决方案,只能做一些技术上的改进。
 

深圳市中智科创机器人有限公司(简称:中智科创)市场部营销副总经理彭勋禄说:“针对语音与语义,我们也是希望有一家企业能提供解决方案,但是我们发现很难用起来,主要的原因是,我们设计的场景跟客户设计的场景会有很大的区别,如果我们在这上面做二次开发的代价是,比我们自己研发投入,其实是差不多的。”


王昊奋说:“甚至我们自己研发去做,情况还不会更坏,后续产品迭代会更有好处。”


特别是在麦克风阵列上,降噪是绕不过去的问题,如果短期内没有更好的解决方案,那么在成本上是我们需要去突破的。

 
目前麦克风阵列五麦的价格差不多是200元/个,但是对于做儿童陪伴机器人的企业而言,希望麦克风阵列价格能够控制在100元/个以内,这是需要语音企业去突破的。
[/login]
 
 
 
 
 
来源:1号机器人
智造家提供
674 浏览

让机器人开口说话,依然令人头疼

机械自动化类 品管人生 2016-11-07 10:55 发表了文章 来自相关话题

对大部分人而言,机器人不能说话,那就不能代表是机器人。但说到机器人的说话能力,那就涉及到智能语音与语义,扯到语音与语义,这是让行业人士都头疼的问题。

 
虽然我们在实验室里测试,机器人的说话能力可以达到预期的效果,比如,在测试过程中,你问一个问题,机器人回答一个问题,这基本上符合要求。

 
但是要让机器人进入终端各种市场,面临的问题是非常大的。


主要是噪音问题,语音企业说在安静的场所下,语音的识别率可以达到95%以上,但是在现实生活中,到处充满着噪音,所以很难达到要求。

 
从一线市场反应的情况是,就算机器人进入到家庭,一个是电视机的播放声,导致机器人经常被唤醒;一个是让机器人处在一个四周都是玻璃门的环境中,识音效果是非常糟糕的;另外,我们人与人之间的对话是有停顿的,但是与机器人之间的对话还要控制好停顿的时间,需要把语言整理的比较顺畅才可以。

 
所以种种原因导致机器人进入终端市场,体验感非常差。这就是目前我们所面临的情况。

 
在这次1号机器人网研讨会上,很多嘉宾都清楚语音与语义的问题点出在哪里,虽然现在我们把智能语音分成语音与语义,但是这两者都将归为统一,这是趋势。

[login]
因为在产品使用的过程中,用户不能容忍语音编出来的文字,是非常不准确的,如果错误率高,那就是一个伪功能的产品。

 
所以不管是语音或语义企业,去收购团队也好,还是自己研发也好,语音与语义终归要一体化。

 
另外,大部分机器人企业基本上都接触过主流的语音与语义企业,都清楚每家都各有优缺点,例如:深圳市捷通华声科技有限公司(简称:捷通华声)可以对语言模型进行定制,在这一点上,科大讯飞股份有限公司(简称:科大讯飞)可以提供声学定制,但对于语言模型就显得很尴尬。


当我们用语音模型的时候,在音、字完全不对的情况下,这些东西就只能在后台纠错,这个纠错本身就是数据。

 
总的来说,目前不管是语音企业还是语义企业,提供产品还是很难达到预期效果的,深圳市狗尾草智能科技有限公司(简称:狗尾草)CTO王昊奋说:“很多情况下,不能单靠语音企业,语音企业要更加的开放,然后语义企业需要更积极的往前端迈一步,只有双方交集更紧密,这个生态圈才会更好。”

 
另外在语义方面,小i机器人是走在行业的前面,因为数据库很庞大,但对于机器人企业而言,不需要这么多的数据库,因为产品基本上都是场景驱动,只要达到听的少,说的自然就足够了。

 
从机器人企业这边反馈而来,其实现在语音企业的解决方案都很类似,在技术差不多的情况下,优势就体现在数据库。


在数据库方面,各家都有自己的优势,例如:科大讯飞的优势体现在教育领域,捷通华声的优势体现在高铁领域,苏州思必驰信息科技有限公司(简称“思必驰”)优势体现在车载领域,北京云知声信息技术有限公司(简称:云知声)的优势在医院应用领域等等。


所以在语义方面,走向专业化也是一个趋势,图灵机器人是针对通用领域,但目前瓶颈也是在通用型对话领域,图灵机器人技术总监孙永超说:“通用型是没有边界,我们现在能达到80%以上的语义理解准确率,但是达到80%以后,就很难提升了,所以现在图灵机器人下一步的重点将会聚焦在儿童领域。”


在语音与语义领域,我们还存在很多的技术难题,很多时候不只是识别声音,还有场景识别,包括:在家庭里,婴儿的哭声、电话的铃声、还有其他非人的声音等等。这些东西都需要再进行处理。

 
总之,现在还不能叫人工智能的时代,叫人工智障时代。
 

因为机器人更擅长大数据,只会计算,不会算计,只有智商,没有情商,现在的机器人还只是冰冷冷的东西,只会用一种调子讲话,离用户的期望还是很大的。


另外,还有降噪问题,目前是没有根本的解决方案,只能做一些技术上的改进。
 

深圳市中智科创机器人有限公司(简称:中智科创)市场部营销副总经理彭勋禄说:“针对语音与语义,我们也是希望有一家企业能提供解决方案,但是我们发现很难用起来,主要的原因是,我们设计的场景跟客户设计的场景会有很大的区别,如果我们在这上面做二次开发的代价是,比我们自己研发投入,其实是差不多的。”


王昊奋说:“甚至我们自己研发去做,情况还不会更坏,后续产品迭代会更有好处。”


特别是在麦克风阵列上,降噪是绕不过去的问题,如果短期内没有更好的解决方案,那么在成本上是我们需要去突破的。

 
目前麦克风阵列五麦的价格差不多是200元/个,但是对于做儿童陪伴机器人的企业而言,希望麦克风阵列价格能够控制在100元/个以内,这是需要语音企业去突破的。
[/login]
 
 
 
 
 
来源:1号机器人
智造家提供 查看全部
1.1_.jpg


对大部分人而言,机器人不能说话,那就不能代表是机器人。但说到机器人的说话能力,那就涉及到智能语音与语义,扯到语音与语义,这是让行业人士都头疼的问题。

 
虽然我们在实验室里测试,机器人的说话能力可以达到预期的效果,比如,在测试过程中,你问一个问题,机器人回答一个问题,这基本上符合要求。

 
但是要让机器人进入终端各种市场,面临的问题是非常大的。


主要是噪音问题,语音企业说在安静的场所下,语音的识别率可以达到95%以上,但是在现实生活中,到处充满着噪音,所以很难达到要求。

 
从一线市场反应的情况是,就算机器人进入到家庭,一个是电视机的播放声,导致机器人经常被唤醒;一个是让机器人处在一个四周都是玻璃门的环境中,识音效果是非常糟糕的;另外,我们人与人之间的对话是有停顿的,但是与机器人之间的对话还要控制好停顿的时间,需要把语言整理的比较顺畅才可以。

 
所以种种原因导致机器人进入终端市场,体验感非常差。这就是目前我们所面临的情况。

 
在这次1号机器人网研讨会上,很多嘉宾都清楚语音与语义的问题点出在哪里,虽然现在我们把智能语音分成语音与语义,但是这两者都将归为统一,这是趋势。

[login]
因为在产品使用的过程中,用户不能容忍语音编出来的文字,是非常不准确的,如果错误率高,那就是一个伪功能的产品。

 
所以不管是语音或语义企业,去收购团队也好,还是自己研发也好,语音与语义终归要一体化。

 
另外,大部分机器人企业基本上都接触过主流的语音与语义企业,都清楚每家都各有优缺点,例如:深圳市捷通华声科技有限公司(简称:捷通华声)可以对语言模型进行定制,在这一点上,科大讯飞股份有限公司(简称:科大讯飞)可以提供声学定制,但对于语言模型就显得很尴尬。


当我们用语音模型的时候,在音、字完全不对的情况下,这些东西就只能在后台纠错,这个纠错本身就是数据。

 
总的来说,目前不管是语音企业还是语义企业,提供产品还是很难达到预期效果的,深圳市狗尾草智能科技有限公司(简称:狗尾草)CTO王昊奋说:“很多情况下,不能单靠语音企业,语音企业要更加的开放,然后语义企业需要更积极的往前端迈一步,只有双方交集更紧密,这个生态圈才会更好。”

 
另外在语义方面,小i机器人是走在行业的前面,因为数据库很庞大,但对于机器人企业而言,不需要这么多的数据库,因为产品基本上都是场景驱动,只要达到听的少,说的自然就足够了。

 
从机器人企业这边反馈而来,其实现在语音企业的解决方案都很类似,在技术差不多的情况下,优势就体现在数据库。


在数据库方面,各家都有自己的优势,例如:科大讯飞的优势体现在教育领域,捷通华声的优势体现在高铁领域,苏州思必驰信息科技有限公司(简称“思必驰”)优势体现在车载领域,北京云知声信息技术有限公司(简称:云知声)的优势在医院应用领域等等。


所以在语义方面,走向专业化也是一个趋势,图灵机器人是针对通用领域,但目前瓶颈也是在通用型对话领域,图灵机器人技术总监孙永超说:“通用型是没有边界,我们现在能达到80%以上的语义理解准确率,但是达到80%以后,就很难提升了,所以现在图灵机器人下一步的重点将会聚焦在儿童领域。”


在语音与语义领域,我们还存在很多的技术难题,很多时候不只是识别声音,还有场景识别,包括:在家庭里,婴儿的哭声、电话的铃声、还有其他非人的声音等等。这些东西都需要再进行处理。

 
总之,现在还不能叫人工智能的时代,叫人工智障时代。
 

因为机器人更擅长大数据,只会计算,不会算计,只有智商,没有情商,现在的机器人还只是冰冷冷的东西,只会用一种调子讲话,离用户的期望还是很大的。


另外,还有降噪问题,目前是没有根本的解决方案,只能做一些技术上的改进。
 

深圳市中智科创机器人有限公司(简称:中智科创)市场部营销副总经理彭勋禄说:“针对语音与语义,我们也是希望有一家企业能提供解决方案,但是我们发现很难用起来,主要的原因是,我们设计的场景跟客户设计的场景会有很大的区别,如果我们在这上面做二次开发的代价是,比我们自己研发投入,其实是差不多的。”


王昊奋说:“甚至我们自己研发去做,情况还不会更坏,后续产品迭代会更有好处。”


特别是在麦克风阵列上,降噪是绕不过去的问题,如果短期内没有更好的解决方案,那么在成本上是我们需要去突破的。

 
目前麦克风阵列五麦的价格差不多是200元/个,但是对于做儿童陪伴机器人的企业而言,希望麦克风阵列价格能够控制在100元/个以内,这是需要语音企业去突破的。
[/login]
 
 
 
 
 
来源:1号机器人
智造家提供