本月累计签到次数:

今天获取 积分

语音交互技术

语音交互技术

521 浏览

语音交互风暴强势来袭,规模化应用瓶颈待突破

智能科技类 jicheng 2017-02-27 20:42 发表了文章 来自相关话题

当下智能语音交互市场的发展趋势日渐清晰,语音或成为AI领域中最先落地的应用之一。但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。






无论是当下的智能手机还是个人电脑,采用的都是1981年施乐公司“施乐之星”率先采用的图形用户界面。3年后,苹果公司“偷师”“施乐之星”推出的Macintosh成为首个在商用领域取得成功的图形用户界面电脑。
 

自此,随着个人设备的运算能力日益增强,各种应用程序不断增多,图形用户界面也变得日益复杂。许多人认为,图形用户界面已经走到了极限。那么,接下来,谁能把人类从纷繁复杂的界面窗口、工具栏以及菜单选项中拯救出来?脑电波、眼神还是语音?如果是在10年前,这三种方式没有一种可以担此重任,但如今,语音似乎成为了首选项。
 

目前,在语音交互相关的领域已经出现了一批玩家和产品,国外有Google Now、微软的Cortana、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱,国内则有科大讯飞、百度度秘、搜狗语音、微信的语音功能等。
 

根据VoiceLabs发布的《2017年语音报告》预测,2017年语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。
 

从以上数据不难看出,无论是从产品销量,技术进展,到相关创业公司的兴起,还是资本市场的频繁运作,种种迹象都表明,智能语音交互市场的趋势日渐明朗,语音将成为AI领域中最先落地的应用之一。
 

而从当前Amazon、Google、Apple的市场实践来看,智能语音交互未来至少在三个领域带来了根本性的变化。其一,智能语音交互将改变音乐分发的格局。从亚马逊和苹果的实践角度来看,Alexa成为了音乐分发的重要渠道,这对于国内仍然在困境之中的在线音乐行业是一个值得深入思考的事情。
 

其次,语音交互将会成为下一代搜索的核心。毫无疑问,通过语言交流获取知识是人类最有效的学习方式。搜索从PC时代的搜索框到移动时代的APP,其实都是在向着精准搜索的方向发展,而语音交互天生就有这两种优势。
 

另外,语音交互还有可能会改变社交领域的格局。国内外社交领域似乎很难再有新的变化,但是随着Amazon Echo和Google Home的崛起,用户已经强烈建议增加语音通话功能,苹果的AirPods显然天生就具有了通话的功能。
 

尽管越来越多大牌玩家进入语音交互的领域,智能语音市场的未来发展逐渐明晰,但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。
 

据了解,语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率,而仅5%的错误率都有可能导致整个行业的变革。
 

而且语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
 

抛开这些问题,就当前用户习惯也还未完全养成。没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。


文章来源:网络 查看全部
当下智能语音交互市场的发展趋势日渐清晰,语音或成为AI领域中最先落地的应用之一。但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。

QQ截图20170227204106.png


无论是当下的智能手机还是个人电脑,采用的都是1981年施乐公司“施乐之星”率先采用的图形用户界面。3年后,苹果公司“偷师”“施乐之星”推出的Macintosh成为首个在商用领域取得成功的图形用户界面电脑。
 

自此,随着个人设备的运算能力日益增强,各种应用程序不断增多,图形用户界面也变得日益复杂。许多人认为,图形用户界面已经走到了极限。那么,接下来,谁能把人类从纷繁复杂的界面窗口、工具栏以及菜单选项中拯救出来?脑电波、眼神还是语音?如果是在10年前,这三种方式没有一种可以担此重任,但如今,语音似乎成为了首选项。
 

目前,在语音交互相关的领域已经出现了一批玩家和产品,国外有Google Now、微软的Cortana、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱,国内则有科大讯飞、百度度秘、搜狗语音、微信的语音功能等。
 

根据VoiceLabs发布的《2017年语音报告》预测,2017年语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。
 

从以上数据不难看出,无论是从产品销量,技术进展,到相关创业公司的兴起,还是资本市场的频繁运作,种种迹象都表明,智能语音交互市场的趋势日渐明朗,语音将成为AI领域中最先落地的应用之一。
 

而从当前Amazon、Google、Apple的市场实践来看,智能语音交互未来至少在三个领域带来了根本性的变化。其一,智能语音交互将改变音乐分发的格局。从亚马逊和苹果的实践角度来看,Alexa成为了音乐分发的重要渠道,这对于国内仍然在困境之中的在线音乐行业是一个值得深入思考的事情。
 

其次,语音交互将会成为下一代搜索的核心。毫无疑问,通过语言交流获取知识是人类最有效的学习方式。搜索从PC时代的搜索框到移动时代的APP,其实都是在向着精准搜索的方向发展,而语音交互天生就有这两种优势。
 

另外,语音交互还有可能会改变社交领域的格局。国内外社交领域似乎很难再有新的变化,但是随着Amazon Echo和Google Home的崛起,用户已经强烈建议增加语音通话功能,苹果的AirPods显然天生就具有了通话的功能。
 

尽管越来越多大牌玩家进入语音交互的领域,智能语音市场的未来发展逐渐明晰,但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。
 

据了解,语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率,而仅5%的错误率都有可能导致整个行业的变革。
 

而且语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
 

抛开这些问题,就当前用户习惯也还未完全养成。没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。


文章来源:网络
521 浏览

语音交互风暴强势来袭,规模化应用瓶颈待突破

智能科技类 jicheng 2017-02-27 20:42 发表了文章 来自相关话题

当下智能语音交互市场的发展趋势日渐清晰,语音或成为AI领域中最先落地的应用之一。但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。






无论是当下的智能手机还是个人电脑,采用的都是1981年施乐公司“施乐之星”率先采用的图形用户界面。3年后,苹果公司“偷师”“施乐之星”推出的Macintosh成为首个在商用领域取得成功的图形用户界面电脑。
 

自此,随着个人设备的运算能力日益增强,各种应用程序不断增多,图形用户界面也变得日益复杂。许多人认为,图形用户界面已经走到了极限。那么,接下来,谁能把人类从纷繁复杂的界面窗口、工具栏以及菜单选项中拯救出来?脑电波、眼神还是语音?如果是在10年前,这三种方式没有一种可以担此重任,但如今,语音似乎成为了首选项。
 

目前,在语音交互相关的领域已经出现了一批玩家和产品,国外有Google Now、微软的Cortana、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱,国内则有科大讯飞、百度度秘、搜狗语音、微信的语音功能等。
 

根据VoiceLabs发布的《2017年语音报告》预测,2017年语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。
 

从以上数据不难看出,无论是从产品销量,技术进展,到相关创业公司的兴起,还是资本市场的频繁运作,种种迹象都表明,智能语音交互市场的趋势日渐明朗,语音将成为AI领域中最先落地的应用之一。
 

而从当前Amazon、Google、Apple的市场实践来看,智能语音交互未来至少在三个领域带来了根本性的变化。其一,智能语音交互将改变音乐分发的格局。从亚马逊和苹果的实践角度来看,Alexa成为了音乐分发的重要渠道,这对于国内仍然在困境之中的在线音乐行业是一个值得深入思考的事情。
 

其次,语音交互将会成为下一代搜索的核心。毫无疑问,通过语言交流获取知识是人类最有效的学习方式。搜索从PC时代的搜索框到移动时代的APP,其实都是在向着精准搜索的方向发展,而语音交互天生就有这两种优势。
 

另外,语音交互还有可能会改变社交领域的格局。国内外社交领域似乎很难再有新的变化,但是随着Amazon Echo和Google Home的崛起,用户已经强烈建议增加语音通话功能,苹果的AirPods显然天生就具有了通话的功能。
 

尽管越来越多大牌玩家进入语音交互的领域,智能语音市场的未来发展逐渐明晰,但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。
 

据了解,语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率,而仅5%的错误率都有可能导致整个行业的变革。
 

而且语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
 

抛开这些问题,就当前用户习惯也还未完全养成。没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。


文章来源:网络 查看全部
当下智能语音交互市场的发展趋势日渐清晰,语音或成为AI领域中最先落地的应用之一。但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。

QQ截图20170227204106.png


无论是当下的智能手机还是个人电脑,采用的都是1981年施乐公司“施乐之星”率先采用的图形用户界面。3年后,苹果公司“偷师”“施乐之星”推出的Macintosh成为首个在商用领域取得成功的图形用户界面电脑。
 

自此,随着个人设备的运算能力日益增强,各种应用程序不断增多,图形用户界面也变得日益复杂。许多人认为,图形用户界面已经走到了极限。那么,接下来,谁能把人类从纷繁复杂的界面窗口、工具栏以及菜单选项中拯救出来?脑电波、眼神还是语音?如果是在10年前,这三种方式没有一种可以担此重任,但如今,语音似乎成为了首选项。
 

目前,在语音交互相关的领域已经出现了一批玩家和产品,国外有Google Now、微软的Cortana、Facebook的Message Platform、苹果的Siri、亚马逊的Echo、Google Home的智能音箱,国内则有科大讯飞、百度度秘、搜狗语音、微信的语音功能等。
 

根据VoiceLabs发布的《2017年语音报告》预测,2017年语音产业结构将按照硬件产品、AI软件、语音应用Apps、生态系统服务相结合的架构继续向前发展。预计2450万台以语音为主要交互方式的智能硬件产品发货,市场总量将达到3300万台,市场规模超过200亿美元。
 

从以上数据不难看出,无论是从产品销量,技术进展,到相关创业公司的兴起,还是资本市场的频繁运作,种种迹象都表明,智能语音交互市场的趋势日渐明朗,语音将成为AI领域中最先落地的应用之一。
 

而从当前Amazon、Google、Apple的市场实践来看,智能语音交互未来至少在三个领域带来了根本性的变化。其一,智能语音交互将改变音乐分发的格局。从亚马逊和苹果的实践角度来看,Alexa成为了音乐分发的重要渠道,这对于国内仍然在困境之中的在线音乐行业是一个值得深入思考的事情。
 

其次,语音交互将会成为下一代搜索的核心。毫无疑问,通过语言交流获取知识是人类最有效的学习方式。搜索从PC时代的搜索框到移动时代的APP,其实都是在向着精准搜索的方向发展,而语音交互天生就有这两种优势。
 

另外,语音交互还有可能会改变社交领域的格局。国内外社交领域似乎很难再有新的变化,但是随着Amazon Echo和Google Home的崛起,用户已经强烈建议增加语音通话功能,苹果的AirPods显然天生就具有了通话的功能。
 

尽管越来越多大牌玩家进入语音交互的领域,智能语音市场的未来发展逐渐明晰,但由于技术和社会环境的限制,目前语音交互还处在起步阶段,相关的语音交互技术还无法支持大规模的应用和推广。
 

据了解,语音识别技术对环境要求苛刻;在识别的准确率上受较多因素的影响,比如背景噪音、口音、语速、特定领域的专有名词等都影响准确率,而仅5%的错误率都有可能导致整个行业的变革。
 

而且语音交互是非可视化的,非常消耗用户的注意力,增加记忆负担。人在与系统做交互的时候,能记住的信息也就10秒左右。举一个常用的场景,有时候打银行的客服电话,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。
 

抛开这些问题,就当前用户习惯也还未完全养成。没有人愿意对着冰冷的机器说话,然后得到毫无感情的甚至是错误的回应。用户对语音交互对象的要求不但是可以听懂,还应该能人性化的给以回应,人类更期望通过语音达到人人交互的感受,而不是人机交互,这也是为什么语音交互的普及很大程度上依赖于人工智能技术的发展。


文章来源:网络