我们过去一周强调声学作为互联网计算平台和入口的价值,上周末我们也对Echo进行阐述。安信计算机团队下午从计算机角度首先推荐,今晚我们市场最强TMT团队率先深度推荐——!!
安信电子:高度重视音箱行业的逻辑!我们联合计算机、传媒团队独家发布“声音的世界、巨头的战争”深度报告,再简明扼要说明逻辑:
1,无论是耳机还是音箱,生产力和生产关系严重不匹配,存在被颠覆的刚需;
2,声学的时间价值,每人每天平均2小时听音乐,时间超过打游戏等娱乐和汽车,时间是衡量价值的核心;
3,all in one的价值,以声学智能化和独立计算平台为核心,整合各类功能,成为家庭独立计算平台,级别广阔互联网价值;
4,亚马逊的Echo已经证明音箱的成功,无论是销量还是智能家居和物联网入口,我们产业链充足信息可以相信,苹果和谷歌都很快进入这一市场;
5,A股产业链走进全球前沿!
声学是下一个互联网的入口。Amazon Echo销售大超预期,从产业链看,互联网厂商都将进入智能音响行业,之前的音乐版权之争有望通过硬件落地。全球进入数字音乐时代,智能音响满足声音的输出要求。在输入端智能语音技术发展成熟,智能音响又能满足人工智能交互的最佳输入方式。信息的输入与输出得到完美诠释,声学将是互联网的新入口,基于声音的商业模式将得到延展。
■智能语音技术包括了识别和交互环节,融合了多种人工智能尖端技术,将成为学习成本最低控制方式。人机语音交互的应用关键在于准确率与响应时间,语音识别技术日益成熟,即将突破量变到质变的临界点。语言识别技术和硬件发展驱动语音交互渗透率迅速提升。
■智慧家居将把家庭的安全、娱乐、饮食、健康等结合起来,用户面对的将不再是各种家电和移动设备的零散组合,而是一个有机的整体。语音交互控制产品中音响类产品成主流方案。主要由扬声器、麦克风以及处理芯片、无线传输模块等构成。这类产品首先具有基础音频输出功能,可以通过语音交互控制音乐播放。
■投资建议:我们预计智能音响行业有望成为新的互联网和物联网入口,互联网厂商加速切入,从CES等展会观察到约三分之一的厂商在布局声学产品。音乐占据人们的时间,平均家庭收入33,800美元的家庭平均每周花19小时听音乐,音乐支出占到娱乐花费的18%。音乐的商业模式在数字时代正在变化,内容收费需要与硬件结合。智能音响更多的价值也体现在家庭物联网的整合控制和人工智能的实际载体。
■电子行业相关标的:1、音响制造厂商:推荐国光电器,关注漫步者;2、消费电子芯片厂商:推荐全志科技,关注北京君正;3、声学元件厂商:推荐歌尔声学、信维通信。
■计算机行业相关标的:1、软件平台处于产业核心地位:重点推荐科大讯飞、和而泰;2、家用服务机器人是产品最终发展形态:重点推荐参股Jibo智能家用机器人的东方网力;3、平台内容提供商受益新的商业模式:建议关注与图灵机器人合作的奥飞动漫、内容及版权提供商光一科技、安妮股份等。
■传媒行业相关标的:1、音乐艺人:推荐苏宁环球,关注共达电声;2、音乐演出&音乐综艺:推荐华录百纳、中南文化;3、播映平台:推荐暴风科技,关注乐视网
重申声学是下一个互联网入口
我们上周从亚马逊echo提示智能音箱的大机会并且此前一直看好音箱机会,我们在两年前的苹果产业链和歌尔声学的研究报告中就指出,声学将成为下一个互联网入口!Amazon Echo再次吸引人们关注,我们在两年前判断的产业趋势进入临界点,声学完成从量变到质变的积累,智能语音技术、流媒体、大数据、人工智能切入智能音箱,互联网厂商与硬件厂商精密合作,家庭的互联网入口未来将基于声音的输入和输出!语音正成为计算接口,也是计算机输入最有效率的一种形式,自然语言处理软件算法及降噪保真等硬件的基础完善,声学的世界将响起巨头们征战的号角!
1.1.从Echo说起,互联网厂商的下一个战场是声学
《亚马逊 Echo 研发幕后全揭露》再次让市场想起Amazon的Echo,语音交互革命的原型已经迭代,互联网厂商今年预计将大举进军智能音响领域,行业有望突破临界点。
新产品的上市总是会经过热闹后归于平静,但是当我们再次关注时发现,产品的销量已经超过了很多人的预期。根据2016年4月CIRP发布的一份调查报告指出,亚马逊Echo的销量预计已经超过300万台,其中2016年第一季度的销量达到约100万台。约有3.5万人在亚马逊网站给这款扩音器打过分,评分有4.5星之高,满分为5星。2015年以来,Echo在亚马逊用户中的产品认知率和拥有率不断提升。其中2016年第一季度Echo在美国亚马逊用户中的认知率达到61%,在客户的亚马逊设备拥有率提升至5%。相较智能手机在2016年的出货量下降,语音交互产品的销量火爆与之形成鲜明对比。
Amazon Echo是智能音响的先驱,国外流媒体的成熟催生了声学硬件的创新。从亚马逊官方的介绍来看,这款标价199美元的智能设备是一台可联网声控蓝牙音响,能够通过连接Alexa语音服务平台提供音乐播放、新闻、天气等语音推送服务,交互模式是完全语音应答式的。Echo拥有7个麦克风和音响集成,所以即使在室内有语音播放的情况下仍能够实现语音指令输入,同时它也可以非指向性地实现360度全景声音输出服务。当你需要使用它时,通过呼喊“Alexa”或“Amazon”等关键词就可以立即触发设备。
Amazon Echo外观上是一个没有屏幕的圆柱体,高约9.25英寸(约23.5厘米),直径3.27英寸(约8.35厘米),顶部外圈是代表设备唤醒状态的响应灯,内部还有7个环状排列的麦克风,用于准确捕捉来自各个方向的声音信息。在设备内部,为了提供非指向性的360度全景声音,2个扬声器被叠放在机身的下部,上面是2.5英寸的低音单元,下面是2.0英寸高音单元,上方还有一个反射元件用于提高低音扩音输出表现防止失真。从外观上来看,Echo的大小相当于一个水杯,具有可移动性,而根据用户反馈的效果,Echo的7个麦克风组成的听力识别系统非常强大,在隔着房间和杂音干扰下都能准确识别语音指令。
Alexa语音服务平台瞄准下一个计算界面平台,目标设备锁定“家居+汽车+手机移动端”三大领域。不同于Siri这类语音助手,Echo提供的解决方案是从功能性出发的,而基于云端的Alexa语音服务平台更像一个语音库级别的App Store,其中的服务包括亚马逊为Echo设计的原生语音功能,第三方开发者通过Alexa App为Echo设备开发的定制服务,还有一些基于IFTTT提供的语音服务触发器。
在Echo设计的原生语音功能方面:目前除了音乐、新闻、天气、提醒事项等语音服务功能外,还可以通过Echo连接亚马逊用户进行语音购物,语音购物使你能够在家中随时随地进行语音购物,不需要借助你的手机或其他智能设备,只需要通过语言指令或者对需求商品的描述就可以进行更快更方便的智能购物。
平台的价值在于生态圈,能够集成第三方的OEM语音服务,成为家居、汽车和手机移动端三个领域语音服务的集合中心。在智能家居方面,包括以Philips Hue为代表的智能照明,可通过语音随时调节亮度、开关灯等,以Ecobee为代表的智能控温器能根据外部监测数据进行中央空调温度调控,还有家居安全防护整套解决方案,包括电子锁控、摄像头监控、灾害监控等,可实现远程监控和操控功能;在汽车电子方面,Alexa也积极布局与目前的车载智能平台进行整合,比如目前已有的和Ford SYNC平台合并,将汽车和家居联系起来,比如可以实现在家中通过Echo的语音指令远程启动汽车,也可以在汽车行驶过程中通过车载平台开启或关闭家居设备。而在手机移动端,如果安装了Lexi app,同样可以通过手机来和Alexa语音服务平台连接,而不需要额外的Echo设备。通过把这三大领域连接到Alexa语音服务平台,真正通过云端的语音交互服务作为入口实现了物联网的设想,即只通过网络不依赖特定硬件的万物连接。
同时在2015年11月Alexa语音服务平台开始支持IFTTT的触发式命令,可以通过IFTTT来定制许多个性化语音服务,而不是仅仅依赖于亚马逊的原生语音服务和一些第三方集成的OEM解决方案。比如用户可以通过语音请求Alexa发出“trigger party time”指令可以触发Phillips Hue智能灯泡变成在IFTTT中定制过的不同颜色。
1.2.互联网公司的音乐储备需要硬件落地
互联网公司频繁参与音乐版权争夺,全球进入数字音乐时代,但是依然需要硬件落地,智能音响满足声音的输出要求。国内外互联网公司纷纷加入音乐版权的争夺。一个有趣的现象可以看到,现在出现很多歌曲只有单一的平台可以收听,比如QQ音乐成为《中国好歌曲第三季》全网独家音频首播平台,虾米上的正版限制越发严格。现在已经很难在一个平台上听到所有的歌曲,音乐版权的争夺基本进入平稳期,精英消费群体的付费习惯也已养成,预计下一步的变现方式将是智能硬件。得益流媒体迅速增长,全球数字音乐规模首超实体音乐。IFPI的2016年全球音乐报告指出,得益于流媒体收入45.2%的增长率,数字音乐创造了10.2%的收入增幅,总量达67亿美元,销售占比45%首超实体音乐。音乐行业的整体收入增长了3.2%,达到了150亿美元的规模,这也是近20年来音乐行业首次实现逐年增长。
流媒体音乐时代助力智能音响市场发展。我们认为在流媒体音乐时代,具备WiFi联网、流媒体音乐播放接口和语音交互功能的智能音响产品能够受益音乐行业发展潮流,市场空间广阔!从CES 20152016参展情况来看,超过三分之一的消费电子品牌都展出了智能音响产品,除去国内新兴的Sonos、叮咚智能音箱、电蟒智能云音响外,三星、LG、松下、索尼也纷纷推出智能音响产品。我们从以下三个角度看好智能音响市场:
符合流媒体音乐发展潮流:大多数智能音响具有流媒体播放接口。以Sonos为代表的智能音响采用开放式策略,与第三方音乐服务商合作,为用户提供个性化流媒体音乐播放服务。目前Sonos在国内的合作伙伴包括网易云音乐、QQ音乐、虾米音乐等主流音乐服务商,用户可以将这些音乐服务商中的曲目同步至Sonos自身APP从而在智能音响上播放。也有以电蟒云音响为代表的智能音响厂商通过自建云曲库,为用户提供高品质流媒体音乐服务;
结合智能语音操作及其便捷:智能音响搭载语音交互功能是大趋势,通过语音进行操作较传统音乐播放更加便捷。同时也能通过APP远程操控音响系统打破距离限制,无需复杂的布线安装。
盈利模式变化,未来目标是打造声学生态圈:智能音响的核心优势不是信号传输无线化,而是声学生态圈的构建!智能音响硬件产品获得用户认可后,厂商可以通过自有平台掌握用户大数据,进而联合流媒体音乐服务商、音乐人和唱片公司提供精准营销、音乐推广等增值服务,摆脱单纯靠硬件销售盈利的模式,构建“用户+智能音响+大数据+增值服务”的声学生态圈!
苹果重金并购Beats,意在整合流媒体大数据与智能声学产品。14年5月,苹果以30亿美元收购耳机生产商Beats Electronics和流媒体音乐服务提供商Beats Music,是苹果历史上价值最高的一笔收购。流媒体音乐服务Beats Music的CEO Ian Rogers接管苹果iTunes Radio服务,直接向苹果负责互联网软件和服务的高级副总裁Eddy Cue汇报。
苹果收购Beats 的30 亿美元出价,远远高于苹果成立以来任何一次收购,显示苹果对互联网音乐志在必得之意。除Beats 以外,苹果还收购了拥有Musicmetric音乐分析工具的英国创业公司Semetric。我们推测苹果未来将以Beats 品牌推广智能耳机及智能音响产品,结合Apple Music等音乐服务,打造类似过去iPod+iTunes 的软硬件结合模式,与Spotify 等互联网音乐服务商竞争。
Spotify用户、估值迭创新高,引领流媒体音乐发展潮流。2015年5月,总活跃用户增长至7500万,其中付费用户2000万。付费用户占比达到26.7%。自该平台发布以来,Spotify用户中的付费用户数量和免费用户数量占比一直稳定在25%和75%左右,付费用户每月支付9.99美元即可收听到320 kbps高音质无广告版音乐,如果不愿意付费,也可以使用音质160kbps 的免费流媒体服务。2015年5月,Spotify宣布将融资5.26亿美元,估值达到85亿美元,跻身全球身价最高的非上市科技企业行列,已超过大部分唱片商估值水平。目前Spotify尚未实现盈利,近七成营收用于向版权持有者支付版税。
目前智能音响市场保持较快增速增长,增速是手机三倍。根据IDC报告,在2014年,全球无线音响市场规模为69亿美元,而到了2022年,这一数字将达到385亿美元。在智能家居和智能音乐催化下,市场尚具有较大提升空间!
中国是音响的制造和出口大国。2014 年中国主要电子音响产品总产值约为 2,774亿元,比 2013年增长 15.54%。该行业受国内外宏观经济情况影响较明显,波动较大,细分行业较多,情况差异大。随着人均收入的增长,消费能力的提高,音响产品逐步向二三级市场渗透,未来国内市场还有很大的需求空间。
从数据看流媒体已成音乐产业增长最快一环,付费的人群呈现跨越式增长。2015年增长率达到45.2%,总额达29亿美元,在过去5年间增长了约4倍。得益于智能手机用户的大规模增长,高品质音乐订阅服务的增加,以及相关乐迷向正版音乐服务的迁移,流媒体占全球音乐行业收入的比例从2014年的14%增长到了19%。流媒体的收入占据了数字音乐行业收入的43%,并且很快就要超过下载服务所带来的收入(45%),成为数字音乐的主要收入来源。近几年,付费订阅服务呈现明显增长的态势,据估计目前有6800万人正在为订阅音乐付费服务。这个数字在2014年的时候还只是4100万人,而在2010年的时候仅有800万人。
从产业了解看,今年下半年预计将有多家互联网厂商进入智能音响领域,行业大趋势确定,互联网巨头纷纷布局语音交互硬件产品,音响类产品成主流方案。在自然语言处理技术支持下,以Amazon、Google为首的互联网巨头纷纷进军语音交互硬件产品,我们预计苹果、腾讯、阿里、百度都将在音响领域布局,音响是声音的输入与输出最佳的载体,主要由扬声器、麦克风以及处理芯片构成。这类产品首先具有基础音频输出功能,可以通过语音交互控制音乐播放。而它们的核心能力则是低噪声环境下的语音识别能力,这一能力能够很好解决目前智能家居产品在交互信息入口方面的能力。因而这种音响类产品能够被方便地引入智能家居控制系统,辅助用户进行高效便捷的控制。
1.3.互联网的入口还在于声音的输入
随着Echo出现,all in one音响类产品雏形开始显现,语音交互成为最直接的控制方式,Amazon Echo的开机词Alexa是最佳代表,声音的输入是互联网入口的新价值所在。智能音响产品的构成包括扬声器、麦克风、处理芯片、存储芯片和WiFi/蓝牙组件等部分,在音乐播放这一基础功能之外具有基于语音识别的多重功能,通常能够作为智能家居和物联网入口,并能够提供在第三方集成的OEM语音服务。工作模式方面,一个典型的工作流包括用户下达指令或提问、智能音响设备进行处理以及反馈三个部分。反馈既可以是设备直接输出语音,也可以通过第三方设备进行图像或文字输出。
Google布局语音交互技术已久,近期也开始参与硬件设备领域。在2016年度I/O开发者大会上,Google发布了配有内置扬声器的语音交互设备Google Home。通过Google语音助手Google Assistant,用户可以利用Google Home播放音乐,查询天气、方向、航班等各类信息。
相较亚马逊Echo,Google优势在于“语音技术+搜索数据”。一方面谷歌开发语音识别技术多年,另一方面还拥有十多年积累下来的庞大搜索数据,这意味着用户在进行语音搜索时能得到更好、更快以及更精确的结果。此外Google还可以提供配套的日历、电子邮件以及在线云存储服务Drive等服务。
整合Nest,语音交互入口服务智能家居。Google早前于2014年以32亿美元收购智能家居设备制造商Nest,通过Google Home这一语音交互入口,Google能够将Google Assistant与Nest设备进行融合,将软件与硬件整合到一个中枢,构成物联网生态圈辅助用户迅速访问不同服务。
苹果也许会开发下一款智能音箱设备。科技博客The Information消息称苹果计划推出一款内置Siri语音助手的智能音箱,并且能够作为苹果Homekit家居平台的控制入口。这款设备配备了至少一个扬声器,支持 AirPlay,内置了网络连接功能。The Information同时表示苹果将发布一款软件开发工具包,让第三方开发者能够将产品与Siri进行整合从而能够在第三方应用中使用Siri。
智能语音交互技术成熟,应用有望扎根音响
2.1.智能语音技术发展驱动语音交互快速渗透
智能语音技术包括了识别和交互环节,融合了多种人工智能尖端技术,是真正的黑科技。在美国政府关于限制发放签证的“Technology Alert List”中,智能语音赫然在列,与核武器、火箭技术等同在“黑名单”中,可以说称得上是真正的黑科技。狭义上,智能语音技术主要是指语音识别,广义上,智能语音则可以分为识别和交互两大技术环节,其中交互环节又可以分为理解、搜索、生成三个子环节(服务、信息)。
我们以度秘为例,分析完整的人机语音交互流程背后都有哪些人工智能技术在做支撑。当用户向度秘(duer)提出需求:“找一家附近好吃的餐馆”时,度密机器人助理第一步是要将用户的语音输入进行识别,转换成计算机语言,然后基于自然语言理解技术理解我们的需求,然后在通过搜索技术去寻找餐馆(比如大众点评上评价是5星的餐厅),最后再通过语音合成或者自然语言生成(NLG)技术,将最后的搜索结果反馈给我们。上述流程仍然是一个简化版本,实际上,为了更好的去理解用户的意图,度密还必须学会发问,将模糊的用户意图具体化(本例中好吃的定义是抽象的)。
图31:实现人机语音交互的流程图
资料来源:百度、安信证券研究中心
表3:智能语音的核心技术概览
语音技术(识别)
功能
智能化技术(理解)
功能
大数据技术(搜索)
语音生成
功能
语音识别(ASR)
把人讲的话转成文字
自然语言理解(NLU)
了解用户的意图
各种垂直领域的数据服务(天气、航班、餐馆、…….)
自然语言生成(NLG)
把查询到的信息反馈给用户
声纹识别和认证
从众多候选人中确认发音人的身份或者认证发音人是否为某个特定人。在应用中,可以通过这些技术唤醒应用、解锁密码等。
多轮对话管理(DM)
通过提问来进一步明确用户意图
垂直搜索或通用搜索(OneSearch、神马搜索、钱包搜索等等)
语音合成(TTS)
把文字说出来
情感识别
通过用户讲话的语气语调、用词等线索,判断用户是否有不满或处于生气激动状态
场景感知(contextual awareness)
根据前面对话内容、当前地理位置、收到的邮件短信中的内容来更好了解用户意图
知识问答(基于知识库、知识图谱的问答)
远场语音识别
个性化
通过用户的过往行为或选择,做模型的自适应,为用户提供更有针对性的服务
开放式聊天
情感识别
通过用户讲话的语气语调、用词等线索,判断用户是否有不满或处于生气激动状态
大规模机器学习模型的训练
语音服务的数据闭环
资料来源:阿里巴巴,安信证券研究中心整理
人机语音交互的应用关键在于准确率与响应时间,语音识别技术日益成熟,即将突破量变到质变的临界点。随着自然语言处理技术及硬件设备的发展,语音识别的准确率与响应时间持续得到改善,驱动语音交互方式快速渗透。其中语音识别技术经过46年的发展,已经能够达到90%~95%的准确率(低噪音环境下)。目前正在向99%准确率以及高噪音环境应用发展。百度首席科学家吴恩达表示“现在语音识别可能已达到95%的准确度,但很多人没意识到95%的准确度到99%的准确度带来的不是量变是质变,是从你偶尔使用语音变到常常使用做到更自然。做到99%准确,将彻底改变人与设备的交互。”
图32:语音识别准确率持续提升
图33:百度、谷歌及其他语音识别平台准确率均超90%
资料来源:《Voice Technology and Research Lead》、安信证券研究中心
资料来源:Baidu, Google, VentureBeat, SoundHound、安信证券研究中心
语音识别技术应用不断拓展:早在二战期间,欧美的一些实验室已经开始进行语音识别相关的科学研究。1952年的贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。而语音技术真正进入工业界则是在2000年左右,摩托罗拉和飞利浦等电子厂商在手机里加入了语音拨号软件。随着语音识别技术的不断成熟,其应用场景也在不断增加。2008年,谷歌把语音识别和搜索相结合推出了Google Voice Research,通过把声音转成文字,有文字之后再去调后面的搜索引擎,整个识别引擎实现了正向反馈的机制,识别性能不断提高。2010年,苹果推出了革命性的个人语音助理siri。2014年,亚马逊推出了一款支持语音控制的Echo智能音箱,巨头们开始挖掘语音技术在智能家居场景中的应用潜力。得益于其在人机交互方面的优势,智能硬件、语音助手、语音搜索等领域均已开始加速上线语音识别技术。
图34:语音技术应用发展历程
资料来源:安信证券研究中心整理
发展优秀智能语音技术的关键——构建语音服务的数据闭环。语音识别依赖于science和engineer的结合。Science推动语音识别基本技术的升级,engineer扩充语音识别的场景和语言。一个高准确率的语音识别模型需要不断的训练提高识别准确率,通过构建语音服务,获取用户语音数据,再通过海量语音数据优化迭代语音识别模型,构建一个语音服务的数据闭环是发展语音技术的关键,应用与技术双向促进将形成可持续发展的产业正循环。
图35:标准的语音识别模型流程
资料来源:阿里巴巴、安信证券研究中心
语言识别技术和硬件发展驱动语音交互渗透率迅速提升。根据研究机构Thrive Analytics统计,2015年美国智能手机用户使用语音交互的比例较2013年提升了一倍以上,而他们的用户调查同时显示软件/技术的改善是选择使用语音交互的最主要原因。
图36:2015年65%的美国智能手机用户在使用语音交互
图37:技术提升是选择语音交互的主要原因
资料来源:Thrive Analytics、安信证券研究中心
资料来源:Thrive Analytics、安信证券研究中心
在搜索服务方面,语音搜索在各平台占比迅速提升。根据Google Trends统计,自2008年iPhone及谷歌语音搜索推出以来语音搜索增长超35倍;近年来百度语音的占比提升同样十分迅速,由于智能手机键盘较小,汉字输入难度较英文输入更高,因而大量用户选择使用百度语音识别功能以及文本转换语音功能进行搜索和接收信息。根据百度披露数据,自2014年Q2以来语音输入增长4倍以上,语音输出增长26倍以上。同时百度人工智能专家吴恩达预测,2020年语音及图像搜索占比有望达到50%。
图38:Google语音业务增长迅速
图39:百度语音输入两年来增长超4倍,输出超26倍
资料来源:Google Trends、安信证券研究中心
资料来源:百度、安信证券研究中心
2.2.智能语音产业链成熟,巨头布局完善
智能语音产业链分为三部分,分别包括智能语音技术提供商、后端服务提供商以及入口平台商。其中,智能语音技术提供商着重语音合成、语音识别等基础技术的研发,为下游的入口层提供基础技术支撑;以智能家居、个人语音助手、语音搜索为代表的入口平台则继续整合后端服务提供商(比如电商、本地生活等)为用户提供一站式的完整智能语音人机交互体验。
图40:智能语音产业链
资料来源:安信证券研究中心整理
智能语音产业参与者可以分为两大流派:从科研实验室走出来的独立语音技术提供商以及希望抢占下一代入口的互联网巨头。作为科研驱动型行业,智能语音技术研究最早起源于贝尔实验室,斯坦福、卡内基梅隆等学校的研究为智能语音产业发展奠定了坚实的基础,苹果Siri的雏形便是源自于斯坦福研究院联合麻省理工学院、卡内基梅隆大学等多家机构承担的美国国防高级研究计划局(DARPA)的CALO项目。Nuance也是源于斯坦福研究院的STAR实验室。国内的语音技术公司同样大多都脱胎于中国科学院声学所、中国科学院自动化所、中国科技大学、清华大学、北京大学等科研机构。而随着语音日渐成为人机交互的重要方式,互联网巨头们为了争夺下一个入口,在智能语音市场也展开了疯狂的“军备竞赛”,以亚马逊、谷歌、苹果、微软、百度、腾讯、搜狗为代表的巨头纷纷通过并购与自研推出自己的语音产品,加大对语音市场的争夺。
图41:传统语音技术企业概览
资料来源:中国语音产业信息网、安信证券研究中心
表4:巨头纷纷布局语音技术
公司
时间
收购或者参股公司
功能
苹果
2010
Siri.inc
虚拟助手
2013
Novauris Technologies
Novauris是一种可识别整个短语的语音识别技术,这种技术并非简单识别单个词句,而是试图利用超过2.45亿个短语的识别辅助理解上下文
2015
VocalIQ
能够帮助计算机与用户进行更为自然的对话。
谷歌
2011
SayNow
SayNow可以把语音通信、点对点对话、以及群组通话和Facebook、Twitter、MySpace、Android和 iPhone等等应用等整合在一起
2011
Phonetic Arts
Phonetic Arts可以把录制的语音对话转化成语音库,然后把这些声音结合到一起,从而生成听上去非常逼真的人声对话。
2013
Wavii
Wavii擅长“自然语言处理”技术,可以通过扫描互联网发现新闻,并直接给出一句话摘要及链接。
2015
出门问问
拥有自主语音识别、语义分析、垂直搜索技术
亚马逊
2011
Yap
Yap成立于2006年,主要提供语音转换文本的服务
2012
Evi
加强语音识别在商品搜索方面的应用
2013
Ivona Software
主要做文本语音转换
2013
Mobile Technologies
公司的产品Jibbigo允许用户在25种语言中进行选择,使用其中一种语言进行语音片段录制或文本输入,然后将翻译显示在屏幕上,同时根据选择的语言大声朗读出来。
2015
Wit.ai
Wit.ai 允许用户直接通过语音来命令移动应用程序 (iOS、Android 等平台)、穿戴设备和机器人以及几乎任何你可以想到的智能设备。
资料来源:互联网资料,安信证券研究中心整理
2.3. “效率优势+场景拓展”决定语音交互发展趋势
回顾人机交互发展,实际上是一段不断改造机器解放人的历程。最早期的电脑,键盘是唯一的输入设备,随着图形界面GUI的出现,形成“键盘+鼠标”的组合,然而精准点击鼠标和敲击键盘仍然需要较高的学习成本。其后,设备终端的越做越小进一步解放用户,手机触屏的出现真正摆脱了键鼠这一中间介质,做到所触即所得。尽管如此,利用触控操作手机或平板,仍然需要用户的手和眼睛全程参与。
语音交互进一步解放感官,学习成本小。语音交互这一方式进一步解放手和眼睛,减少感官占用从而改善体验。此外直接通过语言信息进行交互,在空间上拓展了与智能设备的距离限制,这一点智能家居方面优势明显,能够真正实现随时随地“Always-Online”的智能体验。相比键盘、鼠标甚至触屏,语音作为交互的学习成本也要更小。
图42:“Touch 1.0 (键盘)àTouch 2.0(鼠标)à Touch 3.0(触屏)à语音”发展历程
资料来源:“History of Computer Interfaces” 、安信证券研究中心
表5:Voice In Voice Out,语音交互进一步解放人类
交互方式
输入形式
输入器官
输出形式
接收器官
空间限制
学习成本
键盘
文字
手
文字
眼睛
大
高
鼠标
伪触摸
手
文字/图像
眼睛
大
高
触摸屏
触摸
手
文字/图像
眼睛
相对自由
较低
语音
声音
嘴
声音(借助其他设备也可输出图像文字)
耳朵
自由
低
资料来源:安信证券研究中心
语音交互方式除了能够改善用户体验,还具有明显的速度优势。文字输入的世界纪录是212单词/分钟,而说话的最快纪录超过600单词/分钟。在正常人的文字及语音输入效率上这个比例仍然成立。在自然语言处理技术发展下语音识别的处理时间大幅减少,速度优势进一步扩大!此外语音识别还具有上下文驱动(基于历史问题/交互理解情景)、低成本(仅需麦克风、扬声器和处理器)等特点。
图43:语音交互特点
图44:语音交互技术已经全面渗透到各项互联网应用
资料来源:《2016 Internet trend report》、安信证券研究中心
资料来源:互联网、安信证券研究中心
图45:使用语音交互的主要原因(美国)
图46:使用语音场景的主要原因(美国)
资料来源:《Intelligent Voice Assistants Research Report》、安信证券研究中心
资料来源:《Intelligent Voice Assistants Research Report》、安信证券研究中心
智能音响不仅仅是互联网入口,更是物联网的入口
3.1.智能音响其实是智能家居的一部分
智慧家居将把家庭的安全、娱乐、饮食、健康等结合起来,用户面对的将不再是各种家电和移动设备的零散组合,而是一个有机的整体。这个有机整体需要有一种新的人机交互模式,从而使用户更加便捷、舒适地调用智慧家庭设备。因而,智慧家庭的发展势必将由被动的用户输入转化为主动捕捉用户的语言和动作,此时具备声音控制和播放的家庭音响可以发展成为智慧家庭的入口和中心。
互联网巨头纷纷布局语音交互硬件产品,音响类产品成主流方案。在自然语言处理技术支持下,以Amazon、Google为首的互联网巨头纷纷进军语音交互硬件产品。目前的主流方案为智能音响类产品,主要由扬声器、麦克风以及处理芯片构成。这类产品首先具有基础音频输出功能,可以通过语音交互控制音乐播放。而它们的核心能力则是低噪声环境下的语音识别能力,这一能力能够很好解决目前智能家居产品在交互信息入口方面的能力。因而这种音响类产品能够被方便地引入智能家居控制系统,辅助用户进行高效便捷的控制。
图47:智慧家庭的范畴
图48:智能家居概念图
资料来源:互联网、安信证券研究中心
资料来源:互联网、安信证券研究中心
智能音响设备在智慧家居的带动下,有望发生革命性的变化。在2019年,智慧家庭的渗透率预计达12%,市场规模超过1500亿美元,且随着智能化的普及,该市场仍然具有很大的增长空间。届时,作为入口的智能音响设备,计算能力将得到大幅度提升,“音响”属性将被削弱,家庭智能控制中心的作用会得到加强,并且伴随一波销售热潮占据智慧家庭的核心。
图49:智慧家庭渗透率增长
图50:智慧家庭市场价值增长
资料来源:strategy analytics、安信证券研究中心
资料来源:strategy analytics、安信证券研究中心
3.2.全产业链的智能控制革命
从Echo到DingDong,智能音箱语音服务抢占未来智能家居的控制中心、核心交互入口。
自美国零售业巨头2014年发布智能音箱硬件Amazon Echo后,国产网络零售企业京东不甘落后,于2015年联手科大讯飞合作打造国产化智能音箱DingDong。与Echo相似,DingDong音箱的功能和应用领域也主要集中在音乐播放、语音讯息服务、智能家居控制等方面,配套科大讯飞为其开发的语音交互服务,可以通过语音指令控制符合京东微联标准的数百种智能家电。在国内智能家居生态尚未成熟的阶段,DingDong智能音箱目前更多侧重“音箱”属性,语音服务方面距离Echo还缺乏第三方应用协同和定制化应用,目前京东发布国产化的智能音箱,更多是看好语音交互模式的前景,未来伴随生态搭建、硬件服务升级,DingDong智能音箱语音服务将成为智能家居的控制中心、核心交互入口。
图51:DingDong智能音箱实物及相关功能介绍
资料来源:京东、安信证券研究中心
既要智能交互也要音质表现,DingDong智能音箱市场表现获用户肯定。不同于Echo在顶部设置7个麦克风收集语音信息的设计,这款价格仅800元的DingDong智能音箱在全方位360度都设置了音箱。同时,为了防止音频失真,在音箱之中进行了物理上的优化,加入了法拉第的短路环等一系列措施,在不影响语音交互的情况下,确保音质,尤其是对人声的还原。在保证语音智能服务的同时,不让音箱本身用户体验下降。根据京东下属研发机构提供数据,DingDong智能音箱已经成为wifi音箱细分行业销量第一,目前日活跃用户与月活跃用户数保持在30%到40%之间,用户购买产品之后的次日留存率也达到了75%,周留存率达到55%,而用户每日的平均使用时间则达到了2小时。用户使用粘度反映DingDong为深度使用智能设备。
图52:DingDong音箱语音搜索服务信息架构
资料来源:互联网、安信证券研究中心
产品开发注重厂商强强合作,科大讯飞联手京东打造DingDong系列产品,未来将带动智能音箱全产业发展。与亚马逊研发Echo不同,京东在DingDong智能音箱产品研发方面一直采用厂商合作的模式。作为一家网络零售业巨头,京东更多采用厂商合作模式做智能硬件:在语音服务领域和科大讯飞设立合资子公司,充分发挥其语音技术和人工智能技术优势;硬件开发过程利用全志科技的R系列智能硬件开发平台进行硬件开发;在音频领域,京东联合飞利浦、漫步者、猫王、索爱等影音硬件生产商及喜马拉雅、百度音乐等影音内容供应商成立了京东智能音频联盟。积极打造“JD+智能音频解决方案”,考虑到传统的音箱企业拥有扎实的音频技术以及深厚的用户基础,智能云技术能很好的弥补传统音箱品牌在语音技术以及在线流媒体资源上的不足。京东最近就与老牌音频厂商哈曼联合推出的JBL Go Smart智能音箱,JBL在麦克风拾音方面拥有独家的回声消除技术,结合JD+远场语音识别和麦克风阵列,可以实现极高识别度的语音交互体验,并且支持16种方言的识别,语音、语意理解率达到90%以上。
通过这种厂商合作开发模式,DingDong系列产品可以集合语音服务、硬件开发、传统音响配件等多个行业优秀技术,共同打造具备下一代万联网核心设备要求的国产智能硬件产品,并通过蓝海战略迅速占领智能音箱国内市场。另外京东可以专注于配套智能硬件零售、应用服务平台等智能家居生态内容建设。未来DingDong系列产品将会带动智能音箱全产业发展的重大机遇。
DingDong语音服务处理器全志打造,R系列支撑物联网布局。全志科技支持DingDong的R16智能硬件平台对语音服务方面有完美的支持,还支持AirPlay、DLNA、Qplay、Smart Link等多种网络应用协议,方便开发者打造基于智能音箱的智能硬件产品。R16智能硬件平台集成多媒体解码、液晶驱动、WIFI、蓝牙、录音,消噪,摄像于一体,提高了开发者的开发效率。由于全志科技的强项主要是在多媒体方面,所以从全志科技的物联网方案上我们不难看出,其主要针对的也还是侧重于多媒体性能的物联网产品。
图53:全志科技R系列布局物联网
资料来源:全志科技、安信证券研究中心
投资建议
我们预计智能音响行业有望成为新的互联网和物联网入口,互联网厂商加速切入,从CES等展会观察到约三分之一的厂商在布局声学产品。音乐占据人们的时间,平均家庭收入33,800美元的家庭平均每周花19小时听音乐,音乐支出占到娱乐花费的18%。音乐的商业模式在数字时代正在变化,内容收费需要与硬件结合。智能音响更多的价值也体现在家庭物联网的整合控制和人工智能的实际载体。
电子行业相关标的:
1、音响制造厂商:推荐国光电器,关注漫步者
2、消费电子芯片厂商:推荐全志科技,关注北京君正
3、声学元件厂商:推荐歌尔声学、信维通信
计算机行业相关标的:
1、软件平台处于产业核心地位:重点推荐科大讯飞、和而泰
2、家用服务机器人是产品最终发展形态:重点推荐参股Jibo智能家用机器人的东方网力
3、平台内容提供商受益新的商业模式:建议关注与图灵机器人合作的奥飞动漫、内容及版权提供商光一科技、安妮股份等
传媒行业相关标的:
1、音乐艺人:推荐苏宁环球,关注共达电声;
2、音乐演出&音乐综艺:推荐华录百纳、中南文化;
3、播映平台:推荐暴风科技,关注乐视网
(来源 环球老虎财经)
【延伸阅读】
?下一个能够改变世界的平台—智能音箱
继智能手机之后,下一个能够改变世界的平台是什么?那就是智能音箱。世面上主流的智能音箱就以下几款:亚马逊Echo和科大讯飞的DingDong智能音箱。
1、亚马逊Echo是一个人工智能音箱,它除了能播放音乐,还可以通过对话实现人机交互。亚马逊Echo是一款语音交互式蓝牙音箱,可以使用内置的Alexa语音交互系统,来同步语音数据、播放音乐和监控您的家庭安全设置;不论是作为无线音乐播放器,还是语音虚拟助手来说,都是个不错的额新体验。亚马逊的研发目标是使它成为连接所有市面上已有和将有的互联网功能设备的纽带,成为智能家居的控制中枢。根据2016年4月CIRP发布的一份调查报告指出,亚马逊Echo的销量预计已经超过300万台,其中2016年第一季度的销量达到约100万台。
2、在首届亚洲消费电子展(CESA)上,京东智能与科大讯飞联手推出了双方合作的首款智能产品DingDong智能音箱。据网上资源显示,DingDong智能音箱不仅具有良好音质效果的音箱设备,还是一款结合科大讯飞的语音技术,无需通过任何手动操作,只要通过简单的自然语言就可以实现对音箱的音频点播和播放控制,还能实现百科查询,在线聊天等功能。
声学是下一个互联网的入口。智能语音技术包括了识别和交互环节,融合了多种人工智能尖端技术,将成为学习成本最低控制方式。智慧家居将把家庭的安全、娱乐、饮食、健康等结合起来,用户面对的将不再是各种家电和移动设备的零散组合,而是一个有机的整体。
智能音箱作为智能家居入口的一种新型的理想方式,其重要性将越来越受到重视。主要受益标的如下:和而泰(002402)、共达电声(002655)、国光电器(002045)、科大讯飞(002230)。
和而泰(002402)投资要点
1、公司主营业务:智能控制器的研发、生产和销售,包括智能控制技术的研究、对应的嵌入式软件与算法的开发、技术解决方案的提供、产品设计、生产、物流服务等。而智能控制器是物联网大数据平台的基本数据单元。
2、公司是家庭用品智能控制器产业全球龙头。公司产品主要供应全球高端市场,是伊莱克斯、惠而浦、西门子、GE、HUNTER、SEB、三星、松下等全球著名客户在智能控制器领域的全球主要合作伙伴,或中国唯一合作伙伴。
3、全面布局新一代大数据平台,取得突破性进展。2016年3月,和而泰“C-Life平台2.0”发布,大数据重新定义智能。
共达电声(002655)投资要点:
1、公司主营业务:微型电声元器件及电声组件的研发、生产和销售。
2、大音箱制造能力国内一流,不输海外大厂,微型扬声器新品设计已获全球级消费电子大客户认可,自动化生产线认证突破在即。
国光电器(002045)投资要点:
1、公司主营业务:扬声器及音箱的生产及销售
2、公司是一家主要经营扬声器及音箱的生产及销售的公司.公司的主要产品包括用于汽车、HIFI音响、专业音响、通讯产品、电脑产品的扬声器;各种多媒体音响系统、HIFI音响系统、家庭影院系统。3、目前超过90%的产品出口到美国、欧洲、亚洲,拥有Philips、Sony、Motorola、Harman等长期引领国际市场和技术的跨国大客户,出口创汇连续11年排名国内扬声器领域榜首,"GGEC"工厂品牌正在日益响彻国际音响市场。
漫步者(002351)投资要点:
公司主营业务:多媒体音箱、耳机、汽车音响相关产品的研发、设计、生产和销售。
·END·
(来源 淘股吧)
以上资讯仅供参考,不作为投资依据。投资有风险,选择需谨慎。
关注“招商证券长春部”微信号,最新的资讯解读,政策动向分析。
标签: googlevoice客户端
评论列表