‌·

干掉智能手机?音箱在前,机器人在后

苹果、BAT杀入智能音箱领域,家庭场景成主战场

来源:南方都市报     2017年07月04日        版次:GS16    作者:蔡辉


    Jimu机器人



    亲见h2



    R okid



    优必选与亚马逊联合开发的Lynx。


    BAT争夺战又杀进了一个新领域:智能音箱。这个月百度与腾讯分别推出DuerOS及云小微语音开放平台,连接更多的硬件创业者,有消息人士向南都记者透露,下周阿里AI大会重点也是语音平台及音箱。

    而纵观全球市场,今年苹果在WWD C(全球开发者大会)推出了智能音箱H omeP od。加上亚马逊的E cho,不知不觉音箱市场已经凑齐一桌“巨头斗地主”了。山雨欲来风满楼,但南都记者采访这些音箱创业者们都认为“音箱”可能只是个过渡性态,那它究竟是什么?它又改变了什么?

    “靠嘴说”干掉一个行业?

    “越高频的需求,人们希望操作越简单,这就是音箱的机会。”数字家圆创始人兼C E O唐波如是告诉南都记者。而几乎所有参与者都认可,从触屏操作到语音交互,这一点用户体验就足以让音箱在家庭场景取代手机。数据也表明了这一点,亚马逊E cho在北美卖出百万级销量后,北美家庭里智能手机使用率下降了40%。

    家庭语音想象空间大

    智能音箱也不是语音识别的头啖汤。早在三年前,苹果推出A ppleWatch就可以语音通信。车载环境因为不能分散司机注意力,也有各种语音操控的车联网产品,但R okidA -lab负责人高鹏则认为可穿戴设备与车联网场景里,“语音”只是锦上添花功能,“家居是用户最放松的状态,也不会打扰别人。”

    同时,家庭也是语音更多想象空间的地方。“个人助手、内容娱乐以及家庭网关。”R okid产品总监向文杰介绍说,这是目前其可以看到的三个主要功能。在欧美,个人助手,比如定时提醒功能之类的是最高频的需求,而国人则最喜欢用内容 ,尤 其 是 音 乐 。“就 相 当 于 家 里 的B G M,”唐波介绍说,其第一代产品“亲见”打开频次最高的也是音乐,家庭用户每天使用2小时以上。这也是为什么苹果的H om epod以及国内的R okid、小雅等产品要特别强调其音质效果。

    但是内容就涉及版权,尽管音箱们不愿透露目前版权成本比例,但均坦言这是目前较大比例的运营成本,这成为其打开市场的重要砝码。猎豹的小雅则联手喜马拉雅发布,优必选、家圆选择加入腾讯云小微平台获得腾讯版权内容。唐波介绍,去年第一代产品用虾米音乐的时候还是免费,“但跟手机上的免费音乐不同,接下来版权方应该会对音箱采用收费模式。”

    智能家居最具商业价值

    而最大的商业价值则是智能家居,一旦达到一台设备接受指令操控整个家庭,这个设备将占据最高频的用户入口。———也因为其价值之大,大家都相信这还是很远的事情。

    “不是技术问题,还包括市场原因。”优必选创始人周剑如是说。现在许多家庭产品可以用手机红外控制,但达到语音识别则需要对产品进行改造,加入通讯模块。“存量市场的更换周期已经很长了,而且还有各个品牌之间互联互通问题。”

    做好一个智能音箱需要什么

    “一个智能音箱至少包括四方面,一个可以‘听得见’的终端;一个可以‘听得懂’的语音平台,足够的内容以及相应的生态资源。”唐波如是介绍。

    核心竞争:语音平台

    “听得懂”涉及人工智能的N LP(自然语音处理),这是A I“金字塔尖的明珠”。目前业界并没有一个真正实现开放域的算法,基于大量数据来训练也最多能实现功能型语言交流。

    R okid选择自己开发语音平台。“这是一个智能音箱的核心。”高鹏告诉南都记者,如果语音外包就失去核心竞争力。“我们下一代会推出‘声纹识别’功能,这个功能过去没有进入民用市场。实现这个功能,R okid可以感知不同的家庭成员,更好地了解其习惯。”无独有偶,小雅、出门问问也都选择自己开发语音,后者基于其语音平台还推出手表、后视镜等不同场景产品。

    实际上,百度的D uerO S及与腾讯的云小微也是旨在把语音拿在手里,向不同硬件终端开放获取更多数据。

    硬件争夺:麦克风、声视结合

    数字家圆的亲见h2即是进入云小微平台的一个硬件,在上周云小微发布会上,马化腾介绍了硬件开发、Skill及智能服务三个代表合作厂商,后两个是滴滴奔驰,第一个则是亲见。“语音识别训练基于算法与数据,创业公司的算法再牛,数据样本量很难跟巨头相比,”唐波则认为,术业有专攻,家圆做好硬件就行。“一个A I音箱需要多麦克风阵列和计算方案,同样需要很高技术积累。”

    而做机器人的优必选更是如此。优必选的第一代机器人A lpha去年在春晚上跳舞大放异彩,但其创始人兼C E O周剑并不希望它只是个“玩具”。“我们做好四肢,大脑由合作伙伴开发。”周剑告诉南都记者机器人的运动涉及到伺服舵机,也就是关节的设计与控制,这是优必选的强项,这也是为什么他虽然锚定家居,但并不像其他创业者一样去做音箱。

    目前基于科大讯飞开发了A lpha系列,基于云小微开发Q robot以及基于亚马逊A lexa开发Lynx。不过周剑透露,优必选在为未来积累视觉识别能力。“声视结合才能综合语速、面部表情等细节来判断用户的情绪,才能真正从工具型助手到情感型伴侣。”

    如果音箱只是过渡,未来是什么?

    “如果人形机器人能量产,没人愿意对一个音箱说话,”周剑一直强调人形机器人才是A I家居的终极载体,音箱只是过渡产品,“我们需要一个能主动交互的伴侣,起码你回家能走到你面前说‘主人辛苦了’。”亚马逊在Echo以外与优必选开发了Lynx,周剑告诉南都记者,“亚马逊也相信人形机器人才是未来,Echo是短期能实现落地,积累语音数据的平台。”

    家庭机器人?虚拟状态?

    同样,唐波与高鹏都觉得这个终端形态没有定型,但选择路径则不相同。亲见h2是市面少有带屏的“音箱”,一开始是因为语音平台不成熟,误唤醒率高,加入触控屏提高交互效率,但后来发现,基于屏产生的“桌面追剧”与“视频通话”也是用户刚需。

    唐波告诉南都记者,“尤其是电视,大家电更换周期很长,短期内很难实现用户可以语音唤醒电视。亲见更加便捷,而又比平板更适合家庭一起看。”

    而高鹏则不愿意将Rokid称为“音箱”,而是“家庭机器人”,虽然只是“语音机器人”。“我们一开始也试图做会动的机器人,但成本太高了,第一代我们原来做了两个轴运动,但发现量产周期太长就放弃了。”高鹏如是表示。Rokid在今年下半年将推出另一套终端“梵星”。“它可能以虚拟状态呈现,布局在你每个房间看不见的角度,不占用空间,但更方便唤醒,这需要多终端控制能力。”

    10年内把A S IMO降到20万元?

    高鹏认为人形机器人的未来“遥遥无期”。“比如最简单给你拿杯水,除了力度角度,还要会避障、识别家庭地图。这是比无人驾驶更复杂的运动控制算法。”

    实际上,三年前M IT曾推出一个概念音箱jibo,带屏,能转动,但不会走,一段视频就让科技圈为之疯狂,但今年也没走出市场。“真正能走动的是本田的A SIM O,而且还没有智能功能,成本就要两百万美金,根本走不进民用市场。”

    周剑也提到A SIM O,但他的目标就是6-10年内把A SIM O降到20万人民币。“也就是一台家庭轿车的水平。”在他看来,除了技术成熟,降低成本主要靠量产规模。目前Lynx跟Echo功能完全一致,但光多出20个能动的关节就要高出两倍成本。“如果Lynx跟Echo一样卖出1000万台,我也能卖到2000块。”

    但漫长的“过渡时期”也要赚钱。优必选没有跟其他厂商一样选择音箱,而是基于其运动驱动能力做机器人。除了Lynx与亚马逊销售分成,在W W DC还推出可编程机器人jim u,面向青少年教育。跟音箱不同,机器人目前商用最成熟的场景则是教育,这又是另外一片天地。

    采写:南都记者 蔡辉 实习生 梁劲 郭佳灵

手机看报
返回奥一网 意见反馈