当开始想一些未来发展话题时,就会想起 2007 年 D5 峰会上乔布斯与盖茨关于 5 年后智能设备发展的对话。当时莫博士询问两人五年后他们会使用怎样的便携设备,乔布斯说是 iPhone,盖茨说是平板设备。站在 2014 年看,似乎是乔布斯赢了,不过盖茨未来...

当开始想一些未来发展话题时,就会想起 2007 年 D5 峰会上乔布斯与盖茨关于 5 年后智能设备发展的对话。当时莫博士询问两人五年后他们会使用怎样的便携设备,乔布斯说是 iPhone,盖茨说是平板设备。站在 2014 年看,似乎是乔布斯赢了,不过盖茨未来也有机会获胜。

2007 年,那时乔布斯刚刚发布 iPhone,微软第一次公布了 Surface 这个名称,虽然那时只是针对企业用的桌面电脑解决方案(有点像如今在微软各个公司摆着的 PixelSense),不过那时的盖茨就在布道他关于智能设备的远见。他所说的平板设备不仅仅是如今摆在人们眼前的 Surface RT 或者 Pro。而是一系列的应用场景的集合。

5849.jpg

盖茨原话如是:“我认为未来你不仅拥有一个设备,我认为你走到哪都会有个全屏设备(Full Screen),她会有语音功能,某种意义的键盘……她可以放进口袋,但你回家,她会是一个至少 60 寸的大屏幕,你可以看电影玩游戏,这些都会跟互联网相连,而你在卧室或办公室会有类似的设备出现……我的观点是每一个水平或垂直表面,都会有一个投影仪,你能把信息放上去。你的桌子会成为一个操作界面……”

看到了吗?这就是盖茨眼里的未来智能生活,也许在 2012 年微软没有实现这些,但是致力于做物联网枢纽的 Windows10 似乎正在努力做到这些事:这个世界上任何一个屏幕,都会成为你的操作界面,比如一款可穿戴设备,或者是物联网下的智能桌子。特别是微软为 Xbox360 带来了 Kinect 后,似乎有了这么一个关于智能家居的定义——让家居第一次看到使用者,并为其服务。

在中国,智能家居的制造者现在大体上分两派。

以小米为首的中心派,小米主推“智能家庭”概念,从Wifi路由器为中心变为以智能插座为入口,谷歌大概也属于这个行列,他们都在行业里进行激进的并购。这些互联网巨头认为未来智能家居将以一件家具或一个系统为中心。
另一派则是标准派,以深圳硬件厂商为首,他们认为智能家居间需要有通信标准,比如ZigBee,需要有无线充电标准,也需要有统一的人机交互标准,比如利用深度摄像头的体感操作以及语音识别。我更倾向于标准派,不过不完全是。

未来十年甚至数十年,智能家居将努力去中心化,就像盖茨当初预言一样,未来的世界你将拥有多个设备,无数个操作界面,为你提供统一的服务。这时你用来完成互联网搜索或者智能服务的设备,将不仅是一台电脑或者 iPhone,很可能是一个桌子或者一台冰箱。

在这样的未来,一个极力充当服务中心的恒温器或者智能插座似乎有点违和了。就像消费者不会刻意去购买一个万能遥控器,大多数厂商也不会屈服于生产一个中心设备的附属品。专注生产洗衣机的厂商,会生产性能更好更方便的智能洗衣机,这台洗衣机将能自动识别衣物、自动分类清洗,专注生产空调的厂商,也会生产会更具恒温性能的中央空调,某种程度上这样的产品才会大量被普及。这些智能家居唯一的共性,也许是他们能够具备更好的计算能力,她们都连结到互联网上,他们都能“看到”和“听到”使用者,并“理解”使用者的意图。

但是并不意味着小米或者谷歌就彻底错了,未来是很难预料的,即便是这些顶级公司,他们也认为在智能家居领域要快速试错,各类尝试我想他们都会去做。谷歌的立足点是美国家庭都习惯于使用恒温器,而中国家庭不可或缺的就是插座。这些商业洞察都对,只是让他们变成智能家居的中心,看起来非常难。试想一下吧,也许上一刻,你还开着特斯拉在回家路上,通过特斯拉向你家里的智能空调发去了开机的命令,下一刻你回到家,就在用手机来让智能空调调试至舒适的温度。

人们选择所谓智能家居或者智能设备追求的是方便,是易用性。就像阿里巴巴彻底改变了交易的场景一样,智能家居承担的一大功能点,就是改变所谓的服务场景。以前只能在某个场景下做的事情,在其他场景下也能用了。阿里让人们在任何地方都能买卖东西,那么智能家居很大程度上,也要完成类似的任务。

让人可以在任何人,在任何场景下,用任何方式都能享受到智能化服务,或许是智能家居一个可见的未来。要实现这样一个去中心化,任意场景下的标准化服务,或许需要更多的图形图像技术和语音识别技术,比如 NLP(语义识别)和行为监测。未来或许所有带上这类摄像头的智能家居都会被我们植入相关的软件,通过对使用者的行为监测,来提供服务。

那么未来的智能家居里,会不会出现接近“中心”的产品呢?一个超级智能手表?家庭机器人或许会成为一类特别重要的智能家居。家庭机器人不会是智能家居的中心,而是未来家庭的新成员。这是智能家居承担的第二大功能点——拟人。

哆啦 A 梦、星球大战里的 C-3PO 和 R2-D2,还是机器人总动员里的瓦力和伊娃?这些不再是科幻,而会变为可见的现实,家庭机器人就是下一个“克拉克轨道”。这些机器人也许会遵循阿西莫夫的机器人三定律。

事实上,利用图形图像和仿生学的机器人、机械臂早被利用在工业上。我因工作关系多次接触的德国图形图像老牌厂商 LMI,相关技术早就发展了几十年,他们的图形图像技术被应用在各类工业机器人中,比如富士康用来组装产品的超级机械臂。现在,这个世界上有大大小小不少硬件厂商正在将这些工业技术转为民用,他们正在努力为他们的客户们提供新的家庭成员。

有一位叫 Kevin Ochs 的极客值得关注,他不是机器人领域的专家,也不是智能家居业的创业者,他是 Dreamworks 的 Character Technical Director Supervisor。在梦工厂待了 12 年,曾参与制作功夫熊猫和驯龙记等知名 3D 动画。这个充满幻想的超级极客有一个爱好——蛛型机器人(spiderlike octopod robot)。

他从去年 11 月份开始研发的一款名叫 Charlotte 机器人,采用了 Raspberry Pi 以及 Xiton Live Pro 的结构。这里的 Xiton 是由 Pimesense 授权,ASUS 生产的一种深度摄像头,可以说与微软的 Kinect1 师出同门。深度摄像头在这里最大的意义,就是相比普通摄像头,加大了识别立体物体的效率。这也是盖茨在那次 D5 峰会上所言的愿景之一。而 Raspberry Pi 则是大家非常熟悉的树莓派,小型化廉价化的开源电脑代表。从这样一个结合可以让你看到这么一个信号:机器人技术已经开源化、廉价化以及民用化。

Charlotte 在仿生学技术上使用的是 Nuke,在这个领域实际有大量还不为大众所知的技术,但随着技术大量的开源,未来会逐渐走入平常百姓家。由于搭载了 Xiton,可以检测到外界的物体避免碰撞,拥有自然人际交互语音模块,在新的版本中通过 wifi 将机器人和 Google Translate‘s Voice 连接。机器人就可以通过语音来反馈信息,当发现威胁或者入侵者的时候机器人可以用语音进行警告。视频中的机器人就通过语音报告找到了碰撞源。

不仅如此,还是因为有 Xiton 这个深度摄像头,该机器人可以对碰撞源进行识别,如果能计算出骨骼信息,可以合理推测该物体是人类。因此这款机器人就拥有了能够在特定空间中搜索人类的能力,由于它的运动结构采用的是触肢式而非轮式,理论上拥有了全空间特征,可以在崎岖不平的表面运动。规避了一些家庭拥有楼梯 / 台阶 / 室内不平坦造成机器人无法通过或者卡住的问题。

想象下未来的家庭,你将拥有这样一个可以进行行为监测和语音交互的全地形机器人。你可以让她帮你看护小孩和老人,你可以让她帮你遛狗,为她写入健康服务类软件之后,她就可以全天候监测你以及你家人的健康了。

盖茨家的微软,就正在筹划着为自家的机器人放入微软小冰或 Cortana,他们在 IROS2014 chicago 直接推出了可编程并配备了深度摄像头的机器人。当苹果将 PrimeSense 这家深度摄像头核心芯片厂收购后,你可以很合理的猜测苹果下一步公布的智能家居中将会让 Siri 与深度摄像头结合。

有相似想法的超级公司已经带来了他们的产品。海尔带来了他们的机器人 ECAN,主要是面向幼儿教育,可以追踪幼儿,识别使用者行为,并投射影像。ECAN 也是一台可编程的机器人,海尔在机器人领域积累了 15 年,这是他们第一次将工业机器人技术上的积累转为民用。海尔预计 ECAN 将在今年 11 月上市,并且已经内置了第三方的应用。

在 Kickstarter 上众筹的机器人 Keecker,就是盖茨在 D5 峰会上预言的先行者。这台机器人拥有深度摄像头以及投影设备,Keecker 的愿景就是成为公用电脑——她会跟着使用者,在任意平面投射一个操作界面,供所有人去工作、学习和娱乐。

另一个众筹的机器人 JIBO 则更为有趣,开发者将其定义为“保姆”。JIBO 能够识别影像和声音,她能够很好的识别出不同的家庭成员,为不同的家庭成员提供服务,比如日程管理。最关键的是,JIBO 能够识别使用者的语音、肢体和表现的意义,并予以记录和反馈。
JIBO 的脑袋是个屏幕,当使用者微笑的时候,屏幕里也会出现一个微笑的符号,让使用者有种使用聊天工具跟人互动的错觉。

能够完成这些功能,得益于 JIBO 的核心部件——包括两个彩色立体相机、全身传感器(比如声音识别)、5.7 英寸高清液晶触屏、扬声器、ARM 移动处理器和嵌入式 Linux 平台。利用摄像头和声音识别,JIBO 不仅能够快速进行身份识别,还能进行动作捕捉以及识别情绪,最重要的是 JIBO 能够通过 Wifi 和蓝牙连入互联网,将一切捕捉到的信息放到云端进行处理。

在一个让智能家居看到主人的未来世界,盖茨关于任何地方都是操作界面的远见似乎会取得了胜利。一个能够跟你互动的家庭机器人,一个在任意场景下都能让你操作的智能设备,是不是比一个智能插座好玩多了呢?

在那次 D5 峰会的最后,盖茨谈到了一个当年非常流行的话题——什么时候 3D 应用到(操作系统的)人机交互上(When 3D comes into that interface)。

盖茨的原话是这样的:

“如今虚拟世界的图像绘制技术取得了突破,电脑的世界里可以大量采用 3D 图形了。你可以在一个虚拟的书店里,让图书像真实世界里一样摆放。特别是当我们逐渐能够让计算机获得更多的多媒体信息时,计算机就成了一个服务中枢。”
当莫博士问到多点触摸会不会让未来世界像少数派报告里那样时,盖茨直接跳到了更远的未来:

“这是视频识别,这是 3D 定位设备,我们有这样的设备了……未来摄像头将无处不在,当然我们必须处理好隐私问题。不过当计算机可以廉价的处理视觉信息的时候,就意味着这类设备(摄像头)会非常普遍。我们说的可不仅是便携设备,还会是在会议室或者是卧室。当计算机不仅能够获得大量来自虚拟世界的信息,还有来自真实世界的信息,两者信息的对等,将会带来人机交互的革命,一种好的技术演化。”

盖茨口中的 3D 定位设备就是后来的 Kinect,也许你从 ECAN、Keecker 或是 JIBO 看到深度摄像头的威力。新一代的人机交互。就像触屏所带来的革命一样,深度摄像头也将带来一次革命。这不仅将发生在智能家居或是机器人领域,而是各个技术可及的地方。

就像盖茨说的,摄像头在未来将无处不在。好了,我似乎找到了下一篇文章的话题,届时将为各位分析现今深度摄像头领域的发展趋势,你会发现如今在推动智能手机发展的超级公司,早已在这个领域打得不可开交。其中就包括小米、微软和苹果……
(0)
标签
评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)