×

登录vrpinea

2023年05月26日

AI的王炸,不远了

作者:VRPinea



 当大模型AI遇到机器人,

 才是真正的王炸。



在正文开始之前,小P先插播一则小预告:

VRPinea总编辑老缪将于5月30日、31日,进行两场苹果MR专题直播。

前一场面向TMT领域(包括但不限于XR\AI\智能穿戴)一级市场投资机构的从业者,可凭个人名片及投资机构个人介绍页面获取会议邀请码。

后一场对XR行业从业者开放,可凭个人名片获取会议邀请码。届时将采用实名邀请制会议直播,每场直播限额100人。

感兴趣的小伙伴们,可以长按复制下方链接,填写腾讯问卷报名直播。完成问卷后添加VRPinea官方微信号(下方二维码),联系运营小伙伴即可。名额有限,先到先得哟!


https://wj.qq.com/s2/12407097/eaeb/ 



内容暂定:苹果MR硬件预测当前基于VST的MR硬件设备的问题所在、未来消费级MR在B端、C端的应用场景、苹果MR的硬件演进路线(基于产业链发展的预测)。

欢迎各位业界同仁参与直播,共同讨论。

 

(VRPinea2023年5月26日讯)当你为AI对话、AI绘画而惊讶时,请不要低估大模型AI的能力。真正的AI王炸,是给机器人真正的灵魂!

 

现阶段,很多人都开始认可以ChatGPT、Midjourney为代表的大模型AI的能力。但这仅仅是个开始。真正意义上,这一轮AI的浪潮,目前还是停留在泛科技圈层之内。出圈的关键,或许会是,人类与智能设备能够进行自然语言的交互。

(人与机器人)

 

对于绝大多数普通人来说,这一点会在AI赋能智能家居和可穿戴设备的时候到来。简单来说,当你的Siri、小爱同学、天猫精灵哪天能不像个“人工智障”的时候,AI的真正出圈就来了。但这并不会是这一轮AI的王炸,有这样一个观点,当GPT这类的大模型AI能够实现自我编译之时,AI的飞轮才真正转动起来。

 

什么是机器人


对于目前的机器人来说,大模型AI会不会成为它们的灵魂?首先得科普一下,到底什么是机器人,按照国际标准化组织的定义:机器人是一种能够通过编程和自动控制来执行诸如作业或移动等任务的机器。并不是按照我们日常理解中一定要长得像个人的机器,才是机器人。

(维基百科关于机器人的定义)

 

举个例子,我们日常生活中最常见的扫地机器人,它的工作原理是通过摄像头的Slam功能建立一套它所理解的房间格局。然后通过编程指令完成打扫工作。如果你跟一个扫地机器人用口语说,我想让你打扫一下我的书桌底下,它大概率会听不懂。它能听懂的往往是预设置之后的命令。比如你在手机App上标注,哪个房间是客厅、书房、厨房等等。然后命令它打扫某个房间。

(某款扫地机器人)

 

现在的机器人没有灵魂


同样的,在工业领域的机器人的编程程序会更为复杂。为什么,我们不能用日常语言去命令机器人做事呢?很简单,因为机器人根本听不懂我们的日常语言。还是以扫地机器人为例,当我们说让它去打扫书桌底下转换为它能听得懂指令,需要编译成:从X点移动至Y点,执行A动作指令。

 

当然,这只是相对功能单一的机器人。如果是人形机器人,比如我们要命令机器人去小区门口给我们的拿一下快递。第一步是我们的命令本身,从家里移动到小区门口,拿起快递,再回到家里。第二步是它需要拆解这个任务,需要完成移动、开家门、坐电梯、出电梯、走到小区门口、识别快递、拿起、回家等一系列的子任务。在这个过程中,它还需要完成各个子系统的协调、通信误差等的计算。

(某海外公司的快递机器人)

 

但问题是,现在对于机器人来说,缺的就是,从我们的自然语言命令到它拆解任务的桥梁。这个桥梁,不正是大模型AI所擅长的领域吗?

 

大模型AI能否赋予机器人灵魂?


目前,海外已经有团队在做基于波士顿动力的机器狗Spot和ChatGPT的结合尝试。效果还是非常惊艳的。我们回到日常使用场景,目前的大模型AI所给出的结果,是使用者无法控制的。而机器人这一类的产品,是复杂动力学的产物。各个子系统之间的命令,基于编程,虽然傻,但还能用。

(波士顿动力的机器狗)

 

但当我们用ChatGPT来下达指令时,ChatGPT会不会“自发”做出莫名其妙的处理。诸如,你明明要人形机器人去拿快递,结果它在原地做瑜伽。或者快递是拿了,但当它拿起的时候,就已经捏爆了。这还需要机器人厂商进行可行性的分析,也有可能需要把一些复杂动力学的约束条件写进去。

(机器人与AI网络概念图)

 

结语


当有一天机器人真的接入了GPT这一类的大模型AI,当我们不下达命令,它却依旧在自我思考的时候,或许那才是真正可怕的开始。


本文属VRPinea原创稿件,转载请洽:brand@vrpinea.com


评论



返回
上层
返回
顶部