施工电梯

5年后机器人将敲开你家大门可能不止一个!今天的云栖大会信息量很大

发布时间:2024-10-22 08:27:58   来源:RAYBET雷竞技首页官网

  给你半分钟时间认真思考一个问题:如果有一天家里来一个人形机器人,你是打算开箱把它打开,还是让它自己敲门进来?

  这不是科幻电影里的场景,更不是天方夜谭,也许只要5年时间,这样的一个问题会真实地摆在你面前。

  今天开幕的云栖大会上,聚集了国内最强大的大模型、无人驾驶和机器人,在一场场脑暴中,我们正真看到席卷全球的AI浪潮已经影响或正在改变真实的物理世界。

  上午,云栖大会主论坛,一场关于“通往AGI的大模型发展之路”的圆桌论坛上,清华大学人工智能研究院副院长、生数科技首席科学家朱军说,对于AGI,学术界和产业界一般认为分为L1-L5这五个阶段。

  L1相当于聊天机器人,就是像ChatGPT可以做很多对线叫推理者,可以做复杂问题的深度思考和推理。L3又叫智能体,AI开始从“数字世界”走向“物理世界”。L4是创新者,它会发现、创造新的东西和知识。而到了L5则变成组织者,它可以去协同,或者某种组织方式更高效来运转。

  虽然目前还处于AGI的初级阶段,不过今年有三件事让阶跃星辰创始人、首席执行官姜大昕印象非常深刻,分别是GPT-4O的发布,在多模融合领域上了一个新台阶;特斯拉发布FSDV12无人驾驶系统和最近OpenAI发布了O1新一代模型。

  “在GPT-4O之前,大模型是一个个孤立的,比如有像GPT4V这样的视觉理解模型,有Dalle、Sora这样的视觉生成模型,还有像Whisper这样的声音模型。但是到了4O,这些原本孤立的大模型融合在了一起。”

  而融合这件事之所以这么重要,是因为物理世界本身就是一个多模态的世界。“多模融合有助于我们更好地为物理世界建模,从而模拟世界。”姜大昕说。

  姜大昕说,AGI的演进路线可大致分为模拟世界、探索世界、最后归纳世界。而过去几个月GPT—4O、FSDV12和O1分别在这三个阶段或者这三个方向上取得了非常大的突破,“更重要的是为将来的发展也指明了一个方向。”

  被称为天才少年的杨植麟是月之暗面Kimi创始人。在本轮AI浪潮中,月之暗面无疑是最亮眼的初创公司,创立不到一年半的时间里就已斩获了多轮融资,明星资本、互联网巨头争相出手。成立至今,月之暗面经历了4轮融资,成为国内大模型勇于探索商业模式的公司中估值最高的一家。

  杨植麟说,AI不仅在智商上有了很大提升,横向来看也有了很多新的突破。比如从Sora完成文生视频生成,到最近很多新产品和技术出来,不同模态之间的转化、交互和生成,慢慢的变成熟。

  杨植麟预测,随着O1大模型带来的思考范式的不同,未来在产品形态上有很大变化。“以后的AI,可能不光思考20秒、40秒,它还要调用各种工具,可能执行的是分钟级别、小时级别甚至天级别的任务,所以产品形态上会更接近一个人,或接近’助理’的概念,帮你达成目标。”

  AGI从L1、L2到L3,意味着未来智能体能更好地做推理规划,更高效地和环境做交互以及完成人类的复杂任务。那么这样的一个过程还需要多久?

  朱军预测,未来18个月可能比较令人兴奋的一个进展,“我希望看到L3已经基本上实现。”

  在最近的2024 ALL-IN峰会上,特斯拉和美国太空探索技术公司(SpaceX)的首席执行官埃隆·马斯克(Elon Musk)预测,未来机器人的数量将远超于人类,达到至少2:1甚至3:1的比例。

  而早在去年,他曾公开表示,特斯拉未来将以人形机器人为基础,擎天柱要卖100亿台。

  今天云栖大会上有一场关于“人形机器人的‘图灵时刻’”的圆桌上,星动纪元创始人陈建宇;北大-银河通用具身智能联合实验室主任、智源学者王鹤;宇树科技创始人、首席执行官王兴兴以及逐际动力创始人张巍进行了大胆预测。

  陈建宇认为,不管是工业还是商用甚至是家用,机器人将在一两年时间内进入,并进行简单工作。

  “5年左右,可能会发生天翻地覆的变化。”对于通用机器人的落地应用,王兴兴非常乐观。他预测,最快明年机器人将在一些公益场景或固定场景有商业经济价值的落地应用。

  “我觉得3年左右,至少全世界内通用型机器人会出现。”王兴兴说,比如一台机器,不用固定工位,家里或工厂的大部分的场景下,你只要给它简单做一个示范,让它学会去做,将是一件概率很大的事。

  而在三四年前,当投资人问王兴兴做不做人形机器人时,王兴兴的答案是坚决不做。早在大一时,他就尝试做过一个小型机器人,但很快发现,当时的人类技术还没有很好的方法驾驭这么复杂的机器人系统。

  直到2022年大语言模型开始爆发式发展,宇树在2023年初真正介入研发人形机器人,至今已经发布了两款业界反响还不错的人形机器人。

  “整个发展节奏,无论是硬件还是软件,在某一些程度上都超过我自己的预计。”王兴兴说。

  而王鹤给银河通用定的目标是5年。“在车厂里抱箱子的机器人将达到1万台,10年可以安全性达到进入家庭标准,而15年后预计可能会产生千万乃至大千万级别的市场。”

  钛媒体联合发起人刘湘明经常和同事们开玩笑说,我们这代人可能是最后一波大规模自己开车的人。

  作为圆桌论坛的主持人之一,今天,刘湘明的这个玩笑在云栖大会上被“坐实”了。

  “从现在到未来的36个月,可以让我们每一个人在每一个城市都像老司机一样开车,这是端到端大模型对于用户的一个强感知。”这是今天云栖大会主论坛的“生成式AI重塑无人驾驶”圆桌会上,小鹏汽车董事长、首席执行官何小鹏的预测。

  说起无人驾驶,可能很少有人知道,这项技术最早在1925年开始开发。丰田开发的时间是1999年,谷歌开始的时间是2009年。而百度和小鹏进入的时间分别是2014年和2017年。

  过去的无人驾驶,规则是人类工程师用代码一个个写出来的,“一个人无法用规则去面对世界上所有的场景,即使仅仅在开车这一个专业的业务。”何小鹏说,这也导致直到今天无人驾驶没有规模落地。

  不过随着生成式AI的出现,无人驾驶在过去一年多的时间里看到巨大的机会。今年1月,特斯拉FSD全无人驾驶系统升级到了V12版本,何小鹏体验后的评价是:“几乎接近人类司机的驾驶水平。”

  端到端的大模型的出现,被认为将未来的无人驾驶的高度做得更高,且下限也可以提高。

  NVIDIA全球副总裁、汽车事业部负责人吴新宙,此前在无人驾驶行业工作超过十年,也见证了无人驾驶整个的变化和进展。吴新宙说,大模型已经在网络上利用互联网量级的数据训练过,它对物理世界的理解远远超越了汽车驾驶的场景。“有了这样的通用能力,我们始终相信无人驾驶可以非常快地去提高它的上限。”

  “我觉得FSD在去年有着长足的进步,以前不管是中国的NGP,还是在海外FSD,都只是一个很基础的自动辅助驾驶。但FSD用端到端的大模型之后,让我们都看到了一个更巨大的变化,更拟人、很流畅,是当地的老司机。”

  何小鹏预测,一旦当端到端的模型下限能力在明年会快速提高,下限能力快速提高之后只用两年,就可以在全世界内做到超过L4的标准能力(高度无人驾驶水平)。

  “这时候成本又低,下限又高,上限更高,完全是一套不一样的降维打击会冲击整个L4。”

  “现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会出现两三个机器人,可能是宠物狗、保姆、助理。”

  今天,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在2024云栖大会上发表主题演讲时说。

  吴泳铭认为,过去22个月AI发展的速度超过任何历史时期,“生成式AI最大的想象力,绝不是在电子设备屏幕上做一两个新的超级App,而是接管数字世界,改变物理世界。”

  吴泳铭说,过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,提高了全世界的生产力水平。这种价值创造,可能是移动网络连接价值的十倍、几十倍。

  比如汽车行业,之前的无人驾驶技术靠的是人来写算法规则,但即使写几十万行代码都无法完全覆盖所有的驾驶场景。而采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

  还有一个迎来巨变的行业是机器人。吴泳铭认为,未来所有能移动的物体都会变成智能机器人,它可能是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员,也可能是家庭里的宠物狗、保姆、助理。

  在今天的大会上,通义大模型迎来了年度重磅发布。基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。

  阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

用手机扫描二维码关闭
二维码