假如说苹果乔布斯向全球科技领域亲自展现出牛仔裤子将成为顶级的时尚潮流;那撑着中西方不一样脸孔的黄仁勋和埃隆·马斯克则不断提示着全球,黑皮衣夹克才属于新时期大佬 icon。
今年特斯拉 AI Day 上,马斯克并没有耗费太多的时间热场。演出舞台显示屏上下分离,人型机器人擎天柱(Optimus)踏着六亲不认的脚步隆重登场。
假如你叫擎天柱,那在你胸前的一定便是赛博坦星的珍宝——领导模块(Matrix Of Leadership)了?
总算现身的机器人
批量生产价格有可能是Model 3的一半
做为变形精钢八十年代引入中国阶段的忠实拥趸,充斥着领导者和才华的柱子哥对我而言有极高尚的特殊含义,所以后面最好用 Optimus 的英文本名来叫法这两台神话中 Tesla Bot 的空天飞机。
各种各样路线和金属零件露在外面的 Optimus 你走四平八稳,不断向台下的与会人士挥手致意。
在演示视频中,Optimus 不仅可以独立走动,帮特斯拉办公室里的职工运送快递公司、提到茶壶给花浇水。
另一方面,Optimus 在特斯拉工厂饰演起一名荣誉的车间工人都是像模像样。
那也是此次 AI Day 以前,在大家的研究中,第一代 Optimus 所能够承担最常见、都是具有代表性的工作中。换句话说,Optimus 的第一批大顾客,很有可能是世界各地特斯拉超级工厂 Gigafactory。
但是,这副好像自己从试验室出走的样子不是 Optimus 标准的形状。显示屏再度上下分离,安上机壳的 Optimus,在三位特斯拉团队猛男拥簇下发生。
这一版本 Optimus 相比上一位而言,外型里的完成率更高一些,要来是对比空天飞机更为贴近批量生产状态:造型上更为类人,可玩性也需要更高一些。
用达到(Gundam)人生观表述人体演变的专业术语而言,貌似应当称为优先量产型?不,似乎还差许多,这两台做一下型号也还要好几个星期的时间也才可以正常的下床行走。
事实上,即使特斯拉机器人团队在过去的一年中一天工作十几个小时、一周工作中七天,Optimus 或是处于十分早期环节,将来还有一些室内空间把它在上市前做的更好。
依照马斯克的设想,将来 3 至 5 年之内 Optimus 的研发就可完善。在特斯拉机器人业务流程做到数百万台的批量生产经营规模时,其每台市场价将会有很大的小于汽车,预估价钱将无法高过每件 2 万美金——留意,远远低于特斯拉 Model 3 规范续航力全新升级不上 4 万美元的价格。
了解小七语言系统的各位都懂,这一 roadmap 无需尤其真的。这个不是讽刺,反而是友情提醒,科学地放正希望。
话归主题。埋下伏笔十分及时,如果卖假药得话,下面该出功效了。
马斯克表明,特斯拉 AI Day 的效果,是用最潮的专业技术演试,吸引住最才华横溢的技术性群体,一起把成效批量生产,协助百千万人。
「Make it happen」。
类似的说辞在第一个阶段聚集地发生,马斯克以十分现代美式的设计风格,不断提示有识有识之士们添加特斯拉,绽放光芒。
下面,特斯拉机器人团队技术负责大家轮着登台阐述了 Optimus 的小细节和各类进度。
使我们忘掉去年八月 AI Day 2021 上发布的赛博壮男品牌形象,先出场的 Optimus 等同于完成了基础功能的软件开发平台。后面那个看起来完成率更高「船新版本」,将还会继续不断改善。
完备的特斯拉人型机器人「Optimus」重 73 KG;
静座时功能损耗为 100W;
迅速徒步时功能损耗为 500W;
浑身上下包括了 200 个以上的可玩性,在其中手臂能够实现 27 个可玩性。
从最初发布到今天,Optimus 已经完成了三次演变。
Optimus 的感应器主力阵容当中,核心内容是与特斯拉 FSD 系统软件相近的监控摄像头。关键动能提供部件为一块 2.3kWh 的锂电池组,全部配电设备和测算信息系统集成到「人体」的上身其实就是躯体一部分。从总体上得话,在这张透视图中,Optimus 身体内蓝色是电子控制系统,橘黄色部分为电机。
之所以会设计方案,是在一定程度上借鉴了特斯拉汽车成熟的设计方案,尽可能的降低电子线束的总数。
现版本号 Optimus 浑身上下一共有 28 处电机执行机构——理解为人类骨关节就行。相比以前宣布的 40 个降低了四分之一之上,目地很简单,为降低总体功能损耗。
这显然很容易理解。如同智能手环的续航力水准,相比一次电池充电就能够维持动则一两周的正常启动,一天充不进去电就趴窝就和闹着玩儿一样。
Optimus 满电之后可以运作一整天。项目负责人并没有那就说明「运作」是相当常规应用情况,还是要去港口扛大包包这类极端化高强度工作。
为了能让「头脑」更「保持清醒」,Optimus 用了一颗特斯拉自主研发的 SoC 作为智慧神经中枢的关键所在部件,适用 WiFi 和 LTE(4G)数据连接。充分考虑机器人所处的情景与汽车巨大的差别,wifi网络、音频输入等适用,是保护人类消费者和 Optimus 彼此安全必需构成。
因为 Optimus 的手腿还不是很利落,特斯拉机器人团队其中一位负责人表示,这些人在 Optimus 中使用了和电瓶车撞击安全性测试同样的预测模型,经过测算来预测分析 Optimus 在姿势和体形下正常运转表现的,这主要包含了跌倒等状况等情况。
为了维护人体,结构基础的升级也成为团队工作的核心,胸口设置权限能量吸收地区,不仅可以协助人体在跌倒时防止将手臂和骨关节等关键部件毁坏,还能够避免立即「摔傻」。
这种有些像是我们的形态结构特点,与在将要摔倒的一瞬间反射所采取的一系列生理学自我防御机制。终究,受伤后无论是我们的医治、休养,或是机器人的检修、查验,各种各样实际意义上来说都很贵的不是么。
提到像人,特斯拉机器人精英团队为 Optimus 加入仿生学理论的设计方案。例如,模仿人们膝盖关节的组成,将设备膝关节的骨关节分成 4 个电机。
这样做的前提条件包括了一系列精确的测算。精英团队对实验环节中收集的各种各样数据信息,根据微积分学的形式进行了大批仿真模拟,来调整电机的输出功率。一方面减少行为的功能损耗,另一方面防止了「用力过度」所导致的人体失调等危害因素要素。
降低成本的关键所在之一,要在上面提到的 Optimus 浑身上下 28 处电机中,只实施了 6 种不同设计方案。用简约的服务化设计方案来提升生产能力,还可以一并减少维修的成本费,挺有特斯拉的工业风不是么?
这种关键性的电机中,重点部位的负载水平之深,单独部件就足够吊起来一台三角钢琴。
做为人们的身上更为精妙的部件,对手部肌肉的控制与熟练掌握,算得上是人类的进化的关键所在之一。在这一方面,特斯拉机器人精英团队为 Optimus 制定了高精密但敏锐的中小型电机,使其不但具有挪动厚重一个物体水平,还可以灵活地解决对那些精密度有很高的标准的工作中。
为了能让 Optimus 完成基本姿势,还用上动作捕捉系统,学习培训人们挪动东西时的轨迹,再根据人体的结构特性,对于整个体形操纵做好规划。
虽说 Optimus 用上许多特斯拉汽车的专业技术,但是对于生产制造机器人而言,但是极大地不一样。终究汽车只应该考虑走在路上跑得状况,而构想中双脚人型机器人活动情景则会比特斯拉汽车繁杂的多。徒步仅仅基本,从上下楼梯、蹲下去站起来、转过身到挪动物件、打螺丝、电钻打孔等等,全是 Optimus 必须应对的重担。
说到这儿,使我们顺带捞一下 87 版《机械战警》里火力点和武德一样充足,依然在下楼摔的四仰八叉的反派角色机器人 ED-209。
《机械战警》里的第一代 ED-209 机器人
在越来越有效以前,Optimus 从 2022 年 4 月的咿呀学语,到 9 月份正常走路,花掉了 5 个月时长。幸亏马斯克在创造生命层面充足有天赋,希望在跟育儿教育一样的培养人工智能技术上也要比同行们走更快。
为何特斯拉一定要将自已的量产型机器人设计为人型?
第一,由于难。相较于非人型机器人,人型促使其设计与完成难度系数具有提升。可是完成它,对特斯拉左右而言实际意义更为极大。
第二,更具有概率。真实世界中,用于各行业的机器人早已许多。举一个典型的例子,大家中许多人看到过驮着菜品的传菜员机器人穿梭在饭店、或者撑着显示屏在医院大厅四处转悠的数据对话框机器人。
这种无一例外主要是针对单一情景来设计的。而型体动作和方法更贴近人类人型机器人,在适用场景的概率上大大的超出奇形怪状的「先辈」们,也更具有进到我们生活的前提条件。
特斯拉要做的就是有益的机器人,而非技术性贵宾票。
马斯克在各个场所表明,Optimus 人型机器人多是特斯拉最主要的产品研发新项目,甚至还会比汽车业务流程与 FSD 方案更有意义。
特斯拉机器人最初精准定位,便是替代大家从业反复枯燥乏味、具备危险性工作中。为了能够使其走得更长久,在家做饭、修剪草坪、陪护老人这种让机器人走进千家万户的最基本情景,才能是特斯拉机器人在人类生活中最真实的写照。
尽管今年的 AI Day 绵延不绝地持续了好几个小时,马斯克还是没有忘记在活动结束后第一时间上线跟网友们激情互动。这不,他还说之后 Optimus 机器人还会有猫女(catgirl)版。
说实话,如果特斯拉上下真有这个闲心的话,我到希望他们以后出个 Daft Punk 版,也许这才更能衬托马斯克的那身黑皮夹克。
法国传奇电子音乐组合 Daft Punk
一年80倍,FSD迭代驶上快车道
相比于初次亮相的人形机器人原型机,FSD 算是老生常谈了。作为老朋友的 FSD,很难再看到颠覆性的技术飞跃,但是硬核的优化也不少。
首先是测试规模的扩大。目前,FSD Beta 自动驾驶测试版有 16 万名客户,2021 年还只有 2000 名。一年之间,测试数量扩大了 80 倍。对于坚持纯视觉路线的 FSD 来说,推送规模的扩大,意味着能够提供源源不断的高价值数据作为「养料」。
利用自动标注、模拟的训练数据,来训练由识别算法和环境建模算法等构成的 FSD 主体算法框架,完成整个迭代的过程,是 FSD 自动驾驶算法的开发流程。
在去年的 AI DAY 上,特斯拉透露了在自动驾驶技术上使用了 Occupancy Networks 神经网络模型,直接在神经网络中完成 2D 的图像平面到 3D 的 BEV 空间的变换,提升了多摄像头感知下的准确性和稳定性。今年,进一步将整个闭环流程优化。
比如,为了提高效率,特斯拉建立了一个「自动标注机器」,用智能标注代替人工标注。
借助自动标志机制,能够在相机显示不清楚时使用其他剪辑来填充图片,更智能地选取视频帧,提高视频帧质量的同时减少数量,将训练速度提高 30%。
同样地,仿真模拟的效率和质量也进行了优化。基于车辆采集到的真实信息,可以将通常要几个星期人工完成的重建模拟环境,在不到 30 分钟内完成。
目前,FSD 深度神经网络达到 100 万参数,15 万+神经网络层,37.5 万个链接,过去一年里工程师们对 7.5 万个神经网络模型进行训练。这些都是优化训练模型的结果。
不只是训练模型的到了优化,在决策方面也做出了优化。这次特斯拉的工程师们专门提到了对自动驾驶的史诗级难题——无保护左转做出的改进,在无保护左转时,不仅能识别、预判行为的行为,也能识别小狗。
其实在最近 FSD 的几次更新中,无保护左转更自然、减少激进的「极限操作」一直是一个趋势,这也让自动驾驶越来越更接近人的驾驶行为。
当然,在优化了 FSD 后,马斯克又来「放卫星」了,「从技术角度来看,我们已经具备了年底进入全球市场的能力。」
已经数不清这是第几次 FSD 全面开放的预告了,不过技术之外各地区监管政策,才是决定国内车主们能不能体验到 FSD 的关键。
Dojo 超级计算机:
剑指英伟达,觊觎亚马逊
去年在 AI DAY 上亮相时,Dojo 就因为赶超芯片大厂的潜力备受关注。今年 Dojo 直接拉出了英伟达 A100 来对标。
Dojo 超级计算机的单个训练模块由 25 块特斯拉自研的神经网络训练芯片——D1 组成。由于每个 D1 芯片之间都是无缝连接在一起,相邻芯片之间的延迟极低,训练模块最大程度上实现了带宽的保留。
相比于去年首发时,Dojo 的设计更加集成。这使得一个 Dojo 训练模块,相当于 6 个通用 GPU 性能,而能耗和成本仅相当于 1 个 GPU。
简单来说,Dojo 能将通常需要几个月的工作减少到一个星期。
在与英伟达 A100 的对比中,特斯拉的工程师给出了 Dojo 和英伟达 A100 在跑经典图像分类模型 ResNet-50 时的结果,Dojo 可以实现比 A100 更高的帧率;而跑神经网络模型 Occupancy Network 时,Dojo 的性能倍增;最终的目标是 4.4 倍于 A100 的单芯片训练速度,和更低的能耗、成本。
当然,对于实力强劲的 Dojo,马斯克的预期也不是只给特斯拉自己用,「也会考虑 AWS 一样的方式对外商用。」
看来,Dojo 的目标对手不只有英伟达,也有亚马逊云。
2023 年第一季度,第一个 Dojo Exa POD 就将完工面世,对于大家最直接的用处,可能就是大幅度提高 FSD 数据处理的速度。
最后
就在 AI DAY 的前一天,马斯克在社交网络上说,这次活动的目的是为了招聘人工智能和机器人领域的工程师。
不知道极客的工程师们,有没有被这场全程硬核的 AI DAY 「撩」到呢?