#
暗黑厨房里的机械共舞,人形机器人如何从科幻走进现实?
发布时间:2025-03-03 09:06:31

image.png

Figure机(jī)器(qì)人(rén)(图(tú)源(yuán):Figure)

在(zài)科(kē)幻(huàn)电(diàn)影(yǐng)的(de)预(yù)言(yán)中(zhōng),人(rén)类(lèi)与(yǔ)机(jī)器(qì)人(rén)的(de)共(gòng)生(shēng)总(zǒng)是(shì)始(shǐ)于(yú)一(yī)场(chǎng)静(jìng)默(mò)的(de)革(gé)命(mìng)——那(nà)些(xiē)曾(céng)经(jīng)笨(bèn)拙(zhuō)的(de)机(jī)械(xiè)臂(bì)开(kāi)始(shǐ)像(xiàng)人(rén)类(lèi)一(yī)样(yàng)思(sī)考(kǎo),冰(bīng)冷(lěng)的(de)金(jīn)属(shǔ)关节(jié)学(xué)会(huì)与(yǔ)生(shēng)活(huó)场(chǎng)景(jǐng)共(gòng)舞(wǔ)。而(ér)2025年(nián)2月(yuè),这(zhè)一(yī)幕(mù)似(shì)乎(hu)悄(qiāo)然(rán)在(zài)现(xiàn)实(shí)中(zhōng)上(shàng)演(yǎn)。

美(měi)国(guó)初(chū)创(chuàng)公(gōng)司(sī)Figure推(tuī)出(chū)的(de)新(xīn)一(yī)代(dài)人(rén)形(xíng)机(jī)器(qì)人(rén),搭(dā)载(zài)了(le)名为(wèi)Helix的(de)视(shì)觉(jué)-语(yǔ)言(yán)-动(dòng)作(zuò)(VLA)模(mó)型(xíng),极(jí)大(dà)增(zēng)强(qiáng)了(le)机(jī)器(qì)人(rén)的(de)感(gǎn)知(zhī)、控(kòng)制(zhì)、理(lǐ)解(jiě)能(néng)力(lì),让(ràng)两(liǎng)台(tái)机(jī)器(qì)人(rén)无(wú)需(xū)预(yù)演(yǎn)便(biàn)能(néng)默(mò)契(qì)传(chuán)递(dì)物(wù)品(pǐn),以(yǐ)近乎科幻的智能协作能力,将家庭场景中的机械管家从幻想拉入现实。

人形机器人:科技的集大成者

image.png

电影《大都会(Metropolis)》剧照

机器人(Robot)的概念,最早出现在捷克著名作家卡雷尔·恰佩克(Karel Čapek)于1920年创作的戏剧《罗素姆万能机器人》中。1927年电影《大都会》中的人造人玛丽亚,便以机械之躯承载人性,成为赛博朋克美学的早期雏形。

人形机器人(Humanoid Robot)是一种利用人工智能和机器人技术制造的具有类似人类外观和行为的机器人,融合了机械工程、电子技术、计算机科学、人工智能等多学科领域的前沿成果。

image.png

NASA 的 Valkyrie (R5) 机器人

图源:NASA

人形机器人的核心技术由四部分组成:

感知系统:指人形机器人需要具备感知环境的能力,通过传感器等设备来获取外部信息,如视觉感知、听觉感知、触觉感知等。

智能决策:指通过机器学习、深度学习、神经网络等人工智能技术,使机器人能够根据情景和任务要求自主决策和判断。

人机交互:指人形机器人能够更好地与人类进行交流和互动的功能,如语言识别、情感识别等。

运动控制:指通过使用各种传感器和算法来对机器人进行姿势控制、步态规划和平衡控制。

人形机器人的发展史,是一部人类试图用机械复刻自身的史诗。从蒸汽时代的齿轮幻想,到AI时代的神经网络革命,每个技术节点的突破都暗合着科幻作品的预言与启示。

01

早期发展阶段(1970s-2000):

早期的人形机器人模型外表简略,仅仅具有初级的人类躯干与肢体形状,能实行的功能也存在很大局限性,只能实现简单的行走和手部运动,尚未具备交互能力且智能化水平较低。

image.png

WABOT-1机器人(图源:早稻田大学)

例如1973年,日本早稻田大学研发出了世界上第一款人形机器人WABOT-1,它只能够执行搬运物体等任务,智力水平相当于一岁半的婴儿;同时期日本本田公司研发的自主行走机器人P2和ASIMO也仅仅在行走和平衡方面进行不断优化。

02

高度集成发展阶段(2001-2011):

这一阶段是人形机器人初级感知功能的起步阶段。这一时期的人形机器人因技术的突破可以实现与外界环境有限的互动,并且运动自由度提升。虽然应用场景较为简单,主要用于展览和娱乐,但在运动控制和人(rén)机(jī)交(jiāo)互(hù)方(fāng)面(miàn)确(què)实(shí)有(yǒu)很(hěn)大(dà)进(jìn)步(bù)。

image.png

本(běn)田(tián)机(jī)器(qì)人(rén)发(fā)展(zhǎn)历(lì)史(shǐ)与(yǔ)第(dì)三(sān)代(dài)ASIMO(图(tú)源(yuán):本(běn)田(tián)Honda)

例(lì)如(rú)2003年(nián)索(suǒ)尼(ní)QRIO机(jī)器(qì)人(rén)配(pèi)备(bèi)了(le)语(yǔ)音(yīn)识(shi)别功能和人脸识别功能,能识别10种面部表情;2011年,日本本田推出的第三代ASIMO,其利用传感器避开障碍物等自动判断并行动的能力,还能用五根手指做手语,或将水壶里的水倒入纸杯;ASIMO不仅能上下楼梯、端茶倒水,还曾在2014年指挥底特律交响乐团。

03

高动态运动与交互能力提升阶段

(2012-2020):

该阶段的研发重点放在强化人形机器人的运动能力或交互能力上。强化学习技术(shù)让(ràng)人(rén)形(xíng)机(jī)器(qì)人(rén)在(zài)与(yǔ)环(huán)境(jìng)的(de)交(jiāo)互(hù)中(zhōng)不(bù)断(duàn)优(yōu)化(huà)动(dòng)作(zuò)和(hé)行(xíng)为(wèi),情(qíng)感(gǎn)识(shi)别(bié)和(hé)语(yǔ)言(yán)交(jiāo)互(hù)技(jì)术(shù)也(yě)得(de)到(dào)显(xiǎn)著(zhe)提(tí)升(shēng)。

image.png

POPPY机器(qì)人(rén)发(fā)展(zhǎn)历(lì)史(shǐ)(图(tú)源(yuán):Inria)

例(lì)如(rú),2013年(nián)美(měi)国(guó)波(bō)士(shì)顿(dùn)动(dòng)力(lì)公(gōng)司(sī)研(yán)发(fā)的(de)双(shuāng)足(zú)人(rén)形(xíng)机(jī)器(qì)人(rén)Atlas具(jù)有(yǒu)超(chāo)高(gāo)的(de)运(yùn)动(dòng)能(néng)力(lì),可以熟练地完成垂直起跳、倒立、跨越障碍、后空翻,甚至和Spot机器人一起舞蹈,具有手脚都参与的跑酷功能。

2016 年法国 Inria Flower 实验室开发的第一款开源人形机器人 POPPY 上市,它在教育、科研、文化艺术等(děng)多(duō)个(gè)领(lǐng)域都(dōu)展(zhǎn)现(xiàn)出(chū)出(chū)色(sè)的(de)适(shì)应(yīng)能(néng)力。在(zài)教(jiào)育(yù)领(lǐng)域,POPPY 可(kě)以(yǐ)作(zuò)为(wèi)教(jiào)学(xué)工(gōng)具(jù),帮(bāng)助(zhù)学(xué)生(shēng)更(gèng)直(zhí)观(guān)地(de)理(lǐ)解(jiě)机(jī)器(qì)人(rén)原(yuán)理(lǐ)和(hé)编(biān)程(chéng)知(zhī)识(shi);在(zài)文化(huà)艺(yì)术(shù)创(chuàng)作中,艺术家们借助 POPPY 的独特表现力,创作(zuò)出(chū)许多新颖的艺术作品。

04

高度智能化发展阶段(2020至今):

借助现代人工智能、计算机视觉系统等先进技术,人形机器人迈向智能化进阶之路。如今的人形机器人的感知与认知能力大大增强,大多具有高度仿生的躯干构型和拟人的运动控制,在重量、灵活性等方面都有显著进步,实用性大大增强。

image.png

Ameca机器人发展历史(图源:Engineered Arts)

例如,英国 Engineered Arts 为 Ameca 接(jiē)入(rù) GPT-3/4 后(hòu),它(tā)如(rú)获(huò)新(xīn)生(shēng)。Ameca 配(pèi)备(bèi)了(le)高(gāo)级(jí)传(chuán)感(gǎn)器(qì),具(jù)备(bèi)面(miàn)部(bù)和(hé)多(duō)种(zhǒng)语(yǔ)音(yīn)识(shi)别(bié)功(gōng)能(néng),可(kě)以(yǐ)自(zì)然(rán)地(de)与(yǔ)人(rén)类(lèi)互(hù)动(dòng),不(bù)仅(jǐn)能(néng)敏(mǐn)锐(ruì)检(jiǎn)测(cè)人(rén)类(lèi)情(qíng)绪(xù),还(hái)能(néng)通(tōng)过(guò)丰(fēng)富(fù)的(de)表(biǎo)情(qíng)和(hé)手(shǒu)势(shì)传(chuán)达(dá)信(xìn)息(xi)。

在(zài)一(yī)些(xiē)高(gāo)端(duān)科(kē)技(jì)体(tǐ)验(yàn)场(chǎng)所(suǒ),Ameca 作(zuò)为(wèi)接(jiē)待(dài)员(yuán),以(yǐ)亲(qīn)切(qiè)的(de)交(jiāo)流(liú)和(hé)互(hù)动(dòng)为(wèi)访(fǎng)客(kè)提(tí)供(gōng)服(fú)务(wu),给(gěi)人(rén)留(liú)下(xià)深(shēn)刻(kè)印(yìn)象(xiàng)。特(tè)斯(sī)拉(lā)公(gōng)司(sī)的(de)Optimus Gen2人(rén)形(xíng)机(jī)器(qì)人(rén)的(de)移(yí)动(dòng)功(gōng)能(néng)、灵(líng)巧(qiǎo)性(xìng)、平(píng)衡(héng)性(xìng)和(hé)实(shí)时处理方面的功能也因为AI大模型的介入得到了显著提升。

image.png

Unitree H1机器人(图源:宇树科技)

虽然国内人形机器人的发展起步较晚,上个世纪90年代才开始研究。但近年来,国内人形机器人研发取得了显著进展,众多企业和科研机构积极投身其中,在技术创新和产品应用方面不断探索。宇树科技便是国内人形机器人领域的佼佼者。

在春晚(wǎn)舞(wǔ)台(tái)上(shàng),宇(yǔ)树(shù)科(kē)技(jì)的(de)16台(tái)人(rén)形(xíng)机(jī)器(qì)人(rén)Unitree H1与(yǔ)舞(wǔ)蹈(dǎo)演(yǎn)员共同演绎《秧BOT》,以“赛博秧歌”惊艳全场。这些机器人拥有19个关节,手臂额外增加3个自由度,实现了手绢旋转、抛掷回收等高难度动作。

这支名为《秧BOT》的舞蹈背后,是19个关节的精密协同,是每帧动作的AI映射,更是双足机器人在复杂动态平衡领域的突破性进展,充分展现了宇树科技在人形机器人研发方面的深厚实力。

人形机器人的发展前景令人充满期待。随着人工智能、材料科学、传感器技术等领域的持续创新突破,人形机器人将变得更加智能、灵活和强大。

在智能水平方面,它们将具备更强大的学习能力和推理能力,能够理解和处理更加复杂的任务和情境。通过与物联网、大数据等技术的深度融合,人形机器人可以实时获取和分析海量数据,实现更精准的决策和更高效的行动。

在运动能力上,新型材料和机械设计将使人形机器人的动作更加流畅、自然,能够适应各种复杂的地形和环境,完成更多高难度的动作。

image.png

Figure机器人(图源:Figure)

随着人形机器人技术的不断成熟,其应用场景也日益广泛。在工业领域,它们可以承担一些危险、重复或高精度的工作;在医疗领域,人形机器人可协助医生进行手术,凭借其高精度的操作能力,降低手术风险;在家庭服务方面,人形机器人可以担当家务助手,扫地、擦窗、洗碗等家务都能轻松完成;在教育领域,人形机器人作为创新的教学工具,能够以生动有趣的方式传授知识。

由此可见,人形机器人未来潜力巨大,不过仍面临多种挑战。

1.高算力:人形机器人的姿态、速度和力度等方面,都需要高算力,现阶段的计算能力面临巨大挑战。

2.弱技术:现在基础技术能力仍然很弱,现有的软件算法等不足以支撑人形机器人的大规模应用,仍需技术大幅创新。

3.高成本:研发成本高昂,高额亏损、研发投入高,是人形机器人行业的常态。

4.不安全:数据安全能力和体系均存在不足,面临安全隐私等问题。

image.png

游戏《底特律:化身为人(Detroit: Become Human)》主角康纳

从WABOT-1的简单动作到Ameca的自由互动,人形机器人正以“科技奇迹”之姿步入日常生活。它们既是《2001太空漫游》中HAL 9000的进化版,也是《底特律:变人》中康纳的原型。但技术的终极目标并非取代人类,而是如《星际穿越》中的TARS一般,成为探索未知的协作伙伴。

未来,当人形机器人真正融入社会时,人类或将重新定义“人性”——不是以生物学特征为界限,而是以创造力、同理心与伦理选择为标尺。

或(huò)许(xǔ)正如所有经典科幻的警示寓言,人形机器人终将成为照见人类本质的镜子:当它们学会在递出苹果时调整指尖力度以防磕碰,我(wǒ)们(men)是(shì)否(fǒu)能(néng)以(yǐ)同(tóng)等(děng)温(wēn)柔(róu)对(duì)待(dài)同(tóng)类(lèi)?当(dāng)它(tā)们(men)突(tū)破(pò)图(tú)灵(líng)测(cè)试(shì)的(de)瞬(shùn)间(jiān),人(rén)类(lèi)引(yǐn)以(yǐ)为(wèi)傲(ào)的(de) “意(yì)识(shi)” 疆(jiāng)域又(yòu)该(gāi)如(rú)何(hé)重(zhòng)新(xīn)勘(kān)定(dìng)?

答案或许藏在下个十年的实验室里,也可能早已写在艾西莫夫的机器人定律与《仿生人会梦见电子羊吗》的雨夜独白中。唯一确定的是,这场机械觉醒的终章,注定由人类文明与机器智能共同(tóng)书(shū)写(xiě)。

参(cān)考(kǎo)资料:

https://www.ccidgroup.com/info/1207/41123.htm

https://www.hanspub.org/journal/paperinformation?paperid=86460

https://www.figure.ai/news/helix

https://en.wikipedia.org/wiki/Atlas_(robot)

https://builtin.com/robotics/humanoid-robots

https://en.wikipedia.org/wiki/Humanoid_robot作(zuò)者(zhě):杨(yáng)雨(yǔ)鑫(xīn)

策(cè)划(huà):刘颖 张超 李培元 杨柳

审核:付昌义 南京工业大学副教授

江苏省科普作家协会科幻专委会主任委员

  • 上一篇
  • 新闻中心-
  • 下一篇

联系我们

请致电咨询

400 882 6599 400 686 5686