#
暗黑厨房里的机械共舞,人形机器人如何从科幻走进现实?
发布时间:2025-03-03 08:55:14

image.png

Figure机(jī)器(qì)人(rén)(图(tú)源(yuán):Figure)

在(zài)科(kē)幻(huàn)电(diàn)影(yǐng)的(de)预(yù)言(yán)中(zhōng),人(rén)类(lèi)与(yǔ)机(jī)器(qì)人(rén)的(de)共(gòng)生(shēng)总(zǒng)是(shì)始(shǐ)于(yú)一(yī)场(chǎng)静(jìng)默(mò)的(de)革(gé)命(mìng)——那(nà)些(xiē)曾(céng)经(jīng)笨(bèn)拙(zhuō)的(de)机(jī)械(xiè)臂(bì)开(kāi)始(shǐ)像(xiàng)人(rén)类(lèi)一(yī)样(yàng)思(sī)考(kǎo),冰(bīng)冷(lěng)的(de)金(jīn)属(shǔ)关节(jié)学(xué)会(huì)与(yǔ)生(shēng)活场景共舞。而2025年2月,这一幕似乎悄然在现实中上演。

美国初创公司Figure推出的新一代人形机器人,搭载了名为Helix的视觉-语言-动作(VLA)模型,极大增强了机器人的感知、控制、理解能力,让两台机器人无需预演便能(néng)默(mò)契(qì)传(chuán)递(dì)物(wù)品(pǐn),以(yǐ)近(jìn)乎(hu)科(kē)幻(huàn)的(de)智(zhì)能(néng)协(xié)作(zuò)能(néng)力(lì),将(jiāng)家(jiā)庭(tíng)场(chǎng)景(jǐng)中(zhōng)的(de)机(jī)械(xiè)管(guǎn)家(jiā)从(cóng)幻(huàn)想(xiǎng)拉(lā)入(rù)现实。

人形机器人:科技的集大成者

image.png

电影《大都会(Metropolis)》剧照

机器人(Robot)的概念,最早出现在捷克著名作家卡雷尔·恰佩克(Karel Čapek)于1920年创作的戏剧《罗素姆万能机器人》中。1927年电影《大都会》中的人造人玛丽亚,便以机械之躯承载人性,成为赛博朋克美学的早期雏形。

人形机器人(Humanoid Robot)是(shì)一种利用人工智能和机器人技术制造的具有类似人类外观和行为的机器人,融合了机械工程、电子技术、计算机科学、人工智能等多学科领域的前沿成果。

image.png

NASA 的 Valkyrie (R5) 机器人

图源:NASA

人形机器人的核心技术由四部分组成:

感知系统:指人形机器人需要具备感知环境的能力,通过传感器等设备来获取外部信息,如视觉感知、听觉感知、触觉感知等。

智能决策:指通过机器学习、深度学习、神经网络等人工智能技术,使机器人能够根据情景和任务要求自主决策和判断。

人机交互:指人形机器人能够更好地与人类进行交流和互动的功能,如语言识别、情感识别等。

运动控制:指通过使用各种传感器和算法来对机器人进行姿势控制、步态规划和(hé)平(píng)衡(héng)控(kòng)制(zhì)。

人(rén)形(xíng)机(jī)器(qì)人(rén)的(de)发(fā)展(zhǎn)史(shǐ),是(shì)一(yī)部(bù)人(rén)类(lèi)试(shì)图(tú)用(yòng)机(jī)械(xiè)复(fù)刻(kè)自(zì)身(shēn)的(de)史(shǐ)诗(shī)。从(cóng)蒸(zhēng)汽(qì)时(shí)代(dài)的(de)齿(chǐ)轮(lún)幻(huàn)想(xiǎng),到(dào)AI时(shí)代(dài)的(de)神(shén)经网络革命,每个技术节点的突破都暗合着科幻作品的预言与启示。

01

早期发展阶段(1970s-2000):

早期的人形机器人模型外表简略,仅仅具有初级的人类躯干与肢体形状,能实行的功能也存在很大局限性,只能实现简单的行走和手部运动,尚未具备交互能力且智能(néng)化(huà)水(shuǐ)平(píng)较(jiào)低(dī)。

image.png

WABOT-1机(jī)器(qì)人(rén)(图(tú)源(yuán):早(zǎo)稻(dào)田(tián)大(dà)学(xué))

例(lì)如(rú)1973年(nián),日(rì)本(běn)早(zǎo)稻(dào)田(tián)大(dà)学(xué)研(yán)发(fā)出(chū)了(le)世(shì)界(jiè)上(shàng)第(dì)一(yī)款(kuǎn)人(rén)形(xíng)机(jī)器(qì)人(rén)WABOT-1,它(tā)只(zhǐ)能(néng)够(gòu)执(zhí)行(xíng)搬(bān)运(yùn)物(wù)体(tǐ)等(děng)任(rèn)务(wu),智(zhì)力(lì)水(shuǐ)平(píng)相(xiāng)当(dāng)于(yú)一(yī)岁(suì)半(bàn)的(de)婴(yīng)儿(ér);同(tóng)时(shí)期(qī)日(rì)本(běn)本(běn)田(tián)公(gōng)司(sī)研(yán)发(fā)的(de)自(zì)主行(xíng)走(zǒu)机(jī)器(qì)人(rén)P2和(hé)ASIMO也(yě)仅(jǐn)仅(jǐn)在(zài)行(xíng)走(zǒu)和(hé)平(píng)衡(héng)方(fāng)面(miàn)进(jìn)行(xíng)不(bù)断(duàn)优(yōu)化(huà)。

02

高(gāo)度(dù)集成(chéng)发(fā)展(zhǎn)阶(jiē)段(duàn)(2001-2011):

这(zhè)一(yī)阶(jiē)段(duàn)是(shì)人(rén)形(xíng)机(jī)器(qì)人(rén)初(chū)级(jí)感(gǎn)知(zhī)功(gōng)能(néng)的(de)起(qǐ)步(bù)阶(jiē)段(duàn)。这(zhè)一(yī)时期的人形机器人因技术的突破可以实现与外界环境有限的互动,并且运动自由度提升。虽然应用场景较为简单(dān),主要(yào)用(yòng)于(yú)展(zhǎn)览和娱乐,但在运(yùn)动(dòng)控制和人机交互方面确实有很大进步。

image.png

本田机器人发展历史与第三代ASIMO(图源:本田Honda)

例如2003年索尼QRIO机器人配备了语音识别功能和人脸识别功能,能识别10种面部表情;2011年,日本本田推出的第三代ASIMO,其利用传感器避开障碍物等自动判断并行动的能力,还能用五根手指做手语,或将水壶里的水倒入纸杯;ASIMO不仅能上下楼梯、端茶倒水,还曾在2014年指挥底特律交响乐团。

03

高动态运动与交互能力提升阶段

(2012-2020):

该阶段的研发重点放在强化人形机器人的运动能力或交互能力上。强化学习技术让人形机器人在(zài)与(yǔ)环(huán)境(jìng)的(de)交(jiāo)互(hù)中(zhōng)不(bù)断(duàn)优(yōu)化(huà)动(dòng)作(zuò)和(hé)行(xíng)为(wèi),情(qíng)感(gǎn)识(shi)别(bié)和(hé)语(yǔ)言(yán)交(jiāo)互(hù)技(jì)术(shù)也(yě)得(de)到(dào)显(xiǎn)著(zhe)提(tí)升(shēng)。

image.png

POPPY机(jī)器(qì)人(rén)发(fā)展(zhǎn)历(lì)史(shǐ)(图(tú)源(yuán):Inria)

例(lì)如(rú),2013年(nián)美(měi)国(guó)波(bō)士(shì)顿(dùn)动(dòng)力(lì)公(gōng)司(sī)研(yán)发(fā)的(de)双(shuāng)足人形机器人Atlas具有超高的运动(dòng)能(néng)力(lì),可(kě)以(yǐ)熟(shú)练(liàn)地(de)完(wán)成(chéng)垂(chuí)直(zhí)起(qǐ)跳(tiào)、倒(dào)立(lì)、跨(kuà)越(yuè)障(zhàng)碍(ài)、后空翻,甚至和Spot机器人一起舞蹈,具有手脚都参与的跑酷功能。

2016 年法国 Inria Flower 实验室开发的第一款开源人形机器人 POPPY 上市,它在教育、科研、文化艺术等多个领域都展现出出色的适应能力。在教育领域,POPPY 可以作为教学工具,帮助学生更直观地理解机器人原理和编程知识;在文化艺术创作中,艺术家们借助 POPPY 的独特表现力,创作出许多新颖的艺术作品。

04

高度智能化发展阶段(2020至今):

借助现代人工智能、计算机视觉系统等先进技术,人形机器人迈向智能化进阶之路。如今的人形机器人的感知与认知能力大大增强,大多具有高度仿生的躯干构型和拟人的运动控制,在重量、灵活性等方面都有显著进步,实用性大大增强。

image.png

Ameca机器人发展历史(图源:Engineered Arts)

例如,英国 Engineered Arts 为 Ameca 接入 GPT-3/4 后,它如获新生。Ameca 配备了高级传感器,具备面部和多种语音识别功能,可以自然地与人类互动,不仅能敏锐检测人类情绪,还能通过丰富的表情和手势传达信息。

在一些高端科技体验场所,Ameca 作为接待员,以亲切的交流和互动为访客提供服务,给人留下深刻印象。特斯拉公司的Optimus Gen2人形机器人的移动功能、灵巧性、平衡性和实时处理方面的功能也因为AI大模型的(de)介(jiè)入(rù)得(de)到(dào)了(le)显(xiǎn)著(zhe)提(tí)升(shēng)。

image.png

Unitree H1机器人(图源:宇树科技)

虽然国内人形机器人的发展起步较晚,上个世纪90年代才开始研究。但近年(nián)来(lái),国(guó)内(nèi)人(rén)形(xíng)机(jī)器(qì)人(rén)研(yán)发(fā)取(qǔ)得(de)了(le)显(xiǎn)著(zhe)进(jìn)展(zhǎn),众(zhòng)多(duō)企(qǐ)业(yè)和(hé)科(kē)研(yán)机(jī)构(gòu)积(jī)极(jí)投(tóu)身(shēn)其(qí)中(zhōng),在(zài)技(jì)术(shù)创(chuàng)新(xīn)和(hé)产(chǎn)品(pǐn)应(yīng)用(yòng)方(fāng)面(miàn)不(bù)断(duàn)探(tàn)索(suǒ)。宇(yǔ)树(shù)科(kē)技(jì)便(biàn)是(shì)国(guó)内(nèi)人(rén)形(xíng)机(jī)器(qì)人(rén)领域的佼佼者。

在春晚舞台上,宇树科技的16台人形机器人Unitree H1与舞蹈演员共同演绎《秧BOT》,以“赛博秧歌”惊艳全场。这些机器人拥有19个关节,手臂额外增加3个自由度,实现了手绢旋转、抛掷回收等高难度动作。

这支名为《秧BOT》的舞蹈背后(hòu),是(shì)19个(gè)关节(jié)的(de)精(jīng)密(mì)协(xié)同(tóng),是(shì)每(měi)帧(zhèng)动(dòng)作(zuò)的(de)AI映射,更是双足机器人在复杂动态平衡领域的突破性进展,充分展现了宇树科技在人形机器人研发方面的深厚实力。

人形机器人的发展前景令人充满期待。随着人工智能、材料科学、传感器技术等领域的持续创新突破,人形机器人将变得更加智能、灵活和强大。

在智能水平方面,它们将具备更强大的学习能力和推理能力,能够理解和处理更加复杂的任务和情境。通过与物联网、大数据等技术的深度融合,人形机器人可以实时获取和分析海量数据,实现更精准的决策和更高效的行动。

在运动能力上,新型材料和机械设计将使人形机器人的动作更加流畅、自然,能够适应各种复杂的地形和环境,完成更多高难度的动作。

image.png

Figure机器人(图源:Figure)

随着人形机器人技术的不断成熟,其应用场(chǎng)景也日益广泛(fàn)。在工业领(lǐng)域,它们可以承担一些危险、重复或高精度的工作;在医疗领域,人形机器人可协助医生进行手术,凭借其高精度的操作能力,降低手术风险;在家庭服务方面,人形机器人可以担当家务助手,扫地、擦窗、洗碗等家务都能轻松完成;在教育领域,人形机器人作为创新的教学工具,能够以生动有趣的方式传授知识。

由此可见,人形机器人未来潜力巨大,不过仍面临多种挑战。

1.高算力:人形机器人的姿态、速度和力度等方面,都需要高算力,现阶段的计算能力面临巨大挑战。

2.弱技术:现在基础技术能力仍然很弱,现有的软件算法等不足以支撑人形机器人的大规模应用,仍需技术大幅创新。

3.高成本:研发成本高昂,高额亏损、研发投入高,是人形机器人行业的常态。

4.不安全:数据安全能力和体系均存在不足,面临安全隐私(sī)等(děng)问(wèn)题(tí)。

image.png

游(yóu)戏(xì)《底(dǐ)特(tè)律(lǜ):化(huà)身(shēn)为(wèi)人(rén)(Detroit: Become Human)》主角(jiǎo)康(kāng)纳(nà)

从(cóng)WABOT-1的(de)简(jiǎn)单(dān)动(dòng)作(zuò)到(dào)Ameca的(de)自(zì)由(yóu)互(hù)动(dòng),人(rén)形(xíng)机(jī)器(qì)人(rén)正(zhèng)以(yǐ)“科(kē)技(jì)奇(qí)迹(jī)”之(zhī)姿(zī)步(bù)入(rù)日(rì)常(cháng)生(shēng)活(huó)。它(tā)们(men)既(jì)是(shì)《2001太(tài)空(kōng)漫(màn)游(yóu)》中(zhōng)HAL 9000的(de)进(jìn)化(huà)版(bǎn),也(yě)是(shì)《底(dǐ)特(tè)律:变人》中康纳的原型。但技术的终极目标并非取代人类,而是如《星际穿越》中的TARS一般,成为探索未知的协作伙伴。

未来,当人形机器人真正融入社会时,人类或将重新定义“人性”——不是以生物学特征为界限,而是以创造力、同理心与伦理选择为标尺。

或许正如所有经典科幻的警示寓言,人形机器人终将成为照见人类本质的镜子:当它们学会在递出苹果时调整指尖力度以防磕碰,我们是否能以同等温柔对待同类?当它们突破图灵测试的瞬间,人类引以为傲的 “意识” 疆域又该如何重新勘定?

答(dá)案(àn)或(huò)许(xǔ)藏(cáng)在(zài)下(xià)个(gè)十(shí)年(nián)的(de)实(shí)验(yàn)室(shì)里(lǐ),也(yě)可(kě)能(néng)早(zǎo)已(yǐ)写(xiě)在(zài)艾(ài)西(xi)莫(mò)夫(fu)的(de)机(jī)器(qì)人(rén)定(dìng)律与《仿生人会梦见电子羊吗》的雨夜独白中。唯一确定的是(shì),这(zhè)场(chǎng)机(jī)械(xiè)觉(jué)醒(xǐng)的(de)终(zhōng)章(zhāng),注(zhù)定(dìng)由(yóu)人(rén)类(lèi)文明(míng)与(yǔ)机(jī)器(qì)智(zhì)能(néng)共(gòng)同(tóng)书(shū)写(xiě)。

参(cān)考(kǎo)资(zī)料(liào):

https://www.ccidgroup.com/info/1207/41123.htm

https://www.hanspub.org/journal/paperinformation?paperid=86460

https://www.figure.ai/news/helix

https://en.wikipedia.org/wiki/Atlas_(robot)

https://builtin.com/robotics/humanoid-robots

https://en.wikipedia.org/wiki/Humanoid_robot作(zuò)者(zhě):杨(yáng)雨(yǔ)鑫(xīn)

策(cè)划(huà):刘(liú)颖(yǐng) 张(zhāng)超(chāo) 李(li)培(péi)元(yuán) 杨(yáng)柳(liǔ)

审(shěn)核(hé):付(fù)昌(chāng)义(yì) 南(nán)京(jīng)工(gōng)业(yè)大(dà)学(xué)副(fù)教(jiào)授(shòu)

江(jiāng)苏(sū)省(shěng)科(kē)普(pǔ)作(zuò)家协会科幻专委会主任委员

  • 上一篇
  • 新闻中心-
  • 下一篇

联系我们

请致电咨询

400 882 6599 400 686 5686