当人机互动不再依赖电池、摄像头、雷达,仅靠手势控制,未来的智能生活将迎来怎样的变革?

近日,上海交通大学机械与动力工程学院沈道智副教授团队在 Science Advances 发表突破性成果,他们开发了一款基于湿气发电,隔空 8 厘米就能精准识别手势的人机交互界面,不用电池、不用触摸,靠手在空气中划几下就能控制设备,输密码、玩 VR、遥控小车。

“我们想要挖掘湿气发电在功能方面的潜力。用湿气发电做隔空交互、非接触式交互技术,其实就是一次从供电元件到功能元件的转折,也是一次非常有意义的尝试。”沈道智告诉 DeepTech。

沈道智的研究方向包括智能识别、能量收集、微纳器件,以及原子级制造。他本科毕业于华中科技大学材料学专业,博士毕业于清华大学机械工程系,曾在滑铁卢大学进行过为期 3 年的博士后研究。覆盖了材料、机械、化学、电子等多个领域。

关注到湿气发电这一领域源于沈道智在滑铁卢大学期间的一次偶然转折,过程极具戏剧性。当时,面对一个未能达到预期效果的实验样品,他进行了一次看似随意的尝试——顺手对着器件吹了一口气。

正是这一极其自然的动作,带来了意想不到的反馈:仪器清晰地监测到了电压信号。这次偶然的发现,让他正式切入了这个当时还显得有些“小众且有趣”的科研赛道。不过,即便团队后续做了大量的探索与研究,时至今日,学术界对于湿气发电的底层机理解释仍然存在一定的争论。

在采访的过程中,沈道智始终强调“要做一些不一样的东西”。从最初的空气湿气发电,到跨越介质实现水下湿气发电,再到如今将其转化为非接触式手势交互的物理接口。他正不断向外拓展着自己的研究边界。

8 厘米隔空读懂每一个手势

2015 年,从湿气中发电的能力首次通过实验证实,此后引起了广泛关注。“湿气发电的核心优势主要体现在两点。首先是极强的普适性。基于全球水循环,无论是湿润的雨林还是极度干燥的沙漠,空气中始终蕴藏着水分子,这意味着它在几乎任何环境下都能随时获取能量;其次是绿色环保。水是自然界最天然的物质,发电过程既不产生污染,也不消耗稀有资源,高度契合可持续发展的理念。”沈道智表示。

2016 年左右,沈道智及团队观察到了湿气发电的相关现象。直到 2018 年,他们在 Advanced Materials 发文,证明湿气发电可直接给传感器供电。

2022 年回国独立建组后,沈道智一直想“做一些不一样的东西”。2024 年,他率先将湿气发电拓展到了水下,他们利用防水透气膜和离子化水凝胶制备了可在水下工作的湿气发电装置,并在水下无线信号传输方面进行了可行性验证。

突破了极端环境的限制后,沈道智团队并未停止对湿气发电应用边界的探索。他们将目光投向了湿气发电和人机交互的结合领域。

传统的人机交互技术面临两大难题。一是接触式设备,比如触摸屏或力反馈手套,虽然操作直观,但长期使用会带来卫生隐患和机械磨损,尤其在公共场合或医疗环境中风险更高。二是非接触式技术,如基于电容、光学或热电的传感器,虽然避免了物理接触,但往往需要持续供电,电池笨重、需要频繁更换,还存在安全隐患,如锂电池泄漏或爆炸。

在这项研究中,为了实现能够从环境湿气中发电的电子器件,研究团队巧妙地设计了一种水凝胶薄膜,只有约 80 微米厚,组分包括聚乙醇酸(PGA)、纤维素纳米纤维(CNF)、盐和有机酸,内部布满了微孔,能够在环境空气中自发吸收水分子。

当水凝胶薄膜吸收空气中的水分子后,PGA 和有机酸上的大量羧基(-COOH)会发生解离,释放出自由移动的氢离子(H+),而较大阴离子被固定在聚合物网络中,形成离子浓度梯度,从而产生电势及相关的电流。


图 | 风作用下反向电离机制示意图(来源:上述论文)

研究人员观察到,这种依靠水分子吸收来发电的过程,虽然输出稳定,但对周围极微弱的气流扰动异常敏感。正是顺着这一线索,研究团队发现了全新的物理机制——湍流调控的湿电效应。

当人的手指在装置上方几厘米处移动时,手指会搅动周围空气,形成局部湍流。这种湍流会带来两个同时发生的变化:一是导致水凝胶表面局部湿度短暂下降,二是轻微增加局部空气压力。这两种效应共同作用于装置内部的离子迁移,最终使输出电压产生特征性的波动。不同手势/数字,波形完全不一样。

比如写数字“0”时,会产生双峰双谷的波形;写“1”时则是单峰单谷。令人惊喜的是,这种信号在手指距离装置 2-8 厘米范围内都非常稳定,即使环境湿度在 30%-70% 之间波动,也不会丢失关键特征。

除了阿拉伯数字,还能解码字母和单词。比如手写“Sad”“Happy”和“ILoveSJTU”会产生不同的输出波形,忠实地反映了每个手写单词的特征。

对于环境中不同因素的影响,沈道智认为在实际场景中干扰肯定是存在的,如何排除干扰才是重中之重。

在他看来,外界气流影响产生的电压信号,可能是无序的、随机的,而一个有意识的手势输出所产生的信号,是有一定规律的。“通过一些算法,我们可以对这种有规律的信号进行解构和解析,从而排除那些不稳定的、随机性的、无规律的信号干扰。”


图 | 非接触式识别(来源:上述论文)

团队采用一维卷积神经网络(1D-CNN)与支持向量机(SVM)两种模型,对非接触手写信号进行了解码。即使每类手势只用约 20 个样本训练,1D-CNN 模型对于 0-9 阿拉伯数字的识别准确率也能达到 91.5%;换成 SVM 模型,识别准确率能达到 99%。

三大场景验证产业化潜力

研究团队将这项技术在多个场景中进行了测试。

首先是加密信息传输。传统的加密通信高度依赖实体按键来输入密钥或密码,这不仅需要持续的硬件供电,还极易面临物理磨损暴露、接触式窃听等安全隐患。该技术提供了一种绝对隐秘的解法,用户可以在没有任何物理连接和外部电源的情况下,仅通过隔空手势就能输入加密密钥。

在概念验证系统中,用户通过无接触的手写手势输入了 RSA 加密算法的公钥和私钥。这种完全脱离实体的交互方式,在物理层面上彻底隐藏了密钥的输入过程,提升了信息传输的安全性。

其次是虚拟现实与游戏控制。在飞行避障游戏演示中,系统将隔空手写的数字精准映射为“左移”或“右移”指令。用户仅凭一连串隔空手势,即可准确操控虚拟飞机,凸显了系统所实现的高识别准确率和安全信息传输能力。

最后是实物远程控制。研究人员将传感器与微控制器和智能小车连接。当用户在空气中写“1”时,小车直行;写“11”时,小车右转。在完整演示中,小车通过一系列非接触指令,顺利完成包含两次转弯的赛道任务。


(来源:上述论文)

从 2016 年观察到湿气发电的现象,到如今将其转化为非接触式手势交互的物理接口,沈道智已在这一领域深耕十年,见证了技术的变迁。

“一方面是材料的迭代。过去 10 年来,纳米技术和材料科学的发展为湿气发电带来了很多新的可能性。从最开始用的一些传统的材料,到后来聚合物材料的发展,为湿气发电注入了新的活力。比如在提高功率输出和实现长期稳定性方面,新材料都展现出了一些突出的优势。”

沈道智补充道,“另一方面是结构的迭代。以前可能主要是三明治结构、平面结构,现在我们会设计更复杂的结构,比如与其他能量形式耦合的复合发电结构,特殊结构让器件能够在极端环境下工作,比如水下环境。”

但客观而言,目前湿气发电的局限性也比较明显,主要集中在两个方面:

第一个是功率输出。随着技术的发展和需求的提升,湿气发电的功率确实在不断进步,但总体来说,输出功率仍然偏低,效率也有待提高。

第二个是长期稳定性。从文献报道来看,早期的湿气发电器件可能只能持续工作几秒钟,后来发展到几个小时,再到现在已经有研究能做到几个月。但是,如果要实现几年甚至更长时间持续稳定的功率输出,这仍然是一个需要解决的瓶颈问题。

未来,沈道智计划将器件从理想的实验室温床推向温湿度多变、气流复杂的真实物理环境。而在更长远的愿景中,他计划将这项零功耗、非接触的底层技术,与具身智能、人机交互等结合,去探寻更多不一样的可能性。

1.Shen D, Luo H, Zhao G, Han Z, Yang Z, Le X, Su Y, Ma R, Zhu L. Moisture-driven, self-powered noncontact sensing interfaces via turbulence-tailored hygroelectronic effect. Sci Adv. 2026 Apr 17;12(16):eaee7050. doi: 10.1126/sciadv.aee7050.

排版:胡莉花

注:封面/首图由 AI 辅助生成