准确率60%:AI+雷达传感器组合,3米内可转录手机通话内容

IT之家 8 月 13 日消息,美国宾夕法尼亚州立大学于 8 月 8 日发布博文,其计算机科学团队发明一种“无线窃听”(wireless-tapping)新技术,结合 AI 和毫米波雷达传感器,可以在三米范围内转录通话内容,准确率约为 60%。

IT之家援引博文介绍,该技术利用毫米波雷达传感器(millimeter-wave radar)远程探测手机振动,可在距离手机约 3 米处,收集由耳机播放语音时引发的设备表面微小振动,随后将捕获的振动信号输入到开源语音识别模型“Whisper”中。

针对雷达信号质量较低、噪音较大的特点,研究者通过“低秩适应”(Low-Rank Adaptation,一种只微调机器学习模型部分参数的方法,用于快速适应新数据源或任务)方法,仅微调模型 1% 的参数,让其能高效识别雷达采集的数据。

第一作者 Suryoday Basak,图源美国宾夕法尼亚州立大学

最终,系统能够将手机通话内容转录为文本,准确率可达 60%,词汇量范围达一万。相比团队 2022 年仅能识别少量预设词汇的成果,本次技术明显提升了实际应用的可行性。研究表明,即便识别结果存在错误,通过补充语境等人工校正,依然能推断出通话关键词和部分内容。

值得注意的是,该项技术目前仅限于学术研究,尚未商品化。研究者强调,其目的是警示公众未来远程窃听手机通话的技术可能性,呼吁用户在进行敏感通话时提高警惕。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平