Moonix总裁郭于晨:给智能眼镜“作减法”,佩戴舒适才是硬道理丨高端对话
封面新闻记者 欧阳宏宇
智能眼镜最常见的命运是什么?开箱惊艳三天,然后被收进抽屉。
太重、太厚、太像电子产品……这些原因让用户每一次照镜子都会被提醒:“这不是为脸设计的”。而另一边,整个赛道正陷入疯狂的竞赛:翻译、提词、导航、AR显示、智能交互……厂商们把能想到的功能一股脑塞进小小的镜框与镜腿,默认“功能越多,产品越强”。
“问题不在AI能力,而在于大多数人忘了眼镜最基础的事。”5月25日,智能眼镜品牌Moonix总裁郭于晨在接受采访时表示,它首先得是一副可以被长期佩戴的眼镜。
智能眼镜行业有一条朴素经验,让人愿意天天戴,重量必须压下来。而传统无框(半框)眼镜通常在十几到二十几克;可一旦塞满扬声器、摄像头、电池、主板,整机轻松跳过30克、直奔40克以上,就难逃“戴一会儿就得摘”的命运。
“佩戴性是前面的1,功能是后面的0。没有1,乘再多的功能还是0。”在郭于晨看来,智能眼镜需要把目标钉在“先把智能眼镜做回眼镜”。他以Moonix为例谈到,4mm超细镜腿,整机约14.9克,没有光波导、没有AR显示,核心回到音频加第一视角记录。在人人做加法的时代,这是典型的“减法革命”。
谈及为什么只保留这些“基础功能”,郭于晨认为,眼镜天然最接近人类的感知系统。“它能跟随视线变化,捕捉第一视角的信息;它本身就是成熟的日常配饰,侵入感远低于挂件类产品。”
据介绍,所谓无感记录,就是每5分钟主动记录周遭环境与内容,无需唤醒,不打扰用户。“好的科技一定是隐身的。当工具替我们完成记录,人才能真正沉浸于当下。”郭于晨说。
对于主动放弃的提词、翻译、导航等低频功能,郭于晨表示,提词器一年用一次,翻译功能解决不了双向交流,这些大多是“用技术反推产品的伪需求”。
在业界中,AI眼镜的终极形态是替代手机已成为共识;然而一旦放弃了低频功能,是否会让智能眼镜难以覆盖如今几乎可以完成任何需求的手机?在郭于晨看来,此前的所谓AI眼镜,本质上是把手机的应用嫁接到眼镜上,试图取代手机。“这是一种‘迁移思维’,而真正的AI原生硬件,应当基于AI的技术特点,让输入不再受既定规则约束,允许用户通过自然语言完成交互。”
“不拼功能堆砌,拼佩戴舒适;不拼技术优越感,拼真实场景的高频需求,这可能才是AI眼镜的大众化出路。”郭于晨说。
附:采访全文
Q: 现在头部的AI眼镜厂商基本上都是14、15年左右成立的,在25年这个时间节点入局AI眼镜市场,不觉得晚吗?
郭于晨: 我反而觉得,一切才刚刚开始。
到目前为止,AI眼镜的出货量与手机仍不可同日而语。所以说AI眼镜还远没有达到大众消费阶段。
另外,我认为这一轮AI硬件真正被重新定义,都源自于ChatGPT的横空出世。尤其是最近这一两年多模态的兴起,才让AI硬件有了更强的生命力,这是一条新的起跑线。
过往的所谓AI眼镜的思路,更多还是基于旧有的智能硬件思路,添加一些AI对话、游戏、提词、导航之类的功能。本质上是把手机的一些应用嫁接到了眼镜上,试图来取代手机,成为下一代的通用计算平台。这其实是一种迁移思维,把手机已有的功能迁移到眼镜上面。
但是现在的AI能力提供了一些新的思路,我们怎样才能做一款AI原生的硬件产品,所以从这个角度来说,大家其实都站在新的起跑线上。
Q: 我的理解是您觉得AI原生的定位是Moonix跟其他AI眼镜厂商的一个核心的不同点?AI原生的定位具体体现在哪些方面?
郭于晨:对,是的。在我看来,所谓的AI原生,最重要的特点是其输入和输出的泛化性。
上个时代的硬件都是固定的输入和输出,即在限定规则的情况下,去完成限定的任务。比如说Walkman这个产品,就是限定了播放、暂停、回退这几个基础功能,用户只能在既定规则下完成操作。14年、15年的最早的一批智能眼镜,也是这个思路下的产物。
相比之下,AI原生硬件的区别就在于它完全基于 AI 的技术特点,让输入不再收到既定规则的约束,比如它允许用户通过自然语言来完成设备的控制。这种变化,让硬件的使用边界被重新打开。
Q: 您觉得AI眼镜的终极形态是替代手机的一个超级终端吗?
郭于晨: 我不敢这么说。我觉得很多东西都是自然演化出来的,如果我们预设了“它一定要代替手机”,反而会变成一种技术导向的路径依赖,让思考的角度脱离用户需求。这种思路已经被反复验证是一种错误。
我们不倾向做这样的预设,我们更希望先回到用户本身去构建产品。
Q: 为什么是眼镜?而不是一个挂在身上的摄像头?
郭于晨: 因为眼镜天然是最接近人类感知系统的设备。
首先,它能够跟随人的视线变化。人转头、观察、停留,这些信息只有第一视角才能天然捕捉。
其次,眼镜本身已经是成熟的日常配饰。相比挂件类产品,它的侵入感更低,也更容易融入真实生活场景。我很难想象女性用户都戴着同一款挂坠去参加一个活动,看上去很奇怪,像是某种电子镣铐。
另外,从记录角度来说,眼镜也天然具备开放式传感器优势:视野更完整、收音更自然,不容易受到遮挡或衣物摩擦影响。所以我们认为,记录其实是最符合眼镜形态的能力之一。
Q:这个优势怎么理解?
郭于晨:AI眼镜这个形态作为配饰入驻主流线下渠道,最难的点是在于它没有办法跟传统的眼镜做正面竞争。因为所有眼镜用户到线下场景去购买眼镜的第一动力是它好看以及舒适度。在这种情况下,一个消费者走进线下零售场景时,看到那种粗壮的眼镜,本能上是排斥的,后面也很难接受听你讲眼镜的功能。
我们的眼镜最大的优点就在于:它跟普通眼镜几乎没有任何区别。我们将眼镜的重量做到了14.9克,很多传统眼镜都不一定能做到14.9克,但是我们做到了。所以我们的产品可以直接在线下渠道和那些传统眼镜摆在一起,这是一个非常大的优势。
Q: 为什么您对眼镜的重量如此执着,为了做到这个重量,放弃了哪些东西?
郭于晨: 因为我们一直认为,眼镜首先是一个“长期佩戴”的产品。只有当用户愿意每天戴着它,它后面的所有能力才有意义。
所以我们会优先考虑那些真正高频、长期存在的需求,而不是一些偶发性的场景功能。比如我么放弃了诸如提词、翻译、导航这些低频功能需求,我们更关注记录能力。因为记录是一个天然高频、且最符合眼镜形态的需求。
我们也希望在用户心智层面建立两个认知:第一个就是我们的眼镜极致轻薄,另外一个就是我们的眼镜具备强大的记录和感知的能力。
Q: Moonix在刻意弱化科技表达,这是一种错位竞争的策略吗?
郭于晨:我们只是希望给这个行业提供一个不同的答案。
我们时刻提醒自己不要陷入所谓的技术优越感之中,因为科技产品最终是要服务于人的,所以它的消费体验才是最重要的事情。我不强调科技性,本质上也是因为我觉得目前大部分智能眼镜的功能点,都不太经得起推敲。
Q:您觉得哪些功能经不起推敲?
郭于晨: 比如说提词器这个功能。首先它太低频了,对于一个普通用户来说,真的会为了一个一年就用一次的功能,去忍受这个重量,天天带着智能眼镜吗?另外,提词器功能对于一场演讲来说,到底是加分项还是减分项呢?
再比如说翻译功能,听起来好像是一个很实用的功能。但其实我们用到翻译功能的场景大多数时候是与人交流。但眼镜搭载的翻译功能只是个单向翻译,只能解决我能听懂老外说话,解决不了老外听不懂我说话的问题。
相对匹配的场景可能只有我在国外听一些公开演讲。但这种情况的频率又有多高呢?
根本的问题还是大家在用技术或者一些主观预判来反推产品的功能,这种思路大概会得到一个伪需求。
Q: 咱们的产品主打一个无感记录和AI隐身,为什么您觉得AI需要隐身?
郭于晨: 好的科技其实一定是不打扰用户的,这个是最重要的事情。
而无感记录这件事情,还有一层更深层的含义。当我们用工具去尝试拍出一些好照片时,我们往往会失去体验那个场景的沉浸感。因此,我希望能把记录这件事情让渡给工具,而让人能够完完全全地去体验当下。
Q: 无感记录的具体体验其实就是不需要唤醒,我可以这么理解吗?
郭于晨: 对,我们有一套机制,每5分钟会主动记录身边周遭的内容和环境,这个是我们所谓的无感记录。
Q: 如果不需要被唤醒,又是一个定期主动记录的机制,用户的隐私和周围人的隐私如何保护呢?
郭于晨: 首先,我们定义的低频主动记录,只能够帮用户记录一些大面的信息,比如说当下的环境、状态。如果需要详细的记录,还是需要用户手动去按键开启持续记录的。
其二,我们对用户的承诺,所有的这些用户数据都不会被用于训练。未来我们还会开源所有关于用户数据处理的部分,接受全行业的审视。同时,我们也不希望AI眼镜成为一个偷拍神器,我们想做一层隔离,所有被眼镜拍摄下来的原始数据,都是不能直接被戴眼镜的用户所读取的。用户能拿到的数据,一定是被AI安全鉴定和加工处理过的。
Q: 本身就戴眼镜的用户,会需要两副眼镜换着带吗?
郭于晨: 我们的眼镜其实是有镜腿快插结构的。最终的售卖逻辑是:一副普通眼镜,加一个智能镜腿。用户可以在不需要AI眼镜的场景直接换上普通镜腿。
Q: 公司后续的融资计划是怎样的?
郭于晨: 我们目前已经完成了第一轮千万级的融资,下一轮的融资目前刚刚开始。