这家做「眼睛」的具身智能公司,成立不到一年已经开始盈利了
视觉,
正是理解家庭空间最核心的切入口。
当具身智能行业还在围绕 “ 谁能率先做出人形机器人 ” 展开激烈竞争时,一家脱胎于追觅体系的创业公司灵智无界,选择先从 “ 眼睛 ” 做起。
成立不到一年,灵智无界已经实现盈亏平衡。这在仍处于商业化早期探索阶段、普遍依赖融资输血的具身智能赛道,并不常见。
在灵智无界位于深圳南山的办公室里, 36kr 看到,总裁毛松的工位,被产品团队、财务和法务紧密包围。
这隐含着这家新锐智能硬件公司的几大战略优先级。 “ 产品需要时时刻刻跟着市场需求去迭代,保持现金流的稳定健康,同时整个公司的运营都要在合规的框架下。 ” 公司总裁毛松说道。
灵智无界目前的核心产品,是多款面向家庭场景的 NAVO 智能 AI 摄像头。不过在毛松看来,摄像头只是公司当前阶段的产品形态,而非终点。
作为追觅体系孵化的独立业务板块,它真正承载的,是追觅系在具身智能领域的一条新路径:先通过视觉建立对于家庭空间的理解能力,逐步延伸至更复杂的家庭交互能力,以及实现动作执行的机器人产品形态。
这一独特的路径选择,来自毛松对消费级具身智能的底层判断: “ 消费级具身智能真正缺少的并不是身体,而是对家庭空间的理解能力。 ”
在加入灵智无界之前,毛松先后在 OPPO 、安克负责产品商业化,在消费电子行业已经有十多年的经验积累。偏产品链条后端的工作,让他更注重从第一性原则发掘业务的本质。在他看来,相比目前大多数具身智能企业更关注的工业和商业场景,家庭空间更加复杂,也有着更大的不确定性。因此,要做消费级具身智能产品,也必须从看懂家庭空间出发。
而视觉,正是理解家庭空间最核心的切入口。
机器人大战卷向大脑
过去两年,具身智能行业最受关注的是机器人本体。而随着运动控制能力逐步成熟,一个新的问题开始浮现:机器人可以学会走路、奔跑甚至跳舞,却依然很难真正理解场景。
这种行业焦点的迁移,在资本市场上也得到体现。从去年下半年开始,做机器人大脑的具身智能企业估值开始追平甚至反超硬件本体企业,包括星海图、智平方等一批具身大脑企业先后宣布跻身 “ 百亿俱乐部 ” 。这不仅仅是因为具身模型拥有更大的想象空间,更重要的是在本体能力逐渐趋同之后,行业开始意识到,大脑正在成为决定下一阶段竞争格局的关键变量。
但在做大脑的过程当中,越来越多企业又发现了另一个现实问题:没有高质量数据,具身模型对现实世界的理解也无从谈起。
尤其是在家庭场景,它成为了具身智能落地最难啃的那块骨头。
相比工厂、仓库等高度标准化场景,家庭空间本身就充满了不确定性。不同家庭结构、人物关系、行为习惯以及环境变化,都会让同一个动作产生完全不同的含义。
例如,同样是有人进入院子,在工厂场景中或许只需要判断是否属于授权人员;但在家庭场景中,系统还需要进一步理解:来的人是谁,是家人、快递员还是陌生人;出现的时间是否异常;是否需要触发告警提醒甚至后续响应。
“ 家庭其实是一个非常复杂的环境,它不像工厂那样有标准流程,也不像仓库那样有固定规则。很多时候,同一个动作在不同家庭里的含义完全不一样。 ” 毛松表示。
也正因如此,家庭场景智能的难点从来不只是识别,而是理解。这种理解能力无法依靠规则预设完成,只能通过大量真实家庭场景数据持续训练获得。
摄像头的价值,则恰恰在于它是目前最容易持续进入家庭场景、并稳定获取空间信息的终端。
FMI 数据显示, 2025 年全球智能家居摄像头市场规模为 97.15 亿美元,接下来到 2035 年将继续维持着 11.5% 的复合年增长率。相比仍处于早期阶段的家庭机器人,摄像头已经具备成熟的产品形态、广泛的家庭渗透率以及持续的数据获取能力。
从这个角度看,以摄像头为核心的家居智能硬件对于 NAVO 而言,不仅仅是一个产品市场,更意味着一个天然的高质量数据采集入口。这也构成了 NAVO 与传统家庭安防企业最大的不同,摄像头不是最终目的,而是通往家庭智能的开端。
通过这一入口持续积累家庭场景数据, NAVO 得以逐步建立对于家庭空间、家庭成员以及家庭事件的理解能力,并最终沉淀为家庭智能体。而当家庭智能体真正形成后,面向家庭场景的智能终端也有机会打开更广阔的想象空间。它不仅有机会重新定义现有家庭设备之间的协作方式,让摄像头、扫地机器人、门锁等原本割裂的 AIoT 设备成为统一智能体下的执行终端;并最终催生看护机器人等全新的具备更高执行能力的终端产品形态。
基于这样的终局判断,当大量具身智能企业仍在从机器人本体切入时, NAVO 选择先从 “ 眼睛 ” 开始。
用视觉撕开家庭具身智能入口
事实上,家庭摄像头已经发展二十多年,但行业长期停留在 “ 看见 ” 的阶段。从最早的录像监控,到后来的云存储、远程查看,再到上一代的 CV 公司实现的 AI 识别功能,本质上都仍停留在记录和提醒层面。
为了让摄像头向 “ 看懂 ” 进化, NAVO 没有选择简单叠加视觉识别模型,而是从底层感知能力开始重构产品体系。
首先是强化 “ 看清 ” 这一大前提。尤其是在夜间场景中,传统的红外夜视往往只能提供黑白画面,普通全彩夜视又容易出现噪点和拖影。这意味着,即便视觉系统准确识别了人、车或宠物,也很难进一步理解事件发生的上下文。
NAVO的解决方案是用F1.0超大光圈,搭配AISP芯片及视觉算法。从实测结果来看,搭载这套解决方案的NAVO X10室外系列产品,暗光捕捉能力提升至0.001lux,是行业主流约10倍的水平,即便是在微弱星光的环境下,也能保持全彩图像和细节捕捉能力。
0.001 LUX微光全彩夜视能力
技术实现后的下一步是优化产品体验。 NAVO 产品团队至今记得 N AVO X10 系列量产前的一次内部会议。当时,团队已经完成了核心能力开发,但 APP 打开监控画面的速度始终没有达到理想中的体验标准。面对即将到来的量产节点,毛松最终拍板: “ 那就先不出货,做到 5 秒出流、 95% 以上拉流成功率再说。 ”
NAVO X10系列
为了实现这一目标, NAVO 团队需要从零搭建起一套嵌入式能力,即把 “ 看清 ” 的算法能力,装进一个能够长期稳定联网、 画面流畅 且不死机的硬件终端里。团队为此 又 精细打磨了一个月时间,才最终实现了 98% 拉流成功率以及 5 秒出画体验。
递进到 “ 看懂 ” 的能力, NAVO 推出了事件级 AI 平台 AlgoMart 。与传统系统更多围绕单一目标识别不同, AlgoMart 开始尝试理解事件本身,核心在于,它不再孤立地分析某一个画面,而是将时间、行为模式以及场景上下文结合起来进行综合判断。传递到用户端,他们收到的不再是模糊的异常提醒通知,而是一个带有逻辑结论的事件摘要 , 从 “ 看到什么报什么 ” 跨越到真正 “ 理解发生了什么 ” 。
在此基础上, NAVO 还计划在今年三季度推出家庭安防大脑。家庭安防大脑将进一步承担家庭事件理解、用户习惯学习以及长期记忆等能力。也就是说,它不仅能够记住家庭生活中发生过什么,还会持续学习家庭成员的行为规律,由此逐步成长为家庭生活中的智能管家。
从黑光全彩解决看清问题,再到 AlgoMart 升级看懂能力,到家庭安防大脑进一步进化出持续认知和自主决策能力, NAVO 打造的家庭智能体将呈现出更具体的雏形。当家庭智能体开始真正理解家庭空间之后,它解决的也不再只是记录家庭场域发生的事件,而是进一步参与到家庭生活本身。
追觅宇宙诞生 AI 硬件新物种
事实上,视觉优先不仅仅是技术路线的选择,也是一种商业化路径的选择。
“ 终局大家都是往具身智能去做,但对于一家从 0 到 1 阶段的创业公司来说,首先要形成一个小的商业闭环。 ” 毛松进一步表示,在 NAVO 的战略规划中,看清、看懂和互动分别对应三个阶段。第一阶段通过摄像头产品实现商业化和自我造血;第二阶段通过家庭安防大脑完成家庭空间理解能力建设;第三阶段再通过看护机器人等产品形态实现交互和执行能力。
由此, NAVO 向具身智能的延展,更像是在摄像头看懂之后的一种能力上的自然跃迁。
当 AI 开始逐步具备对于家庭空间的理解能力后,下一步自然会进入交互和执行的阶段:当识别到快递送达后,需要完成取件与搬运;当识别到用户情绪异常后,则可能进一步产生陪伴与互动需求;当系统识别到老人跌倒风险后,需要进一步完成提醒、送药等动作。
而当交互和执行成为最终目标,承载这些动作的实体形态反而显得不那么重要了。 “ 在不同的场景下,机器人可以有不同的形态,核心不在于它应该是什么样子的,而是具备行动能力给用户在某个场景下创造价值。 ” 毛松说道。
值得一提的是,相比大量仍停留在概念验证阶段的具身智能创业公司, NAVO 在成立不到一年的时间内就实现了自我造血。
NAVO 的商业路径能成立,除了技术判断之外,也离不开消费电子行业长期积累的方法论。这种消费电子基因体现在 NAVO 对于用户反馈的重视上。毛松提到,产品上线后,团队几乎每天都会查看用户评价, “ 第一天收到反馈,第二天定位问题,第三天解决问题。 ” 在他看来,很多时候技术领先并不等于产品领先,真正决定产品竞争力的,仍然是用户是否能够感知到这些技术所创造的价值。
除了这种来自消费电子行业的方法论之外, NAVO 背靠的追觅系,本身也是国内少数已经完成全球化验证的消费电子企业之一。
毛松认为,消费级具身智能最终比拼的,并不仅仅是模型能力,还包括供应链能力、全球化渠道能力以及品牌和用户运营能力。而追觅在这些领域都已经形成了较为成熟的积累。“NAVO能够复用追觅已经建立完成的全球化体系,包括品牌、渠道、供应链以及消费电子产品能力,从而快速完成产品量产与海外市场拓展。”据公司方面介绍,目前NAVO来自海外市场的收入占比达到了90%。