独家丨上线一个月吸引10万开发者,一家中国团队要帮Agent看见网页之外的世界
5 月中旬,一个名叫 anysearch-skill 的开源仓库出现在 GitHub 上,一周之内冲上了 Agent 技能市场 Skills.sh 的热榜第一。开发者们发现,给自己的 Agent 装上这个 Skill 之后,原本要搜七八轮才能拼凑完整的调研任务,常常一两次调用就能拿到结果,而且返回的不是网页链接,是可以直接进推理链路的结构化数据。
仓库背后是一家刚成立不久的公司 AnySearch。5 月 11 日产品正式上线,上线一个月,已有超过 10 万名开发者把它接入自己的工作流,累计搜索调用量突破 400 万次,GitHub Star 数超过 4,000,用户分布在亚太、北美和欧洲。6 月 3 日,团队发布 V2.1.0 版本,完成了上线以来对算法层和架构层最大的一次升级。
这家公司想解决的问题,藏在所有 Agent 使用者的日常体验里:模型越来越会推理,但喂给它的信息,依然来自一个为人类眼睛设计的搜索体系。金融数据、裁判文书、学术引用、威胁情报,这些完成专业任务真正需要的东西,大多在传统搜索引擎触及不到的地方。AnySearch 把这些专业数据源聚合到一个统一入口之后,只服务 Agent,不服务人。
“我们认为,未来 Agent 的竞争不仅是模型能力的竞争,更是信息获取能力的竞争。” AnySearch 联合创始人韩广彤 在接受 DeepTech 采访时说。
满足一个简单的信息需求,为什么这么难
AnySearch 的四位初创团队成员都是 AI 开发者。过去一年,他们一直用 Agent 辅助产品研发,做代码研究,做行业调研。模型的推理能力肉眼可见地在变强,但他们反复撞上同一堵墙:一个很宽泛的信息需求,很难通过单一查询或单个通用搜索一次性拿到全部结果,还有一些信息藏在需要登录的系统后面,整个获取链路冗长而琐碎。
图丨AnySearch 团队成员(来源:受访者) “我们在想,在 AI Agent 如此发达的今天,满足一个最简单的信息需求为什么如此困难 。” 韩广彤 回忆道。
这个困惑最终被拆解成三个问题:信息本身在哪里,信息如何被组织起来,以及如何让 Agent 用好这些信息。AnySearch 整个产品,就是对这三个问题的回答。
在韩广彤看来,问题的根源是过去三十年的搜索引擎全部围绕人的眼睛设计。人在搜索时视觉注意力敏锐,对排在前面的内容极其敏感,于是所有搜索引擎都以 Top-K 相关性作为主要优化目标。但 Agent 不是人。它有更宽、更平缓的信息感受野,能在短时间内消化大量输入,搜索结果会直接进入后续推理链路,成为分析和决策的依据。给人看的相关性排序,对 Agent 来说是一套过时的机制。
“Agent 真正需要的是更可信、更结构化、能够直接使用的信息,这也是 AnySearch 在设计上的一个核心出发点。”韩广彤说。
动手之前,团队和 100 多位开发者做了访谈,归纳出三个普遍需求:搜索过程要高效,减少调用次数和上下文消耗;相比覆盖更多网页,开发者更想直接拿到金融、法律、学术、安全这类专业领域的多维数据;他们要的不是又一个搜索引擎,而是一套贴合 Agent 工作流的信息获取基础设施。
一条查询进来之后
一条查询进入 AnySearch,第一步不是检索,而是查询理解。
以企业尽调为例。用户在 Agent 里输入“查一下深圳某某智能科技有限公司的股权结构、涉诉记录和专利布局”,系统首先识别出这不是一次简单的信息查询,而是一项企业研究任务,并把它拆解成几个维度的信息需求。随后进入路由编排:股权结构走企业工商数据源,涉诉记录走法律数据库,专利布局走知识产权数据库,多路并行检索。
图丨AnySearch 的查询检索流程(来源:AnySearch) 结果返回后,系统对不同来源的数据做归一化、重排序和结构化融合,把股权关系、经营记录、诉讼信息和专利数据映射到同一家企业实体上。最终交付给 Agent 的是一份带来源标注的结构化尽调结果,Agent 可以直接基于它生成报告。
同样的路由逻辑适用于其他领域。开发者问“Go 的分布式限流器在生产环境怎么实现”,查询会被导向代码仓库、技术文档和开发者社区;安全工程师凌晨查一个可疑 IP,请求会进入威胁情报数据库。智能路由的价值不只是更准,也在于减少无效检索带来的延迟和资源浪费。
这种效率差距是可以被量化的。在团队最近做的一次搜索能力测试中,几个接入不同搜索工具的 Agent 完成同一项代码研究任务,所有方案都找到了正确答案,但 AnySearch 只用了 1 次搜索调用,其他工具分别用了 7 次、16 次和 28 次。
“这并不是因为 AnySearch 返回了更多搜索内容,而是因为返回的信息经过了查询理解、多源检索和结果融合处理。”韩广彤解释,Agent 拿到的是已经组织好的信息,不需要反复搜索来拼凑上下文,后续推理的 Token 消耗也随之下降。
用户们的体感与此一致。一位开发者实测金融垂直搜索后写道,返回的英伟达季度营收数据“精确到了具体数字,而不是模糊的‘大幅增长’”。
图丨AnySearch 在不同基准测试上的准确率表现(来源:AnySearch) V2.1.0 的升级重点也在这条链路上:算法层引入了融合语义相关性与时效性信号的混合排序,架构层重构了领域划分和路由逻辑。 韩广彤表示,此前最大的瓶颈不是单纯的延迟或准确率,而是搜索质量的稳定性, “当 Agent 开始处理越来越复杂的跨领域任务时,系统需要持续返回正确结果。”
永远滚不到山顶的石头
专业数据从哪来,决定了这类产品的成色。AnySearch 采用自建索引加外部数据源接入的联邦架构。对金融、法律、学术、安全、企业工商这些高价值领域,团队从第一天起就在建设自己的数据管线,覆盖采集、清洗到索引构建的端到端链路;通用搜索和长尾需求则交给外部数据源补足。
坚持自建的理由非常简单。“如果完全依赖第三方 API,数据质量、更新频率和服务可用性都会受制于人。”韩广彤说,“对于高价值、高需求领域,我们希望把数据质量和检索能力掌握在自己手里。”
垂直领域的另一面是错误成本。金融、法律场景里,一个过时的数字或一次引用失误,都可能直接影响下游判断。为此 AnySearch 在搜索层引入多源交叉验证,避免 Agent 基于单一来源下结论,结构化数据保留来源信息和可追溯链路,供开发者回溯验证。
但真正的苦活在日常维护。每个数据源按自己的节奏独立演化:金融数据分钟级刷新,法律判例几个月不动,代码仓库实时流动。接口协议和质量信号完全异构,上游悄悄改一个字段、换一种认证,下游就会出问题,没有人提前通知你。更难的在融合层,新闻按时效排序,学术按引用,代码按 Star,跨领域之间不存在天然可比的质量标准,每新增一个垂类都要重新校准。传统搜索引擎还有点击率这个反馈信号,而 Agent 拿到结果后推理效果如何,搜索系统看不到,只能靠间接指标持续改进。
“这是一块永远滚不到山顶的石头。”韩广彤说。
Skill 走红之后
AnySearch 上线时同时支持 Skill、MCP、API 三种接入方式,最先出圈的是 Skill。
这与当下 Agent 生态的接入习惯有关。Skill 本质上是一份给 Agent 看的使用说明加一组跨平台命令行工具,主流 Agent 产品已支持自动发现和安装,开发者几乎零配置就能用起来,天然适合社区传播。有开发者把它形容为“一套给 Agent 用的搜索 SOP”:先判断要不要联网,再选数据源,再读网页,最后核验和引用来源。
图丨AnySearch 的 GitHub 仓库(来源:GitHub) 不过韩广彤对目前的热度保持着一份清醒。Skill 在 GitHub 上的关注度高于 MCP,但这不代表实际使用量领先。MCP 的核心搜索能力运行在远程服务端,开源仓库只承担安装和接入说明的角色,“很多开发者使用的是 MCP 提供的能力,但未必会直接与仓库产生交互”。在团队的定位里,Skill 适合快速体验和个人工作流,MCP 和 API 适合深度集成到 Agent 系统与生产环境,本地化 MCP 部署方案也在探索中。
除了增长速度超出了预期,更让团队意外的是扩散方式。越来越多开发者自发为 AnySearch 编写第三方工具和工作流,一些团队原本没有重点关注的 Agent 框架里,也出现了社区贡献的集成项目。“我们原本以为自己在服务开发者,后来发现很多开发者已经开始帮我们一起拓展产品边界。”韩广彤说。
资本市场已经为这个方向给出过定价。专为 AI 构建搜索引擎的美国公司 Exa 今年 5 月以 22 亿美元估值完成 2.5 亿美元 C 轮融资,开发者也常把两家公司放在一起讨论。韩广彤认为差异在于对 Agent 信息获取的认知: 相比把网页搜得更准,AnySearch 押注的是网页之外的专业数据,当 Agent 要做企业尽调、判例检索、威胁情报分析时,答案往往不在可索引的公开网页上。
生态的自发生长解决了从 0 到 1 的认知问题。为 Agent 做搜索能不能收到钱,先行者已经给出了肯定答案,AnySearch 要回答的是更具体的问题:开发者愿意付费的,是不是它选的这条路,网页之外的专业数据。
产品目前对个人开发者免费,面向高频用户的 Pro 付费版和企业定制版也在同步推进。收入将主要来自 API 服务与企业解决方案,不依赖广告或用户数据变现,这与其零遥测、不追踪、查询处理完即丢弃的隐私架构是同一个选择的两面:不碰用户数据,就只能靠信息质量本身收费。
所以未来半年要验证的两件事,其实是同一件事。韩广彤说,团队想看到 AnySearch 真正成为 Agent 工作流中默认的信息获取层,也想确认开发者是否愿意为高质量信息付费。前者是位置,后者是位置的价格,而两者都取决于同一个变量:每一次查询,系统能不能持续返回正确的结果。
上线第一个月,10 万开发者已经投出了第一轮信任票。而他们续期的方式,写在之后的每一次调用里。
参考资料:
1.https://github.com/anysearch-ai/anysearch-skill
2.https://www.anysearch.com/home
运营/排版:何晨龙