我在MIT看到的Agent 新范式 今天在麻省理工学院的EmTech大会上,看到了一个让我重新思考整个AI agent领域的演示。 演示方是TinyFish,一家相当低调的公司。创始团队里有两位华人,获得了ICONIQ领投的近3.5亿元人民币融资,但在今天之前从未公开展示过他们的核心产品。 而他们正在做的事情,已经在为Google和DoorDash运行超过千万级别的web agent操作... 不是实验室demo,是真实的生产环境。 TinyFish产品能让 AI 能够像人类一样自动操作网页、完成企业级任务... 它可以在没有 API 的情况下,让 AI 自动跨网站读取、理解、操作网页,执行业务流程、采集数据、提交信息、监控变化。 从抓数据、比价格、做填表、查库存,到合规审查与动态定价,都能完成... 可以在几千个网站间实时操作、执行任务。 也就是可以以同时运行一千个ChatGPT Atlas ,然后不间断的,同样的答案运行一千万次... 一个被所有人忽视的事实 TinyFish的CEO Sudheesh在演示中分享了一个震撼的洞察: 现在市面上所有的AI agent,都只能操作5%的网络。 不是因为开发者技术不行,而是因为所有人都在基于搜索引擎构建agent。 而搜索这个范式,早就失效了。 搜索是怎么失效的? 我们来看一个最简单的例子:Amazon。 Amazon的每个产品页面都被Google完整索引,完全可以爬取。这是搜索引擎最理想的场景。 但当你在Amazon搜索"笔记本电脑"时会发生什么? 你会看到上万个结果。赞助商品、虚假评论、AI生成的描述铺天盖地。你翻了几页就放弃了,最后随便点一个"看起来还行"的,结账走人。 这不是Amazon的问题。这是搜索范式本身的问题:当数据量太大时,排名就失效了。 Google成功地索引了数百万Amazon页面,但这并没有让搜索变得更有用。Amazon自己建了搜索引擎,也没有解决问题。 网络变得太大了。即使是已经被索引的那部分,排名也已经无法工作。 搜索假设你想"找到"某样东西。但如果你需要"检查所有"东西呢?比较所有供应商?验证每一个选项?** 这时候,整个范式就崩溃了。 那剩下的95%呢? 更糟糕的是,刚才说的还只是那5%被索引的网络。 剩下95%的网络藏在哪里? - 需要登录的供应商门户 - 有身份验证的医疗系统 - 只能通过表单提交访问的政府数据库 - 需要多步骤导航的竞争情报 搜索引擎根本接触不到这些。不是技术问题,是架构问题。你无法爬取需要交互才能访问的内容。 所以我们面临两个问题: 1. 被索引的5%网络因为太大而失效 2. 95%的重要数据根本没被索引 两个问题的根源都一样:搜索这个范式假设人类会手动评估结果。当你需要全面的情报而不是排名选项时,它就失效了。 为什么现有方案都解决不了 你可能会想:RAG呢?更好的embedding呢?Browser agents 呢? 它们都解决不了 因为它们都继承了搜索的核心局限:假设你想"找到"某样东西,而不是"检查所有"东西。 当一个采购团队需要检查200个供应商门户的竞争定价时,排名帮不了你。 当制药公司需要在数千个研究站点匹配临床试验的患者资格时,检索帮不了你。 这不是"这项工作很繁琐我们想自动化"的问题。这是"这种分析在我们需要的规模上根本不可能完成"的问题。 从可读Web到可执行Web Sudheesh解释了他们的解决方案: 不是更好的搜索,而是操作性基础设施。 TinyFish构建的系统可以: - 登录认证系统 - 导航多步骤工作流 - 提取结构化数据 - 同时运行数十万个并行会话 这就是从"可读Web"到"可执行Web"的转变。 浏览器代理(比如OpenAI的Atlas)帮助个人更快地导航网站:一次一个会话,一个浏览器。 TinyFish 的 Mino: 👉 就像一个“AI工厂”,让公司自己创建、部署和管理这些“网页机器人(Web Agents)”。 Mino可在基础设施规模上运行数十万个并行会话,在需要人类团队数周时间完成的复杂工作流中保持准确性。 这不是自行车和摩托车的区别。这是自行车和货运网络的区别。 规模化的证明 这不是理论 TinyFish已经在为ClassPass、Google、DoorDash等公司每月运行3000万次操作。 ClassPass的例子很典型:他们需要聚合数万家健身工作室的课程。大部分工作室没有API,只有手动更新的预订网站。课程安排每天变化,价格因时间、地点和等级而异。 传统方法全部失败: - 人工录入:无法规模化,数据永远过时 - 爬虫:网站一改版就崩溃 - API对接:长尾永远不会开发集成 使用TinyFish后,他们的场馆覆盖率增加了3-4倍,成本降低了50%。 更具体的实际落地案例: 🏨 Google Hotels 日本许多酒店使用老旧系统,无法接入 Google 聚合平台 TinyFish 的代理能自动获取这些酒店的库存与价格; 无需 IT 改造,让 Google Hotels 实现实时更新。 实现 99% 的实时覆盖率 更新频率提升 20 倍 运行量超过 每月 1,000 万+ 操作 🛵 DoorDash 为每个城市部署 AI 代理,自动抓取竞争网站菜单、价格、促销 每小时更新、自动去重与异常检测; 与 DoorDash 内部数据系统自动对接。 每月收集数百万个定价变量; 用于动态调整价格、优化市场响应; 自动化 95% 市场数据采集; 提高预测模型精度 30%; 大幅降低人工调研成本(原来每月人工工时 1200+ 小时)。 这意味着什么 搜索在过去25年里运行得很好,因为网络足够小,人类可以手动评估排名结果。 现在网络太大了。即使是被索引的部分也变得无法管理。而95%的网络从来没被索引过。 接下来的范式不是更好的搜索或更智能的排名。而是能够在整个网络上导航、推理和提取的操作性基础设施:公开的和私密的,被索引的和未被索引的。 Agent功能的发展速度远超预期。短短36个月,我们就从"AI起草邮件"发展到了"AI运行完整工作流"。 TinyFish可能在企业规模的实际落地上已经领先了。 他们正在向开发者开放这个基础设施。如果你在构建需要大规模可靠性的agent产品,这可能是一个值得关注的早期信号。

Nov 5, 2025 · 5:10 PM UTC

TinyFish让企业能够用 AI 替代网页上的重复劳动,实现从信息自动化到操作自动化... TinyFish @Tiny_Fish 已获得ICONIQ 4700万美金 A 轮融资 网站:tinyfish.ai/
1
10
14
Replying to @imxiaohu
在这么多文字里,我还是没有看到怎么解决如下问题的答案: “剩下95%的网络藏在哪里? - 需要登录的供应商门户 - 有身份验证的医疗系统 - 只能通过表单提交访问的政府数据库 - 需要多步骤导航的竞争情报” 它凭什么就能触达这95%的网络?
5
1
19
Replying to @imxiaohu
访问网站的许可哪里导入呢
1
Replying to @imxiaohu
短信验证码怎么解决?滑块以及多种防机器人的验证怎么解决,知识产权怎么处理呢。理论上可以实现,但现实中太多的不确定,我是专业做自动化的,我想说这篇文章有点片面
1
Replying to @imxiaohu
问题是好问题,但没怎么看懂TinyFish是怎么解决这个问题的
Replying to @imxiaohu
没get牛逼在那。。。。
Replying to @imxiaohu
他家 agentql 产品有些不愠不火,业务可能会被 ai 浏览器或者 browserbase 卷掉
Replying to @imxiaohu
也就是5000万美元投资
Replying to @imxiaohu
需要多步验证的登录怎么解决
Replying to @imxiaohu
软文。鉴定完毕。
Replying to @imxiaohu
☕️
Replying to @imxiaohu
看了半天没看明白这家到底在干嘛
Replying to @imxiaohu
不得不说,AI、大模型不愧为21世纪的赛博法轮功👍
Replying to @imxiaohu
有种web3搞推广的美