惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

T
Threat Research - Cisco Blogs
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
V
Vulnerabilities – Threatpost
GbyAI
GbyAI
P
Proofpoint News Feed
L
LINUX DO - 热门话题
P
Palo Alto Networks Blog
A
About on SuperTechFans
T
Tenable Blog
M
MIT News - Artificial intelligence
IT之家
IT之家
I
Intezer
D
DataBreaches.Net
爱范儿
爱范儿
T
Threatpost
C
CERT Recently Published Vulnerability Notes
云风的 BLOG
云风的 BLOG
博客园 - 三生石上(FineUI控件)
WordPress大学
WordPress大学
K
Kaspersky official blog
大猫的无限游戏
大猫的无限游戏
A
Arctic Wolf
Y
Y Combinator Blog
Cyberwarzone
Cyberwarzone
酷 壳 – CoolShell
酷 壳 – CoolShell
D
Darknet – Hacking Tools, Hacker News & Cyber Security
H
Help Net Security
Microsoft Security Blog
Microsoft Security Blog
Spread Privacy
Spread Privacy
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
AWS News Blog
AWS News Blog
博客园 - 聂微东
C
Check Point Blog
S
Securelist
有赞技术团队
有赞技术团队
雷峰网
雷峰网
aimingoo的专栏
aimingoo的专栏
Last Week in AI
Last Week in AI
Stack Overflow Blog
Stack Overflow Blog
MongoDB | Blog
MongoDB | Blog
D
Docker
G
GRAHAM CLULEY
T
The Exploit Database - CXSecurity.com
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tailwind CSS Blog
L
Lohrmann on Cybersecurity
G
Google Developers Blog
C
Cyber Attacks, Cyber Crime and Cyber Security
L
LangChain Blog

博客园 - SHENHUANJIE

Marvis 使用进阶:联动与外部资源整合 这是一篇用 Marvis发布的文章,让大家都去用 Marvis 程序员保持高效的5个习惯 腾讯突然扔出王炸!马维斯一夜刷屏,打工人终于有救了? AIGC-测试库账号密码 openspec 是什么?怎么正确使用? # Hello World 的传奇起源 Please Start Here AI助手记忆系统:从金鱼到大象的进化之路 mac 快速切换 python 版本 卢曼卡片盒笔记法介绍 Introduction to the Zettelkasten Method Uni-app页面信息与元素影响解析 DevOps 入门指南:基础知识解读 「读书计划」《啊哈!算法》7日结构化学习规划 Java RestTemplate 发送 POST 请求设置请求体示例 跨平台开发方案:优缺点对比及选择指南 Java实现简单多层感知器神经网络 - SHENHUANJIE Google开发者账号注册步骤详解 ipify.org:免费IP查询服务详解 Google开发者利器:云平台与Firebase服务解析 Google Fonts字体库使用指南 UNI-APP + Spring Boot 实现小程序手机号登录 UNI-APP 获取用户手机号授权与服务器端处理指南 MySQL 8.0 如何禁用 ONLY_FULL_GROUP_BY 平衡工作与生活的10个实用方法 Linux安装Ollama并启用服务教程 如何在 LobeChat 中使用 Ollama Deprecation Warning: The legacy JS API is deprecated and will be removed in Dart Sass 2.0.0.
Kimi WebBridge:让 AI 真正操控你的浏览器
SHENHUANJIE · 2026-05-22 · via 博客园 - SHENHUANJIE

Kimi WebBridge:让 AI 真正操控你的浏览器

前言

你是否曾经幻想过:

  • 让 AI 帮你自动填写网页表单?
  • 批量采集数据并整理成文档?
  • 一键完成各种重复性浏览器操作?

现在,这个幻想成为了现实!月之暗面推出的 Kimi WebBridge 插件,让 AI 能够像真人一样操作你的浏览器,而且用的是你自己的登录状态、你的 Cookie、你的账号

什么是 Kimi WebBridge?

Kimi WebBridge 是月之暗面推出的浏览器插件,堪称"给 AI 装上浏览器的双手和眼睛"。它扮演 AI Agent 与浏览器之间的桥梁 角色,让 AI 能够直接操控 Chrome 或 Edge 浏览器。

支持的 AI Agent

类别 支持产品
Kimi 系列 Kimi Code
Anthropic Claude Code
IDE 助手 Cursor
OpenAI 系 Codex、OpenClaw
其他 以及更多主流 AI Agent...

核心能力详解

1. 模拟真人操作

WebBridge 可以执行完整的浏览器交互:

  • ️ 点击按钮(支持精确坐标和元素定位)
  • 滚动页面(平滑滚动、滚动到底部/顶部)
  • ⌨️ 输入文字(支持中英文、自动填充)
  • 填写表单(自动识别表单字段)
  • 切换标签页(新建/切换/关闭)

2. 复用你的登录态

这是 WebBridge 最大的亮点:

直接使用你当前浏览器的 Cookie 和登录会话,网站看来就是"你本人在操作"!

实际意义:

  • 无需为 AI 单独登录账号
  • 自动通过双因素认证验证
  • 访问需要验证码的页面(如某些国内网站)
  • 保持登录状态,AI 第二天仍能继续工作

3. 页面理解与提取

WebBridge 可以回传给 AI:

数据类型 说明
页面文本 完整文本内容或指定区域
表格数据 自动解析 HTML 表格
页面截图 支持全屏或指定区域
DOM 结构 完整 HTML 源码
控制台日志 方便调试

4. 自动化多步流程

支持复杂的多步骤任务链:

示例流程:
1. 登录电商后台 → 2. 导出昨日订单 → 3. 筛选问题订单 → 4. 发送通知邮件 → 5. 更新在线文档

安装配置(详细步骤)

环境要求

  • 操作系统:macOS 10.15+ / Linux(含 WSL)
  • 浏览器:Chrome 88+ 或 Edge 88+
  • 磁盘空间:约 100MB

第一步:安装命令行工具

# 方式一:官方安装脚本(一键安装,推荐)
curl -fsSL https://cdn.kimi.com/webbridge/install.sh | bash

# 方式二:手动安装(需要先下载对应版本)
# 下载地址:https://cdn.kimi.com/webbridge/latest/releases/
# 根据系统选择:darwin-arm64 / darwin-amd64 / linux-arm64 / linux-amd64

安装过程会自动检测系统:

==> Detecting OS/arch...
✓ Platform: darwin-arm64
✓ Version: latest
==> Downloading binary from https://cdn.kimi.com/webbridge/latest/releases/kimi-webbridge-darwin-arm64
✓ Installed to /Users/shenhuanjie/.kimi-webbridge/bin/kimi-webbridge
==> Starting daemon...
kimi-webbridge daemon is already running
✓ Daemon started
==> Installing skills...
✓ Skills installed

Done. Check status anytime: kimi-webbridge status

第二步:安装浏览器扩展

  1. 打开 Chrome/Edge
  2. 访问 Chrome 应用商店,搜索 "Kimi WebBridge"
  3. 点击"添加至 Chrome"
  4. 安装完成后,扩展图标会出现在工具栏

第三步:验证安装

# 检查服务状态
kimi-webbridge status

# 预期输出
✓ Daemon running
✓ Browser extension connected
✓ Ready to use

第四步:开始使用

  1. 在浏览器中打开你想让 AI 操作的目标网站
  2. 打开 Kimi Code / Claude Code 等 AI Agent
  3. 用自然语言描述你想完成的任务
  4. AI 会自动控制浏览器执行操作

实际应用场景

场景一:自动化信息整理

任务:采集多个竞品应用商店页面的截图和描述

操作流程

用户:帮我采集小红书、抖音和快手在 App Store 的页面截图和简介
AI:开始执行...
  → 打开 App Store,搜索"小红书"
  → 截图当前页面
  → 提取应用名称、开发商、版本、描述
  → 保存到 /data/apps/ 目录
  → 重复上述步骤采集抖音、快手

耗时对比:手动操作约 30 分钟 → AI 自动执行约 3 分钟

场景二:复杂操作自动化

任务:量化研究数据采集与报告生成

操作流程

用户:帮我登录聚宽量化平台,获取最近一周沪深300成分股的资金流向数据,导出CSV,然后写一份简要分析报告
AI:执行中...
  → 打开聚宽网站,自动填充登录信息
  → 进入数据页面,设置日期范围
  → 导出CSV文件
  → 用Python处理数据
  → 生成Markdown格式报告

场景三:社交媒体运营

任务:管理多个社交账号的评论回复

用户:帮我看看昨天发的这条微博有哪些新评论,帮我回复支持的用户
AI:执行中...
  → 打开微博
  → 定位到目标微博
  → 收集所有评论及评论者信息
  → 分析评论情感(正面/负面/中性)
  → 对正面评论生成个性化回复
  → 等待你确认后逐一发布

场景四:数据采集与监控

任务:监控竞品价格变动

用户:每天早上9点,帮我抓取京东和天猫上 iPhone 15 的价格
AI:已设置定时任务
  → 每天 9:00 自动执行
  → 打开京东/天猫搜索 iPhone 15
  → 提取官方旗舰店价格
  → 对比前一天价格
  → 如果降价超过5%,发送通知
  → 记录到价格追踪文档

工作原理

技术架构

┌─────────────┐     WebSocket      ┌──────────────────┐
│   AI Agent  │ ←─────────────────→ │  WebBridge Daemon │
└─────────────┘                     └────────┬─────────┘
                                              │
                                       Browser API
                                              │
┌─────────────────────────────────────────────▼─────────────┐
│                      Browser Extension                        │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────┐  │
│  │  页面截取   │  │  操作执行   │  │   Cookie 同步       │  │
│  └─────────────┘  └─────────────┘  └─────────────────────┘  │
└─────────────────────────────────────────────────────────────┘

安全机制

  1. 沙盒隔离:WebBridge 运行在独立进程中,不影响浏览器其他操作
  2. 操作可见:被控制的标签页会显示特殊标记,随时可接管
  3. 权限控制:每个网站需要单独授权
  4. 本地执行:所有操作在本地完成,数据不经过第三方服务器

为什么网站无法区分 AI 和真人?

因为 WebBridge 使用的就是真实的浏览器环境

  • 相同的 User-Agent
  • 相同的 Cookie
  • 相同的 TLS 指纹
  • 相同的 TLS 会话

使用技巧与最佳实践

技巧一:精准定位元素

// 推荐:使用语义化描述
"点击红色的'提交'按钮"

// 避免:模糊描述
"点击右边的按钮"  // 可能误触

技巧二:处理动态加载内容

// 页面加载后等待
"等待页面完全加载后再截图"

// 滚动加载更多
"滚动到页面底部,加载所有评论"

技巧三:处理弹窗和验证

// 处理弹窗
"如果有确认弹窗,点击确定"

// 验证码处理(需要人工介入)
"如果遇到验证码,请暂停并通知我"

技巧四:任务拆分

对于复杂任务,建议分步执行:

// ❌ 一步到位(容易出错)
"帮我登录淘宝,导出所有订单,筛选退款订单,发送旺旺消息"

// ✅ 分步执行(更稳定)
"1. 帮我登录淘宝
 2. 导出本月所有订单
 3. 筛选出退款状态的订单
 4. 列出退款订单详情,我确认后再操作"

与同类工具对比

特性 Kimi WebBridge Selenium Puppeteer Playwright
使用门槛 ⭐(自然语言) ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐
登录态复用 ✅ 原生支持 ❌ 需手动配置 ❌ 需手动配置 ❌ 需手动配置
AI 集成 ✅ 深度集成 ❌ 需自行开发 ❌ 需自行开发 ❌ 需自行开发
部署难度 ⭐(5分钟) ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐
维护成本 ⭐(官方维护) ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐

安全注意事项

⚠️ 重要提醒

  1. 账户安全

    • 不要让 AI 执行涉及金钱转移的操作
    • 涉及敏感操作的建议全程监督
  2. 频率控制

    • 避免过于频繁的操作,可能触发网站风控
    • 建议在操作间添加适当延迟
  3. 数据保护

    • 定期检查 WebBridge 的数据访问权限
    • 敏感网站(如银行)建议不使用
  4. 异常处理

    • 设置操作超时,自动停止异常行为
    • 重要操作前先备份数据

常见问题

Q1:安装后提示"连接失败"?

# 重启 WebBridge 服务
kimi-webbridge restart

# 检查端口占用
lsof -i :8080

Q2:为什么 AI 无法读取页面内容?

  • 检查页面是否需要登录
  • 确认浏览器扩展权限设置
  • 尝试刷新页面后重试

Q3:如何让 AI 只操作特定标签页?

  • 在扩展设置中指定"受控标签页"
  • 避免 AI 误操作其他重要页面

总结与评价

核心价值

Kimi WebBridge 的核心价值在于跨越数字身份的鸿沟,让 AI 能够以用户的真实身份在网页世界中自主行动。

优缺点分析

✅ 优点

  • 零门槛,一条命令安装
  • 自然语言驱动,无需编程
  • 使用真实登录态,成功率极高
  • 本地执行,隐私有保障
  • 多平台支持

❌ 缺点

  • 目前仅支持 Chrome 和 Edge
  • 复杂任务仍需人工监督
  • 部分网站可能有反爬限制

适用人群

场景 推荐指数
运营人员(社媒管理、数据采集) ⭐⭐⭐⭐⭐
量化研究者(金融数据获取) ⭐⭐⭐⭐⭐
跨境电商(竞品监控) ⭐⭐⭐⭐⭐
开发者(自动化测试) ⭐⭐⭐⭐
普通用户(表单填写) ⭐⭐⭐⭐

相关资源


建议:大部分基于网页的重复性繁琐操作或定时任务,现在都可以通过 Kimi WebBridge 自动化完成。强烈建议大家去体验一下,你会发现 AI 辅助办公的体验直接跃升好几个档次!