Puppeteer：Google 出品的浏览器自动化神器，从爬虫到测试全覆盖

BlogFinder

日常漫步 Vol.24 之漫步前山河 - 雅余周报 #1-聊聊本周的收获 - Edwin's Blog 我的OpenCode必装插件与Skill Write Something 掌中之物未必在掌握之中 · CRIVU PiliNara，一个更顺手的 PiliPlus 分支「NekoEcho」：做一个必有回响的猫娘主题博客 2026-05 书影音总结简化博客主题 - 安迪你要加油呐我第一次发布 npm 包拾花小记#45：中考前的二三事 – 小改学习志黛西花园5月游 #18 枇杷又熟了的五月月报一些奇奇怪怪的需求？word仿方正书版的几个小操作 - Xiobb's Blog 0419 御温泉之旅修复了一些bug,网站基本上趋于稳定了 - 新锐博客又回到四十年前如何定义成功迷鹿屋2026已重新上线科技冰火两重天+一周回顾 ${title} 热度退了，我反而用得更深了-咕咚同学我到底该不该换个域名？随身WIFI折腾记 - 安迪博客撰写体验提升——hexo pro插件为什么不用相机把屏幕上的接关密码拍下来？国清寺与天台山 – Ouroboros ★★★★☆《挽救计划》——久违的经济上行感 - Davidの3号基地删除右键“打开方式”里多余选项第三周刊_No.53｜一切都会被支付两次安卓APP通话记录与录音上传踩坑记录 - 子舒的博客天量下跌 inBox 笔记 2.3.8，把工具栏交给了你-咕咚同学我把小龙虾搬到了微信-咕咚同学安好 - 响石潭 Compound Engineering Plugin：让每个工程单元都比上一个更容易 MOSS-TTS Family：开源高质量语音与声音生成模型家族深度解析 Crawl4AI：专为 LLM 设计的开源 Web 爬虫与数据抓取工具 Build Your Own X：从零实现你最喜欢的技术——程序员进阶的终极资源清单 Anthropic Skills：用文件夹教 Claude 专业技能的开源框架 1年的去月球（下） - 梅之夏欢迎回来。简单讲讲 ASN.1 与 OID DTV - 直播聚合客户端 5.22-5.27 – 不兴江还没去过鸭川 – 不兴江张晶晶同学三刷林志颖关于我 – 不兴江爱与嫉妒 – 不兴江港股被持续做空备案码花了四百块-咕咚同学一句话生成封面：我给公众号做了4种风格的AI封面生成技能「官」方認證再谈费曼学习法 2026-05-28T00:34:11+08:00 2026-05-28T00:28:45+08:00 离谱的英语学习指南：基于AI的英语进阶系统方法论 iii：零集成架构的后端统一运行时 Claude Code Harness：让 Claude Code 工作有迹可循的工程化框架 Heretic：全自动移除大语言模型审查机制的开源工具 MarkItDown：微软开源的万能文档转 Markdown 利器 Harness：让 Claude Code 秒变多智能体协作工厂这段时间尽折腾AI Agent了，确实极大地提高了效率近期动态：两个新站点正式上线啦误判解除！zhouayuan.com 腾讯安全申诉成功 - 周阿源｜玩具设计・插画日常・生活随笔 Ralph：让 AI 编码工具自主循环跑完所有 PRD 任务的量产神器全都违法 – 个人工作记录关于zhouayuan.com被误判 “含违规信息” 的说明与申诉记录 - 周阿源｜玩具设计・插画日常・生活随笔小米 MiMo v2.5 Pro 白嫖最大的人间清醒，兜里有钱，但是不花。夜晚靓歌(12)：于文文现场solo - 王志勇的Blog 今日插画：风扬起的倔强 - 周阿源｜玩具设计・插画日常・生活随笔回门习俗独立网卡 - 忘记了回忆 500亿入股人工智能企业从命令行到桌面智能体-咕咚同学第一性原理读书笔记行者微评论223-加班の守株待兔-博客|政治与时事-风雨行者 ZOZO开源物理接触求解器：GPU加速的可扩展仿真引擎 OpenStock：开源股票市场交易平台技术深度解析 MoneyPrinterTurbo：基于AI的全自动短视频生成工具深度解析 Claude-Mem：为 Claude Code 构建的持久化记忆压缩系统 Twenty：可代码化定制的企业级开源 CRM 平台技术深度解析 2026-05-26T22:59:17+08:00 企业级开源大模型部署平台 GPUStack 实战教程 1年的去月球（上） - 梅之夏 Sevalla - 静态网站托管服务不用翻墙、不用注册、不用月费，普通人也能用上 Claude Code 装修灯具要注意⚠️ 黄梅天先锋 - 游子微博公安备案顺利办结，站点备案全部完成 - 周阿源｜玩具设计・插画日常・生活随笔第三次兑换天猫超市卡了宗宗酱-三维狐少儿编程 Don't think, feel. - Rolen's Blog 人这一辈子，到底图个什么博客迁移 - Edwin's Blog 情感赛道写作模板再现本轮行情的典型特征裁员与平常心-咕咚同学别让“偷懒”，成为隐私泄露的破绽

Cheman · 2026-06-16 · via BlogFinder

今天在 GitHub Trending 上看到一个有意思的项目：Puppeteer，这是 Google 官方维护的浏览器自动化库，能够用几行代码控制 Chrome 或 Firefox 完成复杂任务。

一、项目概述

Puppeteer 是一个 JavaScript 库，提供高层 API 通过 DevTools Protocol 或 WebDriver BiDi 控制 Chrome 或 Firefox 浏览器。默认以无头模式（headless）运行，非常适合服务端自动化场景。

核心特性：

🚀 支持 Chrome 和 Firefox 双引擎
🔧 提供 DevTools Protocol 和 WebDriver BiDi 两种通信协议
📦 安装时自动下载兼容版本的浏览器
🧪 内置 Mocha 测试支持，适合 E2E 测试
🔌 支持 MCP（Model Context Protocol）集成，可与 AI Agent 联动
🌐 支持浏览器内运行（puppeteer-in-browser）

典型应用场景：

UI 自动化测试（E2E）
网页截图和 PDF 生成
服务端渲染（SSR）预渲染
大规模网页爬取
表单自动填充和提交
性能分析和监控

二、技术原理

架构设计

Puppeteer 采用分层架构设计，核心由以下几个模块组成：

┌─────────────────────────────────────┐
│         User Code (Node.js)         │
├─────────────────────────────────────┤
│         Puppeteer API Layer         │
│  (puppeteer/puppeteer-core)        │
├─────────────────────────────────────┤
│    DevTools Protocol / WebDriver    │
│            BiDi Adapter            │
├─────────────────────────────────────┤
│  Chrome for Testing / Firefox       │
└─────────────────────────────────────┘

核心技术栈

从 package.json 和 eslint.config.mjs 可以看到项目的技术选型：

技术	用途
TypeScript	主要开发语言，提供类型安全
Mocha	测试框架，支持异步测试和重试
Wireit	构建任务编排工具
Hereby	类似 `make` 的任务运行器
Rollup	打包工具，用于浏览器版本
esbuild	快速 TypeScript 编译

关键算法与通信机制

Puppeteer 的核心在于与浏览器的通信机制。以 DevTools Protocol 为例：

// 简化的通信流程
import puppeteer from 'puppeteer';

const browser = await puppeteer.launch();
const page = await browser.newPage();

// 通过 CDP 发送命令
await page.goto('https://example.com');
// 底层：Page.navigate command

协议适配层支持两种模式：

DevTools Protocol（默认）：Chrome 原生调试协议，功能最全
WebDriver BiDi：W3C 标准，跨浏览器兼容性好

数据流分析

// 从源码 example 中提取的真实数据流
const browser = await puppeteer.launch();  // 1. 启动浏览器进程
const page = await browser.newPage();       // 2. 创建新页面（CDP Target）
await page.goto(url);                      // 3. 导航（发送 Page.navigate）
await page.setViewport({width, height});   // 4. 设置视口（Emulation.setDeviceMetricsOverride）
await page.keyboard.press('/');            // 5. 键盘输入（Input.dispatchKeyEvent）
const element = await page.locator('selector');  // 6. 元素定位（CSS/XPath/ARIA）
await element.click();                     // 7. 点击（Input.dispatchMouseEvent）
const text = await element.evaluate(el => el.textContent); // 8. 执行 JS（Runtime.evaluate）
await browser.close();                    // 9. 清理资源

三、安装与快速开始

环境要求

Node.js 18+（推荐使用 Active LTS 版本）
npm / pnpm / yarn / bun 任一包管理器

安装步骤

# 完整安装（自动下载 Chrome）
npm i puppeteer

# 仅安装库（需手动管理浏览器）
npm i puppeteer-core

⚠️ 注意：现代包管理器（npm、pnpm、yarn、bun、deno）默认阻止依赖的安装脚本。如果安装脚本被阻止，Puppeteer 不会自动下载浏览器，会导致运行时错误。

手动安装浏览器的方法：

npx puppeteer browsers install

或者在 package.json 中允许 puppeteer 的运行脚本：

{
  "allowScripts": ["puppeteer"]
}

最简运行示例

import puppeteer from 'puppeteer';

const browser = await puppeteer.launch();
const page = await browser.newPage();

await page.goto('https://developer.chrome.com/');
await page.setViewport({width: 1080, height: 1024});

// 使用键盘快捷键打开搜索
await page.keyboard.press('/');
await page.locator('::-p-aria(Search)').fill('automate beyond recorder');
await page.locator('.devsite-result-item-link').click();

const textSelector = await page
  .locator('::-p-text(Customize and automate)')
  .waitHandle();
const fullTitle = await textSelector?.evaluate(el => el.textContent);

console.log('The title of this blog post is "%s".', fullTitle);
await browser.close();

四、使用方法与实战

基础用法

1. 截图功能

await page.screenshot({ 
  path: 'example.png',
  fullPage: true  // 全页截图
});

2. 生成 PDF

await page.pdf({
  path: 'page.pdf',
  format: 'A4',
  printBackground: true
});

3. 等待元素出现

// 等待选择器出现
await page.waitForSelector('.my-element');

// 等待函数返回真值
await page.waitForFunction(() => document.readyState === 'complete');

// 使用 locator（推荐）
const element = await page.locator('.my-element').waitHandle();

进阶用法

1. 拦截网络请求

await page.setRequestInterception(true);
page.on('request', request => {
  if (request.url().includes('ads'))
    request.abort();  // 阻止广告请求
  else
    request.continue();
});

2. 执行注入脚本

// 在页面加载前注入
await page.evaluateOnNewDocument(() => {
  Object.defineProperty(navigator, 'webdriver', {get: () => false});
});

// 在已加载的页面执行
const result = await page.evaluate(() => {
  return document.title;
});

3. 并行处理多个页面

const browser = await puppeteer.launch({ 
  headless: 'shell'  // 使用 chrome-headless-shell，更轻量
});

const pages = await Promise.all([
  browser.newPage(),
  browser.newPage(),
  browser.newPage(),
]);

await Promise.all(
  pages.map((page, i) => 
    page.goto(`https://example.com/page/${i}`)
  )
);

实际项目示例：批量爬取文章标题

import puppeteer from 'puppeteer';

async function scrapeArticles(url: string) {
  const browser = await puppeteer.launch({ headless: true });
  const page = await browser.newPage();
  
  await page.goto(url, { waitUntil: 'networkidle2' });
  
  const articles = await page.evaluate(() => {
    return Array.from(document.querySelectorAll('article h2'))
      .map(h2 => ({
        title: h2.textContent?.trim(),
        link: h2.querySelector('a')?.href
      }));
  });
  
  await browser.close();
  return articles;
}

// 使用
const results = await scrapeArticles('https://blog.example.com');
console.log(results);

五、常见问题与解决方案

安装失败

问题：npm install puppeteer 后运行时报错 Failed to launch chrome

原因：包管理器的沙箱机制阻止了安装脚本执行，浏览器未下载。

解决方案：

# 方法1：手动下载浏览器
npx puppeteer browsers install

# 方法2：允许安装脚本（npm）
npm config set ignore-scripts false
npm install puppeteer

# 方法3：使用 --unsafe-perm（CI 环境）
npm install puppeteer --unsafe-perm=true

运行时错误

问题：Protocol error: Connection closed

原因：浏览器进程意外退出，可能是内存不足或超时。

解决方案：

const browser = await puppeteer.launch({
  args: [
    '--no-sandbox',
    '--disable-setuid-sandbox',
    '--disable-dev-shm-usage',  // 解决 Docker 环境共享内存不足
    '--max-old-space-size=4096'  // 增加内存限制
  ],
  timeout: 60000  // 增加启动超时
});

性能问题

问题：爬取大量页面时速度慢

解决方案：

// 1. 使用同一个 browser 实例，复用连接
// 2. 禁用图片和 CSS 加载
await page.setRequestInterception(true);
page.on('request', req => {
  if (['image', 'stylesheet', 'font'].includes(req.resourceType()))
    req.abort();
  else
    req.continue();
});

// 3. 使用 chrome-headless-shell（更轻量）
const browser = await puppeteer.launch({
  headless: 'shell'  // 比默认 headless 更快
});

兼容性问题

问题：某些网站检测到 Puppeteer 并拒绝访问

解决方案：

const browser = await puppeteer.launch({
  headless: false,  // 使用有头模式
  args: [
    '--disable-blink-features=AutomationControlled',  // 移除自动化特征
    '--user-agent="Mozilla/5.0 ..."'  // 自定义 UA
  ]
});

// 注入脚本隐藏 webdriver 特征
await page.evaluateOnNewDocument(() => {
  Object.defineProperty(navigator, 'webdriver', {get: () => undefined});
  window.navigator.chrome = {runtime: {}};
});

六、总结

Puppeteer 作为 Google 官方维护的浏览器自动化库，凭借其简洁的 API、强大的功能和活跃的社区，已成为 Node.js 生态中浏览器自动化的首选方案。无论是做 E2E 测试、网页爬取，还是服务端渲染，Puppeteer 都能提供可靠的支持。

项目亮点总结：

✅ TypeScript 编写，类型定义完善
✅ 支持 Chrome 和 Firefox 双引擎
✅ 完善的文档和示例
✅ 活跃的社区和持续的维护（Google 团队）
✅ 支持 MCP 协议，可与 AI Agent 集成

如果你正在寻找一个可靠的浏览器自动化工具，Puppeteer 绝对值得一试。项目 GitHub 地址：https://github.com/puppeteer/puppeteer

参考资料：

官方文档：https://pptr.dev/
GitHub 仓库：https://github.com/puppeteer/puppeteer
Chrome DevTools Protocol：https://chromedevtools.github.io/devtools-protocol/

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

BlogFinder

一、项目概述

二、技术原理

架构设计

核心技术栈

关键算法与通信机制

数据流分析

三、安装与快速开始

环境要求

安装步骤

最简运行示例

四、使用方法与实战

基础用法

进阶用法

实际项目示例：批量爬取文章标题

五、常见问题与解决方案

安装失败

运行时错误

性能问题

兼容性问题

六、总结