跳到主要内容

AI 网页爬取代理

模板概览

项目说明
分类🤖 AI · 📄 数据采集
集成应用OpenAI、HTTP Request、Code
难度⭐⭐⭐ 高级
创建者n8n 官方团队

工作原理

这个工作流创建了一个能够自主爬取网页的 AI 代理。你只需给它一个 URL,它就能自动抓取页面内容、分析结构、提取关键信息,并以结构化的格式返回结果。

核心功能

  • 智能爬取 — AI 自主决定爬取策略和数据提取方式
  • 结构化输出 — 自动将网页信息整理为表格或 JSON
  • 多页面支持 — 可以自动跟踪链接、爬取多个页面
  • 错误容错 — 内置重试和错误处理机制

工作流节点

Manual Chat Trigger → AI Agent
├── OpenAI Chat Model
├── HTTP Request Tool (爬取网页)
├── Code Tool (解析 HTML)
└── Memory Buffer

使用步骤

  1. 导入模板 — 在 n8n 中导入此工作流
  2. 配置 OpenAI — 添加 OpenAI API Key
  3. 开始对话 — 告诉 Agent 你想爬取什么
  4. 获取结果 — AI 自动完成爬取并返回结构化数据

适用场景

  • 🔍 竞品价格监控
  • 📊 市场数据采集
  • 📧 联系人信息收集
  • 🏷️ 产品信息聚合

相关文档


👉 在 n8n 中导入此模板