PDF 数据提取到表格
模板概览
| 项目 | 说明 |
|---|---|
| 分类 | 📄 文档处理 · 📊 数据处理 |
| 集成应用 | Google Drive、Google Sheets |
| 难度 | ⭐⭐ 中级 |
| 创建者 | n8n 官方团队 |
工作原理
这个工作流自动监控 Google Drive 指定文件夹中的新 PDF 文件。当新的发票、合同或报表上传时,工作流提取 PDF 中的文字内容,使用正则表达式或 AI 解析出关键结构化数据(发票号、金额、日期、客户名等),然后将这些数据自动追加到 Google Sheets 的指定工作表中。
核心功能
- 自动监控 — 监听 Google Drive 文件夹中的新 PDF 文件
- 文字提取 — 从 PDF 中提取全量文字内容
- 结构化解析 — 识别并提取金额、日期、编号等关键字段
- 表格写入 — 将提取的数据自动追加到 Google Sheets
工作流节点
Google Drive Trigger (新文件) → Read Binary File (读取 PDF)
→ Extract Document Text (提取文字)
→ Code (解析结构化数据)
→ Google Sheets (写入)
使用步骤
- 导入模板 — 在 n8n 中导入此工作流模板
- 配置 Google Drive — 授权并选择要监控的 PDF 文件夹
- 配置 Google Sheets — 选择或创建目标表格,设置好列标题
- 调整解析规则 — 根据你的 PDF 格式修改提取字段和正则
- 激活并测试 — 上传一个测试 PDF 验证数据提取准确性
适用场景
- 🧾 财务发票自动录入
- 📋 合同关键信息归档
- 📊 月度报表数据汇总
- 🏦 银行对账单自动化处理
相关文档
💡 使用要求:需要 n8n 1.0.0 或更高版本