N8N中文教程
集成节点/Built in_nodes/Core_nodes

从文件提取#

在 n8n 工作流中,一个常见模式是接收文件——可能来自HTTP 请求节点(用于从网站获取文件)、Webhook 节点(用于接收外部发送到工作流的文件)或本地源。通过这种方式获取的数据通常为二进制格式,例如电子表格或 PDF 文件。

从文件提取节点能够从二进制格式文件中提取数据,并将其转换为 JSON 格式,便于工作流后续处理。如需将 JSON 转换回二进制文件类型,请参阅转换为文件节点。

操作类型#

通过操作类型下拉菜单选择要提取数据的源文件格式:

  • 从 CSV 提取:常用于处理表格数据的"逗号分隔值"文件类型
  • 从 HTML 提取:从标准网页 HTML 格式文件提取字段
  • 从 JSON 提取:从二进制文件提取 JSON 数据
  • 从 ICS 提取:从 iCalendar 格式文件提取字段
  • 从 ODS 提取:从 ODS 电子表格文件提取字段
  • 从 PDF 提取:从便携式文档格式文件提取字段
  • 从 RTF 提取:从富文本格式文件提取字段
  • 从文本文件提取:从标准文本文件格式提取字段
  • 从 XLS 提取:从 Microsoft Excel 文件(旧格式)提取字段
  • 从 XLSX 提取:从 Microsoft Excel 文件提取字段
  • 将文件转换为 Base64 字符串:将二进制数据转换为文本友好的 base64 格式

工作流示例#

本示例使用 Webhook 节点触发工作流。当 CSV 文件发送到 webhook 地址时,文件数据会被输出并由从文件提取节点接收。 查看工作流文件

节点设置为"从 CSV 提取"操作模式后,会将数据输出为一系列 JSON 'row' 对象:

1
2
3
4
5
6
7
8

| ``` { "row": { "0": "apple", "1": "1", "2": "2", "3": "3" } ...

---|--- 使用 Webhook 接收文件 点击 Webhook 节点的 添加选项 按钮并选择 原始正文,然后启用该设置,使节点输出后续节点期望的二进制文件。

节点参数#

输入二进制字段#

输入节点输入数据中包含二进制文件的字段名称。默认为 'data'。

目标输出字段#

输入节点输出中将包含提取数据的字段名称。 此参数仅适用于以下操作:

  • 从 JSON 提取
  • 从 ICS 提取
  • 从文本文件提取
  • 将文件转换为 Base64 字符串

模板和示例#

构建您的第一个 WhatsApp 聊天机器人 作者:Jimleuk 查看模板详情

从 PDF 文件提取文本 作者:amudhan 查看模板详情

从多个网页抓取并存储数据 作者:Miquel Colomer 查看模板详情

浏览 Extract From File 集成模板,或搜索所有模板