← 返回机构投研助手
🟢 Coze 自建插件

财报 PDF 解析 v2.0

用户提供上市公司财报 PDF 公开链接 → 通过 TextIn API 自动解析 PDF 内容 → 识别并提取资产负债表、利润表、现金流量表三大报表 → 自动计算财务比率 → 分析数据质量 → 输出结构化分析报告(Markdown/JSON 双格式可选)。
financial-report-parser
TextIn API
三大报表
📥 输入参数
参数名类型必填默认值说明
file_urlstring财报 PDF 的公开可访问链接,如公司官网或交易所披露的 PDF 文件
parse_tablesbooleantrue是否解析 PDF 中的表格数据(三大报表通常为表格格式)
extract_financial_ratiosbooleantrue是否自动从报表数据中计算财务比率
output_formatstringmarkdown输出格式:markdown(结构化 Markdown 报告)或 json(原始 JSON 结构)
data_sourcestringauto数据源模式:auto(优先 TextIn → 降级 Mock)、textin(强制 TextIn 真实模式)、mock(演示/测试模式)
⚙️ 处理流程
1
📎 PDF 链接接收与验证
验证 file_url 为有效 HTTP/HTTPS 链接,确认指向 PDF 文件。Mock 模式下使用预设的示例财报数据。
2
🔗 TextIn API 解析
调用 TextIn OCR/PDF 解析接口,将 PDF 内容提取为结构化文本。支持表格识别(table OCR)功能。
3
📋 表格识别与提取
从解析结果中识别表格结构,定位资产负债表、利润表、现金流量表三大报表的表格区域。使用正则匹配与语义分析判断报表类型。
4
🧮 财务数据提取与计算
从各报表表格中提取关键财务数据:资产总额、负债总额、营收、净利润、经营现金流等。如开启 extract_financial_ratios,自动计算 ROE、毛利率、资产负债率、流动比率等。
5
✅ 数据质量评估
评估提取数据的完整性和一致性:检查关键字段是否缺失、计算是否平衡(资产=负债+权益)、跨表数据是否一致。
6
📤 结构化输出
按 output_format 格式输出完整的分析结果,包括资产负债表摘要、利润表摘要、财务比率分析、数据质量评估、简要投资评价。
📡 数据源模式
🟢 auto(默认)

优先调用 TextIn API 进行真实 PDF 解析。
如果 API 调用失败(网络错误 / 授权失效 / 解析超时),自动降级到 Mock 模式,确保插件始终能返回可用结果。
推荐生产环境使用。

🔵 textin(强制真实)

强制调用 TextIn API,不降级。
适合调试或需要真实数据审计的场景。
如果 API 调用失败,插件直接返回错误信息,不会使用 Mock 数据。

🟡 mock(演示/测试)

使用插件内置的预设财报数据,不发起任何外部 API 调用。
适合插件开发和调试阶段的快速验证,以及没有真实 PDF 链接时的功能演示。
预设包含贵州茅台 2024 年年报的完整 Mock 示例数据。

📤 输出内容

插件返回的结构化报告包含以下内容:

资产负债表摘要
  • 总资产
  • 总负债
  • 股东权益
  • 资产负债率
  • 流动资产 / 流动负债
利润表摘要
  • 营业收入
  • 营业成本
  • 营业利润
  • 净利润
  • 毛利率 / 净利率
财务比率分析
  • ROE / ROA
  • 流动比率 / 速动比率
  • 营业利润率
  • 经营现金流 / 净利润
  • 资产负债率
数据质量评估 & 投资评价
  • 关键字段完整度(百分比)
  • 会计等式平衡校验结果
  • 数据质量等级(优秀/良好/一般/低)
  • 简要投资评价(定性结论)
📝 输出格式说明
📋 Markdown 格式(默认)
## 资产负债表摘要 | 项目 | 金额(亿元) | |------|------------| | 总资产 | 2,720.0 | | 总负债 | 491.0 | | 股东权益 | 2,229.0 | | 资产负债率 | 18.1% | | 流动比率 | 3.4 | ## 利润表摘要 | 项目 | 金额(亿元) | |------|------------| | 营业收入 | 1,506.0 | | 营业成本 | 120.0 | | 营业利润 | 1,010.0 | | 净利润 | 802.0 | | 毛利率 | 92.0% | | 净利率 | 53.3% | ## 财务比率分析 - ROE: 36.0% - ROA: 29.5% - 流动比率: 3.4 - 营业利润率: 67.1% ## 数据质量评估 - 完整度: 95% - 平衡校验: ✅ 通过 - 质量等级: 优秀 ## 简要投资评价 - 财务健康,盈利能力极强...
📦 JSON 格式
{ "report_type": "annual", "company": "贵州茅台", "balance_sheet": { "total_assets": 2720.0, "total_liabilities": 491.0, "equity": 2229.0, "debt_ratio": 18.1, "current_ratio": 3.4 }, "income_statement": { "revenue": 1506.0, "cost": 120.0, "operating_profit": 1010.0, "net_profit": 802.0, "gross_margin": 92.0, "net_margin": 53.3 }, "ratios": { "roe": 36.0, "roa": 29.5, "operating_margin": 67.1 }, "quality": { "completeness": 95, "balance_check": true, "grade": "excellent" } }
🧪 测试结果 · Mock 模式示例(贵州茅台 2024 年报)
项目
解析模式Mock 演示模式(预设数据)
报表类型年度报告(2024 年)
资产负债表总资产 2,720.0 亿 · 总负债 491.0 亿 · 股东权益 2,229.0 亿 · 资产负债率 18.1% · 流动比率 3.4
利润表营收 1,506.0 亿 · 营业成本 120.0 亿 · 净利润 802.0 亿 · 毛利率 92.0% · 净利率 53.3%
财务比率ROE 36.0% · ROA 29.5% · 营业利润率 67.1%
数据完整度95%
平衡校验✅ 通过
质量等级优秀
📌 结论:财报 PDF 解析插件在 Mock 模式下成功模拟了从 PDF 链接解析到结构化报告输出的完整流程。资产负债表、利润表、财务比率计算、质量校验全部正常运作。数据完整度 95%,会计等式平衡校验通过。

🔗 真实模式:接入 TextIn API 后,用户只需提供任意上市公司财报的公开 PDF 链接(如上海证券交易所披露的年报),插件即可自动完成全流程真实数据解析。