PDF一括情報抽出

フォルダ内の大量のPDFから、決まった項目だけを抜き出して一覧表にするスキル(分類: ファイル・データ整理

導入手順(3ステップ)

  1. プロジェクト(またはホームディレクトリ)に .claude/skills/pdf-extract/ フォルダを作る
  2. 下のSKILL.mdをコピーして .claude/skills/pdf-extract/SKILL.md として保存する
  3. Claude Codeで「このフォルダの請求書PDFから、発行元と金額と日付を一覧にして」のように頼むと、このスキルの手順で動く

SKILL.md

---
name: pdf-extract
description: フォルダ内のPDFから指定項目を抽出して一覧表にする。「PDFから○○を一覧にして」と頼まれたら使う。
---

# PDF一括情報抽出

## 目的
1つずつ開いて転記していたPDFの情報収集を、一括で一覧表にする。

## 入力
- 対象フォルダまたはPDFファイル群
- 抽出したい項目のリスト(例: 発行元・金額・日付)

## 手順
1. 対象PDFの一覧と件数を確認として提示する
2. 1ファイルずつテキストを読み、指定項目を抽出する
3. 読み取れなかった項目は空欄にし、「要確認」列にファイル名と理由を記録する
4. 結果をCSV(抽出結果.csv)に保存し、要確認件数を報告する

## 出力フォーマット
```
ファイル名, 項目1, 項目2, …, 要確認メモ
```

## 注意点
- 読み取れない値を推測で埋めない。空欄+要確認が正しい挙動
- スキャン画像のPDF(文字が取れない)は、その旨を一覧にまとめて別途報告する
- 金額などの数値は表記のまま抽出し、カンマ除去などの加工は最後にまとめて行う
- 元のPDFは変更・移動しない

使い方:手順・フォーマット・注意点は、ご自身の業務に合わせて自由に書き換えてお使いください。