PDF一括情報抽出
フォルダ内の大量のPDFから、決まった項目だけを抜き出して一覧表にするスキル(分類: ファイル・データ整理)
導入手順(3ステップ)
- プロジェクト(またはホームディレクトリ)に
.claude/skills/pdf-extract/フォルダを作る - 下のSKILL.mdをコピーして
.claude/skills/pdf-extract/SKILL.mdとして保存する - Claude Codeで「このフォルダの請求書PDFから、発行元と金額と日付を一覧にして」のように頼むと、このスキルの手順で動く
SKILL.md
--- name: pdf-extract description: フォルダ内のPDFから指定項目を抽出して一覧表にする。「PDFから○○を一覧にして」と頼まれたら使う。 --- # PDF一括情報抽出 ## 目的 1つずつ開いて転記していたPDFの情報収集を、一括で一覧表にする。 ## 入力 - 対象フォルダまたはPDFファイル群 - 抽出したい項目のリスト(例: 発行元・金額・日付) ## 手順 1. 対象PDFの一覧と件数を確認として提示する 2. 1ファイルずつテキストを読み、指定項目を抽出する 3. 読み取れなかった項目は空欄にし、「要確認」列にファイル名と理由を記録する 4. 結果をCSV(抽出結果.csv)に保存し、要確認件数を報告する ## 出力フォーマット ``` ファイル名, 項目1, 項目2, …, 要確認メモ ``` ## 注意点 - 読み取れない値を推測で埋めない。空欄+要確認が正しい挙動 - スキャン画像のPDF(文字が取れない)は、その旨を一覧にまとめて別途報告する - 金額などの数値は表記のまま抽出し、カンマ除去などの加工は最後にまとめて行う - 元のPDFは変更・移動しない
使い方:手順・フォーマット・注意点は、ご自身の業務に合わせて自由に書き換えてお使いください。