JAPAS: 日本語特許サポート要件抽出のためのベンチマーク

Abstract

特許文献の効率的な分析は、技術開発や知的財産保護において不可欠である。特許分析における重要なタスクの一つに、明細書が請求の範囲を十分に説明しているか(サポート要件)の検証がある。この検証は高度なドメイン知識と多大な労力を要するため自動化が望まれているが、(1) 公開されたベンチマークの不在、(2) 既存研究が語彙マッチングに依存し意味的等価性を捉えられない、という 2 つの課題が存在した。本研究では、これらを解決するために、日本語特許を対象に 2,000 件以上の手動アノテーションを付与したデータセット「JAPAS」を構築し、テキスト埋め込みや大規模言語モデルを用いたベースラインを確立した。

Publication
言語処理学会第32回年次大会 (NLP2026)

Add the full text or supplementary notes for the publication here using Markdown formatting.