|
|
| |
| 文章データをさまざまな観点から分析し、役に立つ知識・情報を取り出そうという技術のことです。文書を個別に調べても分からない文書群全体に内在する知識(パターンやトレンド)を発見することを目的としています。 |
|
| オンダ国際特許事務所で使用している分析ツールの場合、特許情報のテキスト部分から単語を抽出し、頻度集計、複合語構成、係り受け(主語・述語、修飾語・被修飾語等の関係)を解析します。例えば「○○性、○○効率、○○能力、○○向上」等のパターンを解析し、○○を『発明の課題』と位置づけます。そして「△△装置、△△方法、△△手段、△△システム」等のパターンから、△△を『発明の対象』と認識します。発明の課題・対象の他に、書誌情報・キーワード・引用情報等、多面的に特許情報を分析し母集合に内在する知識の発見を行います。 |
|
|