ヘッダーメニュー

2019/12/17

[検索メモ] Google Patentsの単語切り出し



検索メモです。

GooglePatentsの検索結果(詳細表示)に、見慣れない「単語切り出し」的な表示が増えておりました。本文表示の一番下 Concepts という項目です。(2019年12月現在、古い公報ではConcepts表示がないものもあります)

機械抽出、と書いてありますね。


そして、単語をクリックすると「上位概念(Broader)」「下位概念(Narrower)」が展開されます。Search/Add Query で検索に使うこともできます。

上記の例…
renderingというと「画像の生成、表示」のような意味を真っ先に思い浮かべたのですが、上位概念に表示されているのは「食用油脂の精製」でしょうか…
機械抽出、ちょっと不思議な語も拾っていそうな印象ですね。


また、化学物質の場合は少し様子が違うようで
下記は「カフェイン」が機械抽出されている箇所なのですが

Pubchemへのリンクがあったり、

また、
Search / Add to Query を動作させると
カフェイン→(RYYVLZVUVIJVGH-UHFFFAOYSA-N) と変換されました。


これは・・・InChIKeyですね。

InChIKeyはWIPOのPatentScopeでも使えるコード。
今回、Googleが独自に機械抽出と紐付けを行ったのか、
WIPOとデータ共有したのかは不明ですが、
いずれにしても、特許データとInChIKeyの紐付けが進んでいる印象を受けました。

また「レンダリング」のような自然語は
複数分野で使われる可能性を排除しにくいですが、
(単語が1つ:意味が複数)

物質名などは、別名が多かったりするものの
特定の物質に紐付けやすくて、機械処理と相性が良いのかも・・・しれません。
(単語が複数:意味(例:物質)はひとつ)

それでは^^

0 件のコメント:

コメントを投稿