検索メモです。
GooglePatentsの検索結果(詳細表示)に、見慣れない「単語切り出し」的な表示が増えておりました。本文表示の一番下 Concepts という項目です。(2019年12月現在、古い公報ではConcepts表示がないものもあります)
機械抽出、と書いてありますね。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg0ZhInK6liE5NxAiXDxVtFy3G_1ru58dS3JEDnE_Aob_bnKt-l9kvM07G0JHkxhSn4Uvv8wNP3pRlHcYRJeVSwoKOShNdutrB0_zLNs-ZZxcnW0qs1iFDzDwje79iLulATKjyTQQuYyDl3/s1600/2019-12-17_15h32_52.png)
そして、単語をクリックすると「上位概念(Broader)」「下位概念(Narrower)」が展開されます。Search/Add Query で検索に使うこともできます。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgHx_MCU0CMFM6bEjKn-h957mr_v-BaQq5cWE2P5AGPn2obj9w_q0gqTkieNJ2SaRe9-mxNk4dZSKCYC1iovgqtfcYIQNLQyYxENNrOEzERTcBEQ-uiOTumf1rj5-3Rki8Q4y4e3uGYYVWN/s1600/2019-12-17_15h33_56.png)
上記の例…
renderingというと「画像の生成、表示」のような意味を真っ先に思い浮かべたのですが、上位概念に表示されているのは「食用油脂の精製」でしょうか…
機械抽出、ちょっと不思議な語も拾っていそうな印象ですね。
また、化学物質の場合は少し様子が違うようで
下記は「カフェイン」が機械抽出されている箇所なのですが
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgtXzb1lgFhMykW82xcKsQ5huSgMF3n_DyalSTDRo37_zTim-J-nTqvdm3cjjHMxiQ_KWdmBHFvPFoVyP6ykxwTxS_F6EAIWk1yLnN5UBe71k27ME53wNbsNqlH-3vB97OAFtrPYhXe05TW/s1600/2019-12-17_15h50_37.png)
Pubchemへのリンクがあったり、
また、
Search / Add to Query を動作させると
カフェイン→(RYYVLZVUVIJVGH-UHFFFAOYSA-N) と変換されました。
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi2-PDJNAbaNhwZ5-aaNancKwDmxXwwDLM05NZ5OWMqqWHkPQjXJZM05cYgqQLAY6S6XlT8rsNVxJAHZ7hBMsrjKOcEFkiBg70h0bIlFi-WYG221a3dhvwlQaW0QDUWTmcYmxkwTtvV1-kI/s1600/2019-12-17_15h53_04.png)
これは・・・InChIKeyですね。
InChIKeyはWIPOのPatentScopeでも使えるコード。
今回、Googleが独自に機械抽出と紐付けを行ったのか、
WIPOとデータ共有したのかは不明ですが、
いずれにしても、特許データとInChIKeyの紐付けが進んでいる印象を受けました。
また「レンダリング」のような自然語は
複数分野で使われる可能性を排除しにくいですが、
(単語が1つ:意味が複数)
物質名などは、別名が多かったりするものの
特定の物質に紐付けやすくて、機械処理と相性が良いのかも・・・しれません。
(単語が複数:意味(例:物質)はひとつ)
それでは^^
0 件のコメント:
コメントを投稿