ヘッダーメニュー

2020/06/05

【質問BOX】検索項目はどれを選ぶ?よくばりセットの巻





質問BOXに投稿いただきました!
ありがとうございます。

今回はこちらのご質問にお答えしました。

 特許DBでキーワード検索する際、検索対象をどのように考えておられますか?
 すなわち、JP-NETでいうと、キーワード検索対象として、全文、タイトル~請求範囲、技術分野、発明の効果、実施例、などが選択できます。
もちろん、全文を選べば漏れが無くなるのですが、同時にノイズも多くなります。

ヒット<>ノイズ のバランスを考えたとき、検索対象をどのように選んでおられますか?



【回答】 

よくばりセットの巻-適合率と再現率

どれかを選ぶ・・・ではなく
使えるものは全部選ぶ。
それが「よくばりセット」


「全文検索を選ぶと漏れがなくなる代わりに、ノイズが増える」

はい!典型的な「適合率と再現率」の問題ですね^^



一般的に「1つの回答集合」において
適合率と再現率は両立しない、とされています。



ここでのポイントは
「1つの回答集合」です。

1つの集合では適合率か再現率が両立しない、を言い換えると
「どちらか一方しか上げられない」ことになります。


「よくばりセット」とは、適合率を優先する戦術です。



ちなみに再現率を選択すると「人海戦術」になります。




優劣はなくて「リソース配分の問題」だと思うのですけどね!
詳しくは動画でどうぞ^^


 ▽参考資料




ご質問は随時受付!完全匿名です。
▼こちらのフォームからどうぞ。
 https://pro.form-mailer.jp/fms/ada69f1e192184



■ご案内■


0 件のコメント:

コメントを投稿