ヘッダーメニュー

掲示板

出張・講習・オンライン配信など  🔹最新スケジュールはこちら 
オンライン配信は🔹Facebookで (録画有) どなたでも閲覧可 / フォローお気軽に
毎週水曜日配信。メールマガジンご登録は 🔹こちら
匿名質問箱!酒井に聞いてみよう。回答は動画配信・ブログで 📪質問BOX 



代行調査依頼  💡2020年9月度の調査受付中。最短納期10月下旬
🔰はじめての調査依頼ガイド
無効資料調査用に整理すると良いこと   📧問合せフォーム
✔侵害予防調査用に整理すると良いこと   🚩調査料金表

検索式の作成とチェック
✔検索式作成(オンサイト/Web会議)  📧問合せ 🚩料金表
式の良い点・改良点のコメントをお返しします。 ✔検索式チェック

2020年度 出張講習 受付状況  💡オンライン研修 体験説明会開催中 (無料)
📆出張講習スケジュール(2020年度) 📧講習問合せ 🚩講習料金表
🚩オンライン講習・オンラインコンサルティング料金表


2013/12/03

[JP]自然文検索の本質とは[過去記事]


Source : Pinterest

※この記事は旧・アメーバブログからの抜粋・編集版です。

概念検索、あるいは自然文検索って・・・
検索ロジックが、ブラックボックスになっているシステムが多く
なんだか、不思議な感じがしませんか? (私だけ?)

「どうして、それらしい答えが出るのかな~?」 と。

数ヶ月前のこと。
システム系に強い先輩が、
自然文検索の本質を、端的に説明されてました。

かなり、大事な事だと思ったので
紹介させていただくと・・・・


自然文検索(概念検索)の本質って、先輩いわく

検索そのものはOR演算。
表示に工夫して、高級そうに見せているもの。

なのだそうです。


「高級そうに見せる」方法には、次のようなものがあります。



・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

・10個の入力語中、10個全部を含む公報が上位表示され、
9個、8個、7個 ・・・・ と、順位が下がっていく。

・入力語に重み付けをし、スコアの高い語を含む公報が
上位表示される

・入力語が、明細書中の近い場所に固まっていると、
スコアが上がる

・国際分類等のデータを加味する
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
※上記はすべて、概念検索のチューニング、と言われるもの。
 「適切と思われる公報を上位表示させる」手法です。


少し言い換えると、

・ 検索自体は、単純なOR演算が基本。
・ 表示の順位付けが、概念検索チックに見える部分。

とも言えます。


概念検索とか、自然文検索、と聞くと、

すっごいAI(人工知能)が働いて、素晴らしい結果を出してくれそう♪

・・・という幻想を抱いてしまう人も、多いんじゃないかな?
と、前出の先輩も言っていました。

私も、全く同感です。

でも、単純に、
「表示に工夫してある、OR演算」
に過ぎないんだから・・・・?と考えると、


ブラックボックスながらも、
上手に使うための「攻略方法」が見えてくるのかも。


それでは!


自然語/統制語に関連する記事








■ご案内■



0 件のコメント: