ヘッダーメニュー

2013/12/03

[JP]自然文検索の本質とは[過去記事]


Source : Pinterest

※この記事は旧・アメーバブログからの抜粋・編集版です。

概念検索、あるいは自然文検索って・・・
検索ロジックが、ブラックボックスになっているシステムが多く
なんだか、不思議な感じがしませんか? (私だけ?)

「どうして、それらしい答えが出るのかな~?」 と。

数ヶ月前のこと。
システム系に強い先輩が、
自然文検索の本質を、端的に説明されてました。

かなり、大事な事だと思ったので
紹介させていただくと・・・・


自然文検索(概念検索)の本質って、先輩いわく

検索そのものはOR演算。
表示に工夫して、高級そうに見せているもの。

なのだそうです。


「高級そうに見せる」方法には、次のようなものがあります。



・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

・10個の入力語中、10個全部を含む公報が上位表示され、
9個、8個、7個 ・・・・ と、順位が下がっていく。

・入力語に重み付けをし、スコアの高い語を含む公報が
上位表示される

・入力語が、明細書中の近い場所に固まっていると、
スコアが上がる

・国際分類等のデータを加味する
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
※上記はすべて、概念検索のチューニング、と言われるもの。
 「適切と思われる公報を上位表示させる」手法です。


少し言い換えると、

・ 検索自体は、単純なOR演算が基本。
・ 表示の順位付けが、概念検索チックに見える部分。

とも言えます。


概念検索とか、自然文検索、と聞くと、

すっごいAI(人工知能)が働いて、素晴らしい結果を出してくれそう♪

・・・という幻想を抱いてしまう人も、多いんじゃないかな?
と、前出の先輩も言っていました。

私も、全く同感です。

でも、単純に、
「表示に工夫してある、OR演算」
に過ぎないんだから・・・・?と考えると、


ブラックボックスながらも、
上手に使うための「攻略方法」が見えてくるのかも。


それでは!


自然語/統制語に関連する記事








■ご案内■



0 件のコメント:

コメントを投稿