ヘッダーメニュー

2012/08/02

調査のスタート地点「要約」その2~基本の検索スキル3

photo credit: ecstaticist via photo pin cc

初級講座内容の全貌を公開するシリーズ、3回目です。

今日は 「テーマを要約すること」の2回目。
  • なぜ、30字や150字でなく「50字」なのか?検索エンジン的根拠
  • なぜ、練習をショートカットできないのか?
をお送りします。


なぜ、30字や150字でなく「50字」なのか?検索エンジン的根拠

調査対象とする技術テーマを要約するとき、
50字前後というのは案外作りにくい・書きにくい文字数かもしれません。

ただ、この文字数は
 「 特許の検索エンジンと一番相性が良い」 ようなのです。経験則ですが。

# 但し、時折「30字以下が良い」テーマもあります。
  逆に 「100字以上」 になるケースは、ほぼない、と思ってください。
  「30字以下が向いている検索特性」は、ハッキリ決まっていますので、この項目の最後で!

・ 30字前後
→ 要約中で言及できる構成要素の数が少ない。
たとえば  「素子にアモルファスシリコンを使用した太陽電池パネル。(26字)」 のようなレベル。

少ない構成要素で検索するというのは、
 「アモルファスシリコン × 太陽電池パネル」 のような状態。
特徴部分の絞り込みが不足。
件数が多く ・ 検索結果が拡散しやすいので、試し検索がうまくいきにくい。

・ 150字、またはそれを超えるような長文。
→ たとえば、公開公報の「要約文」 のような長さ。文章中で、構成要素としてカウントできる「技術用語」の数が多い。

構成要素の数が多い、ということは、検索でいえば「AND演算の項目が多くなる」ということ。つまり、試し検索でゼロ件になりやすい、意図する技術に近い公報が得にくい、という結果になりやすい。

※ 30字以下 (ほぼ単語だけ) が向く検索

出願件数が少ない、とわかっている分野や、
特別/特殊な部品・材料がないと成り立たない技術などでは、
試し検索を 「単語(技術用語)ひとつ」 で行った方が、うまくいきます。

たとえば 「三方六に関連する特許」 を探すとき  → 三方六は「事前思考8割」シリーズでどうぞ♪

ひとまず50字要約など考えず
 キーワード=バウムクーヘン  と検索した方が、うまくいく事があります、という話です。

※ ここで キーワード=太陽電池、とか キーワード=電気自動車、というのは NG。手抜きはダメですよ~



なぜ「練習を省略できない」のか


本気で検索上達したいなら 「50文字前後で要約」の練習は必須、だと思います。

ただ・・・冒頭述べたように、これって最初はまとめにくい文字数。
単語で言い切るよりは長く、
自由に説明するには、あまりにも短い文字数、
ひとことで言うなら 「中途半端」 なのでしょう。


ごめんなさい!ここは練習あるのみ。

練習のヒントとしては

・ 第三者に、技術の概要が伝わるようにまとめる
  (50文字にまとめてみて、概要がわからないようだと、大抵検索もうまくいかないです・・・)

・ 小学校高学年の子供に、わかるようにするには? と考える

・ この技術が成り立つのに、必要な部品/要素はどれか。
   (逆に、省いても説明が成り立つものは、どんどん省きます。)

・ 「この目的で → この構成にした」 または 「この構成で→ 効果が得られた」 の
   2段階に考える

こんなところですね・・・


あと、前に 「プレゼンと鬼上司」の話を書きましたが、
「自分の手がけている技術/取り組んでいる仕事」 を、50字程度で説明する練習は、ポイントを簡潔に伝える練習にもなるので、「調査の役にしか立たない話」ではない、とも思ってます。



 50字要約に、目的/効果を盛り込むか、否か

うーん。難しく考えなくていいと思います。
「目的/効果」 を盛り込んだ方が書きやすければ、採用。
使わない方が書きやすければ、それでも構いません。

「50字要約で、技術の概要が伝わるか/否か」 で、
検索の基本部分がうまくいくか/否か がほぼ決まるのですが、

ここ、試し検索の前段階です。
試し検索がうまくいくか? と、目的/効果 ってあまり関係ありません。
それより 「文章として理解できるか」 の方が、不思議と検索に影響します。


本検索では、作用効果に相当する検索語を使いにくい場合がありますので、
その段階で、改めて目的/効果 に該当する部分を見直せばOKです。




 
自然文検索(概念検索)のこと

自然文検索(概念検索) を搭載した検索システム、増えております。


日本語の自然文を「質問文」にして、検索をするわけですが・・・
経験上、この「質問文」 を50文字前後にすると、ヒットの確率が上がります。
(あくまでも経験上です。)

自然文検索は、基本の挙動が「OR演算 + スコアリング機能」になっている事が多いので、

・ 短すぎる要約
 →  「OR演算段階」での検索結果(件数)は少なめ。
    入力単語数が少ないので、スコアリングが有効に働かない。

・ 長すぎる要約
 → 「OR演算段階」での検索結果(件数)は多め。
   入力単語数が多いため、特徴語の同定がうまくいかなかったり、
   スコアが競合するような状態・・・になるらしい。(←ここ、推測入ってます)
   結果、きれいにスコアリングできない。

・・・という感じみたいです。
そして、不思議と 50~100字くらいの質問文が、比較的うまくいったりするのです。


自然文検索のチューニングは、ブラックボックスになっている製品が多いので、
「こんな感じ」 レベルのご説明になってしまいましたが、
50~100文字がいい、というのは、経験則で実証できてます。お試しあれ。




基本の検索スキルシリーズ一覧はこちら








■ご案内■



0 件のコメント:

コメントを投稿