paper snowflakes / Source : Pinterest
※こちらは旧・アメーバブログ過去記事の再編集版です。
2009-12-02 11:18:38[JP]ハイフン&統一処理のことなど。(2)
先日、「IPDLの分類定義には、現時点(2009.12)で、
ー(長音)と-(ハイフン)が混在している。」
「『コンクリート』だけでキーワード検索して、
安心していると、かなり見落としがありますよ!」
・・・といった、注意点をお伝えしました。
「じゃあ、出願人だったらどうなるの?」
例えば、仮に、
ソニー (長音) と ソニ- (ハイフン/マイナス)
が混ざっているとしたら、やっぱり
出願人=ソニー + ソニ-
で検索しないと、漏れが生じるのか・・・?
という不安が出てきますよね。
では、実際に確認してみましょう。
違いがわかるように、IPDLと商用DBで、比較します。
※ 2009年時点の記事ですが、基本的な動作は変わっておりません。
■ IPDL
公報テキスト検索で調べます。
今回は、件数を絞るために、
「特許公報 (公告、登録)」 のみを対象にしました。
まずは、これをご覧ください。
番号は「特公平08-029623」です。
「ソニ-」と、ハイフンになっているの、わかりますか?
このように、少数ではありますが、
「-(ハイフン)」になっているデータ、確かに存在します。
(ソニー<関係会社含む>の公告・登録では、全体の約0.1%です。)
では、IPDLでは、両者が区別されるのかを確かめましょう。
■ ソニー (長音)だけ ・・・ 34133 件
と、いうことで、
IPDLのテキスト検索の場合は、
長音とハイフンが、区別されている事が、確認できました。
では、次は商用データベースです。
IPDLと同じように、比較してみますよ・・・?
件数、どうでしょうか?
あれ?全部同じですよね!
はい、ここまでかなり引っ張りましたが(笑)
これが 「統一処理」 と言われるもの。
「統一処理」 というのは、
このように、長音とハイフンが混在する場合に、
両者を同一視して検索できるようにするための、
処理・仕組み の事を言います。
※細かく言うと、統一処理にも2つの方法があります。
その事はまた、機会があれば。
商用データベースは、
ほとんどの製品で、統一処理がされていて、
「ソニー(長音)」と、普通に検索をしたら、
ハイフン組もヒットするので、安心です。
こういう部分は、
「商用データベースならでは」の利点ですね!
他に、よく統一処理されているのは、
小さい「っ」 と 大きい 「つ」 とか、
小さい「ゃ」 と 大きい 「や」 などです。
出願人だけでなく、
本文中の語句も、統一処理されている事が多いです。
(例 : コンピュータ と コンピユータ とか。)
同じ「商用データベース」という括りでも、
製品によって、
統一処理の対象や方法、味付け(?)など、微妙に違います。
お使いのデータベースは・・・どんな統一処理が加わってますか?
興味のわいた方は、一度、確かめてみてはいかがでしょうか。
別窓で登録フォームが開きます
0 件のコメント:
コメントを投稿