ヘッダーメニュー

2013/12/20

[過去記事]ハイフン&統一処理のことなど。(2)


paper snowflakes / Source : Pinterest


※こちらは旧・アメーバブログ過去記事の再編集版です。
2009-12-02 11:18:38[JP]ハイフン&統一処理のことなど。(2)



先日、「IPDLの分類定義には、現時点(2009.12)で、
ー(長音)と-(ハイフン)が混在している。」

「『コンクリート』だけでキーワード検索して、
安心していると、かなり見落としがありますよ!」

・・・といった、注意点をお伝えしました。


「じゃあ、出願人だったらどうなるの?」


例えば、仮に、

ソニー (長音) と ソニ- (ハイフン/マイナス)

が混ざっているとしたら、やっぱり



出願人=ソニー + ソニ-
で検索しないと、漏れが生じるのか・・・?



という不安が出てきますよね。

では、実際に確認してみましょう。
違いがわかるように、IPDLと商用DBで、比較します。
※ 2009年時点の記事ですが、基本的な動作は変わっておりません。



■ IPDL
公報テキスト検索で調べます。
今回は、件数を絞るために、
「特許公報 (公告、登録)」 のみを対象にしました。


まずは、これをご覧ください。
番号は「特公平08-029623」です。
「ソニ-」と、ハイフンになっているの、わかりますか?














このように、少数ではありますが、
「-(ハイフン)」になっているデータ、確かに存在します。
(ソニー<関係会社含む>の公告・登録では、全体の約0.1%です。)

では、IPDLでは、両者が区別されるのかを確かめましょう。


■ ソニー (長音)だけ ・・・  34133 件






 


■ ソニ- (ハイフン) だけ ・・・ 36 件






 



■ ソニー+ソニ- (長音+ハイフン) ・・・ 34169件





 


 



と、いうことで、

IPDLのテキスト検索の場合は、
長音とハイフンが、区別されている事が、確認できました。



では、次は商用データベースです。
IPDLと同じように、比較してみますよ・・・?

件数、どうでしょうか?




 


 






あれ?全部同じですよね!

はい、ここまでかなり引っ張りましたが(笑)
これが 「統一処理」 と言われるもの。


「統一処理」 というのは、
このように、長音とハイフンが混在する場合に、
両者を同一視して検索できるようにするための、
処理・仕組み の事を言います。

※細かく言うと、統一処理にも2つの方法があります。
その事はまた、機会があれば。


商用データベースは、
ほとんどの製品で、統一処理がされていて、

「ソニー(長音)」と、普通に検索をしたら、
ハイフン組もヒットするので、安心です。

こういう部分は、
「商用データベースならでは」の利点ですね!

他に、よく統一処理されているのは、
小さい「っ」 と 大きい 「つ」 とか、
小さい「ゃ」 と 大きい 「や」 などです。

出願人だけでなく、
本文中の語句も、統一処理されている事が多いです。
(例 : コンピュータ と コンピユータ とか。)


同じ「商用データベース」という括りでも、
製品によって、
統一処理の対象や方法、味付け(?)など、微妙に違います。


お使いのデータベースは・・・どんな統一処理が加わってますか?
興味のわいた方は、一度、確かめてみてはいかがでしょうか。






別窓で登録フォームが開きます
連絡板 ■少しずつ増えてます → 検索コラム集目次
代行特許調査のお問い合せはこちらからどうぞ
●  講習テキストの販売を始めました。
採用情報 はこちらから。よろしくお願いいたします。

0 件のコメント:

コメントを投稿