ヘッダーメニュー

2020/04/06

「パテントマップ用データ」準備の基礎



こんにちは!酒井美里です   →プロフィール

この春、移動に制限のあるお客様もたくさんいらっしゃる中、
せめてネット越しに、何かお役に立てることを・・・と、
オンラインでもご相談を受け付けています

その中で・・・こちらの記事に登場頂いている方。
いくつか、ご相談を頂いたうちのひとつで
「特許データの集計方法がよくわからない」
というお話がありました。



特許データの集計。
いわゆる「パテントマップの作成」や
「IPランドスケープ」的な分析を目的とした
データ集計のことです。

特許庁の広報誌「とっきょ」でも、
3号連続(43~45号)で、
特許情報解析が取り上げられるほどで、情報解析の広まりを感じます。
 

ここで、例として
45号の特集から、ひとつグラフを引用します。



この記事、
「パテントマップ用データ」準備の基礎 では

上記のようなグラフ(パテントマップ)を作成したいとしたら、
どんなデータを準備する必要があるか?

を、逆回しで考えてみたいと思います。

【おことわり】
※以下は「酒井がこの手のデータを準備するなら?」の話です。
特集記事執筆者の野崎さんは、
※違ったアプローチ、異なるツールを使われているかと思います。


ちょっと長くなりそうなので、記事を折り畳みますね!




さて・・・この種のグラフを作成する場合
私だったら、Excelの集計表を使います。
このような▼感じです。



自分が集計表を作る時は、集計専用ソフトを使っていますが


Excel得意な方は、ピボットテーブルでも良いですよね!


そして・・・
今回頂いたご質問
「特許データの集計方法がよくわからない」

の中には、
2つのトピックがありました。

1)出願人の名寄せの方法は?自動集計などは可能か。
2)「技術内容」に関連する集計項目は、どのように作成するのか。

それぞれ、概要を書いてみたいと思います。

出願人の名寄せ

ここでいう「名寄せ」とは、
・本来同じ出願人だが、表記ゆれ/社名変更等
何らかの理由で別集計されてしまう名義 (下図参照)や

・別々の出願人だが、まとめて集計したい。 
例えばグループ企業など。 

を同一名義にまとめて集計することです。



たとえば
上記では「ロツテ」(大きい「ツ」)と
「ロッテ」(ちいさい「ッ」)があるので、

データ上で「ロツテ」→「ロッテ」に検索置換しておくと
まとめて集計ができます。


技術内容の集計

先ほど登場した「Excel上の集計表」

たとえば・・・食品の特許が対象で、
発明に登場するお菓子の種類 を集計すると、
下図のようになった、とします。




この集計の元データはこのような▼状態になっていて
「種類」欄を集計しているのですが・・・




はい!ここでストップです!

先日のご質問・・・
「特許データの集計方法がよくわからない」

このあたりを難しく感じられていた?ご様子で



上記例の「種類」欄で
お尋ねがありました。

「データベースから、CSV形式などで出力できるものですか?」

答えは ノー です。
通常、このようなデータは特許データベースに含まれていません。

ですので
・特許リストの中に「種類」という列を挿入して
何らかの方法で、自力で種類欄を埋める

という作業をします。

この作業が、技術内容の集計用データ準備 です。
古典的には、公報内容を把握してデータを入力します。



ここまで・・・
・名寄せ と
・技術内容の集計用データ準備
の事を書きました。

みなさん、できそうですか? (にっこり)




今、もう少し具体的な手順メモを準備しています。

主な内容は
・Excelで名寄せのスピードアップ
・名寄せデータ作成のちょっとした工夫
・技術内容の集計データ準備方法 ×2種類 
どれも、品質とスピードの両立を目指す 酒井流です✨

4月15日(水)のメールマガジンで、
手順メモのファイル配布を予定しています。
配布方法はGoogle ドキュメントのURLです。



弊社メールマガジンは毎週水曜日発行。
酒井のコラムと、
不定期でメルマガ限定ファイルの配布をします。
下記バナーから登録お待ちしています。







■ご案内■

0 件のコメント:

コメントを投稿