
こんにちは!酒井美里です →プロフィール
この春、移動に制限のあるお客様もたくさんいらっしゃる中、
せめてネット越しに、何かお役に立てることを・・・と、
オンラインでもご相談を受け付けています。
その中で・・・こちらの記事に登場頂いている方。
いくつか、ご相談を頂いたうちのひとつで
「特許データの集計方法がよくわからない」
というお話がありました。
特許データの集計。
いわゆる「パテントマップの作成」や
「IPランドスケープ」的な分析を目的とした
データ集計のことです。
特許庁の広報誌「とっきょ」でも、
3号連続(43~45号)で、
特許情報解析が取り上げられるほどで、情報解析の広まりを感じます。


ここで、例として
45号の特集から、ひとつグラフを引用します。

この記事、
「パテントマップ用データ」準備の基礎 では
上記のようなグラフ(パテントマップ)を作成したいとしたら、
どんなデータを準備する必要があるか?
どんなデータを準備する必要があるか?
を、逆回しで考えてみたいと思います。
【おことわり】
※以下は「酒井がこの手のデータを準備するなら?」の話です。
※特集記事執筆者の野崎さんは、
※違ったアプローチ、異なるツールを使われているかと思います。
ちょっと長くなりそうなので、記事を折り畳みますね!
さて・・・この種のグラフを作成する場合
私だったら、Excelの集計表を使います。
このような▼感じです。

自分が集計表を作る時は、集計専用ソフトを使っていますが

Excel得意な方は、ピボットテーブルでも良いですよね!
そして・・・
今回頂いたご質問
「特許データの集計方法がよくわからない」
の中には、
2つのトピックがありました。
1)出願人の名寄せの方法は?自動集計などは可能か。
2)「技術内容」に関連する集計項目は、どのように作成するのか。
2)「技術内容」に関連する集計項目は、どのように作成するのか。
それぞれ、概要を書いてみたいと思います。
出願人の名寄せ
ここでいう「名寄せ」とは、
・本来同じ出願人だが、表記ゆれ/社名変更等
何らかの理由で別集計されてしまう名義 (下図参照)や
・別々の出願人だが、まとめて集計したい。
例えばグループ企業など。
を同一名義にまとめて集計することです。

たとえば
上記では「ロツテ」(大きい「ツ」)と
「ロッテ」(ちいさい「ッ」)があるので、
データ上で「ロツテ」→「ロッテ」に検索置換しておくと
まとめて集計ができます。
技術内容の集計
先ほど登場した「Excel上の集計表」
たとえば・・・食品の特許が対象で、
発明に登場するお菓子の種類 を集計すると、
下図のようになった、とします。

この集計の元データはこのような▼状態になっていて
「種類」欄を集計しているのですが・・・

はい!ここでストップです!
先日のご質問・・・
「特許データの集計方法がよくわからない」
このあたりを難しく感じられていた?ご様子で
上記例の「種類」欄で
お尋ねがありました。
答えは ノー です。
通常、このようなデータは特許データベースに含まれていません。
ですので
・特許リストの中に「種類」という列を挿入して
・何らかの方法で、自力で種類欄を埋める。
という作業をします。
この作業が、技術内容の集計用データ準備 です。
古典的には、公報内容を把握してデータを入力します。
ここまで・・・
・名寄せ と
・技術内容の集計用データ準備
の事を書きました。
みなさん、できそうですか? (にっこり)
今、もう少し具体的な手順メモを準備しています。
主な内容は
・Excelで名寄せのスピードアップ
・名寄せデータ作成のちょっとした工夫
・技術内容の集計データ準備方法 ×2種類
どれも、品質とスピードの両立を目指す 酒井流です✨
4月15日(水)のメールマガジンで、
手順メモのファイル配布を予定しています。
配布方法はGoogle ドキュメントのURLです。
弊社メールマガジンは毎週水曜日発行。
酒井のコラムと、
不定期でメルマガ限定ファイルの配布をします。
下記バナーから登録お待ちしています。

■ご案内■
0 件のコメント:
コメントを投稿