調査力で発明を守り、技術を収益につなげるスマートワークス株式会社: [便利メモ] 画像中の文字からテキストを抽出できるGoogleドキュメント。

こんにちは！酒井美里です。

今週の記事で登場しました、ＥＰＯのツイート

Dramatic changes in the availability of Chinese data and its resources in the recent years. #EPOPIC pic.twitter.com/LgRAchdSq2
— EuropeanPatentOffice (@EPOorg) 2018年11月12日

画像のままだと、少し薄暗いし、斜めだし。
「自分が･･･何より自分が読みにくいです！」
と、テキスト化しました。

この時

画像をGoogleドライブに読み込ませて、テキストデータ化(OCR)

という方法を使っています。

・各種フェアで入手した紙資料や、
・Webにあった資料画像　(今回はこれ)
・紙で配付された　業務資料

など、応用範囲が広そうです。

下記に、手順を載せておきますね！
※折り畳みます。

手順
1）画像を用意する（できるだけ鮮明なもの）
2）Googleドライブにアクセス
3）Googleドライブに画像をアップロード（ドラッグ＆ドロップ）
4）アップした画像をGoogleドキュメントで開く

※こちらの記事を参考にさせて頂きました。

1）画像を用意する（できるだけ鮮明なもの）

今回は、Twitterからダウンロードさせて頂いたこちらの画像を使いました。
（ちょっと暗いけれど、大丈夫でした。もちろん、鮮明な画像がベター）

2）Googleドライブにアクセス

GmailやGoogleカレンダーをご利用でしたら、
おそらく、Googleドライブも使えると思います。

Gmail等にログインすると、画面の右上にGoogleアプリボタンがあります。
アプリボタンからサービスを開くと、Googleドライブのボタンがあります。

3）Googleドライブに画像をアップロード（ドラッグ＆ドロップ）

4）アップした画像をGoogleドキュメントで開く

アップした画像から
→　アプリで開く　→　Googleドキュメント　　と進みます。

Googleドキュメントで開いた状態です。
元画像の貼り付けられた文章が表示されて、
下の方に、ＯＣＲテキストが追加されています。

元画像が、「少し暗め」の「表」なのですが、
列ごとにOCRされていて　（→Excelに転記しやすかったです。）
OCR精度も、悪くはありませんでした。（→キーボードでの修正は2箇所ほどでした）

今回のOCR結果はこちらです！
→　[CN] 2018年現在入手可能な中国特許情報の範囲(EPOPIC2018)

それでは！

□「Excel／Googleドキュメント関連の小技集」に関連する目次記事はこちら□

■ご案内■

調査力で発明を守り、技術を収益につなげる
スマートワークス株式会社

ヘッダーメニュー

2018/11/15

[便利メモ] 画像中の文字からテキストを抽出できるGoogleドキュメント。

0 件のコメント:

コメントを投稿