ヘッダーメニュー

2018/11/15

[便利メモ] 画像中の文字からテキストを抽出できるGoogleドキュメント。



こんにちは!酒井美里です。

今週の記事で登場しました、EPOのツイート


画像のままだと、少し薄暗いし、斜めだし。
「自分が・・・何より自分が読みにくいです!」
と、テキスト化しました。

この時
画像をGoogleドライブに読み込ませて、テキストデータ化(OCR)
という方法を使っています。

・各種フェアで入手した紙資料や、
・Webにあった資料画像 (今回はこれ)
・紙で配付された 業務資料

など、応用範囲が広そうです。

下記に、手順を載せておきますね!
※折り畳みます。



手順
1)画像を用意する(できるだけ鮮明なもの)
2)Googleドライブにアクセス
3)Googleドライブに画像をアップロード(ドラッグ&ドロップ)
4)アップした画像をGoogleドキュメントで開く

こちらの記事を参考にさせて頂きました。


1)画像を用意する(できるだけ鮮明なもの)

今回は、Twitterからダウンロードさせて頂いたこちらの画像を使いました。
(ちょっと暗いけれど、大丈夫でした。もちろん、鮮明な画像がベター)



2)Googleドライブにアクセス

GmailやGoogleカレンダーをご利用でしたら、
おそらく、Googleドライブも使えると思います。

Gmail等にログインすると、画面の右上にGoogleアプリボタンがあります。
アプリボタンからサービスを開くと、Googleドライブのボタンがあります。




3)Googleドライブに画像をアップロード(ドラッグ&ドロップ)



4)アップした画像をGoogleドキュメントで開く


アップした画像から
→ アプリで開く → Googleドキュメント  と進みます。





Googleドキュメントで開いた状態です。
元画像の貼り付けられた文章が表示されて、
下の方に、OCRテキストが追加されています。


元画像が、「少し暗め」の「表」なのですが、
列ごとにOCRされていて (→Excelに転記しやすかったです。)
OCR精度も、悪くはありませんでした。(→キーボードでの修正は2箇所ほどでした)


今回のOCR結果はこちらです!
→ [CN] 2018年現在 入手可能な中国特許情報の範囲(EPOPIC2018)

それでは!




「Excel/Googleドキュメント関連の小技集」に関連する目次記事はこちら









■ご案内■

0 件のコメント:

コメントを投稿