1. HOME
  2. ブログ
  3. google driveのフリーOCRが素敵すぎた!実験結果は文字認識率98%!

google driveのフリーOCRが素敵すぎた!実験結果は文字認識率98%!

OCR(Optical Character Recognition)とは

OCRとは、Optical Character Recognitionの略で、光学文字認識の技術を指します。印刷された紙や画像の文字を認識し、文字データに変換してくれる便利機能です。文字データで記録しておきたい紙の原稿等をいちいち手で打ち込むと大変ですが、OCRを使えば、一瞬で文字データに変換できます。この文字認識もAIを使ってまして、膨大な画像データを学んで判別できるようにしています。

最近では、領収書等を文字にして、経費精算処理を簡単にしようという取り組みも浸透してきてますね。

 

googleドキュメント(drive内)の無料OCR使い方

googleでは、このOCRを無料で提供しています!

その使い方はこちらです。

①googleドライブ上にOCRをかけたい画像をアップします。今回、iphoneで撮影した画像をアップしてみました。

②その後、該当ファイルを選択後、マウスの右クリック。出てくるメニューから、「アプリで開く」の中の「Google ドキュメント」を選びましょう!

手順はこれだけです!

 

 

どのくらいの精度で認識してくれるのかをテストしてみました!

識字率結果まとめ

パターン1 名刺

まずは私の名刺を撮影した画像をOCRをかけてみました!

結果はこちら↓

このように最初のページには元画像。次のページにテキストデータが入ります。

弊社のロゴもきちんと認識して、かつ文字サイズも大きくしてくれてますね!おかしくなっていたのは、郵便番号の「〒」マークと、facebookの後ろにある「アカウント」というカタカナ。

それ以外は、全く問題なかったです。ちなみに、私の「邊」の字が、よく間違えられるのですが、正しく認識してますね。

識字率 246文字中6文字ミスで97.56%

 

パターン2 エクセルデータを印刷したもの

今度は、エクセルからプリントアウトした紙を撮影した画像で実験してみます。

元画像はこちら↓

 

結果はこちら↓

最初のタイトル部分に「レンタルオフィスコ」とコが入ってしまっているのと、「初期」の文字の「期」の字がないだけ。あとは、完璧です!すごい!

識字率 390文字中2文字ミスで99.48%

 

パターン3 FAXで届いた書類

ならばと、今度はFAXで届いたデータで実験してみました!

FAXを画像で写真を撮ってみました。そもそも肉眼でも文字が判別できない箇所が結構ありますね。。

 

結果はこちら↓

さすがに、これは難しかったようです。ただ、アクセスの路線名や住所は完璧。きちんと読み取れる文字は、FAXデータで多少乱れていても判別できるようです。この文字データを修正すれば、すぐ使える状態にはできそうではありますね。

そもそも肉眼でも分からない文字が多いので、識字率が出しづらいのですが、ざっくり60%くらいでしょうか。

 

 

まとめ

googleドライブのフリーで使えるOCR機能を解説してみました。使い方は本当に簡単です。識字率も、元の写真がパソコンから印刷されたようなきちんとしたデータ(FAXでない等)であれば、平均98%くらいの識字率でした!

ぜひ使ってみてください!

 

関連記事

 

関連記事

ICTオフィス相談室 最新記事