Googleドキュメント - OCR機能の使い方

OCRとは光学文字認識のことで、 文字を含む画像を自動的にテキストデータに変換する機能です。

GoogleドキュメントにもOCR機能があり、 「PDF」「JPEG」「PNG」「GIF」形式のファイルをテキストデータに変換できます。

では実際にやってみます。

変換の手順

変換したいファイルを右クリック ⇒ 「アプリで開く」 ⇒ 「Googleドキュメント」をクリック。

「アプリで開く」 ⇒ 「Googleドキュメント」

すると、Googleドキュメントが新しいタブで自動的に開き、テキストデータが表示されています。 (変換量によっては時間がかかる場合もあります)。

OCR変換結果

このように、OCR機能を利用する手順は簡単です。

  • ファイルを右クリック
  • アプリで開く
  • Googleドキュメントを選択

画像ファイルを変換

画像ファイルを変換してみます。

下図は、Yahooのニューストピック一覧を画像にしたものです。ファイルの形式は「PNG」です。

画像

この画像を変換した結果、次のように表示されました。

画像変換結果

動画を示す画像や、カメラを示す画像が文字に置き換わっているのはしょうがないとして、 他は「ANA」を「MA」と誤変換しているだけです。

相当な精度で変換されているのがわかります。

表を変換

表形式になっている画像情報がどのように変換されるかを試して見ます。

下図はYahooの天気表示の部分を画像にしたものです。

表形式の画像

この画像を変換した結果、次のように表示されました。

画像変換結果2

左から右に1行ずつ変換されているようですが、 日付が入れ替わっていたり、漢字が違ったりしていて、精度は今一ですね。

さらに、気温や降水量を示す数値が全く表示されていません。

表形式の変換はまだまだ向上の余地がありそうです。

スポンサードサーチ

シェアする

  • このエントリーをはてなブックマークに追加

フォローする