GoogleドキュメントでPDFまたは画像からテキストを抽出する

Googleドキュメントでは、目立たせることなく、オンラインアプリケーションに新しい機能を追加し続けています。
したがって、(Googleドライブで)任意のタイプとサイズのファイルをアップロードする機能を追加した後、非常に興味深いノベルティを追加しました。これは、 簡単な言葉で、pdfまたは画像からテキスト抽出できるOCR機能です。
したがって、職場でも日常生活でも、スキャンした画像と保護されたpdfドキュメントからテキストをキャプチャできることがどれほど有用であるかが明らかになります。
たとえば、理論的には、スキャナーを使用してコンピューターに本を保存し、テキストを抽出して修正するか、すでに作成されたドキュメントを取り、修正してリサイクルすることができます(ただし、著作権保護されたドキュメントからコピーして貼り付けるには注意してください)。
ドキュメントでOCR機能を有効にするには 、Googleドライブの設定に移動し、一般オプションで[ アップロードを変換]を有効にします。
この時点で、PDFまたはテキストを含む画像をGoogleドライブにロードし、ファイルのリストに表示されたら右ボタンでそれを押し、 [開く ]オプション-Google Docsを使用ます。
PDFまたは画像は元の形式では読み込まれません(元の形式にするには、上記の変換オプションからフラグを削除する必要があります)。代わりに、Googleドキュメントツールで直接編集できるテキストシートになります。
テキストファイルは、コンピューターのpdfファイル、Wordファイル、txt、RTF、またはOpenOfficeで再び保存できます。
明らかに、PDFをアップロードしてテキストを抽出すると、フォント、斜体、太字の設定が残っていても段落の書式設定が失われます。
ただし、紙の本を最初から書き直すことなく、コンピューターにすばやく簡単に持ち込む方法はまだあります。
あるいは、スキャナーからの画像、ファックス、pdfをテキストに変換する他のOCRプログラムがあり、pdfファイルはいくつかの無料ソフトウェアで編集できることを覚えておいてください。
最後に、Googleドキュメントでは、Google翻訳サービスのおかげで、ある言語から別の言語へのテキストの翻訳も行えることを思い出したかったのです。
このオプションは、Word、PDF、Excel、またはPowerPointドキュメントを開くときにツールメニューにあります。

コメントを残します

Please enter your comment!
Please enter your name here