2009年07月07日

PDFのOCRテキスト認識

「今さら聞けないAdobe Acrobat(アクロバット)& PDF」第三十一回目です。さて今回は、PDFのOCRテキスト認識をご紹介します。

今回の機能


OCRテキスト認識

OCRテキスト認識では、スキャナなどで取り込んだ画像形式のPDF検索可能な文字列として変換させる機能です。

操作方法


1.画像形式になっているPDFファイルを開きます。

ocr01.gif

2.画像形式になっているかどうかは、選択ツールで画面上を選択します。
ページ全体が選択された場合は、画像形式になっています。

ocr02.gif

3.[文書]-[OCRテキスト認識]-[OCRを使用してテキストを認識]
[テキスト認識]ダイアログで、[OK]をクリックします。

ocr03.gif

4.認識が開始されます。

ocr04.gif

5.認識後に選択を行うと以下の画像のように、文字列の選択が行えます。

ocr05.gif

6.文字列として認識ができている場合、[検索]ボックスで検索が行えます。

ocr06.gif

活用法


OCRとして認識することで、検索可能な文字列にすることができます。すばやく検索を行い効率の良いファイル管理の実現PDFの再利用などが行えます。さて次回は、Acrobat.comで複数のファイルを管理・共有するを紹介します。

Ac9training.jpg
posted by エンディー at 09:25
連載:今さら聞けないAcrobat&PDF | コメント(1) | トラックバック(0)
この記事へのコメント
このOCR活用方式にてコピして、一太郎に貼付しているのですが、漢字はほとんど誤字ばかりになってしまいます、もっと精度を上げる方法ありましたら教授願います。
Posted by 奥田安治 at 2011年06月18日 09:33
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック