PDFを文字検索できるようにする方法(MacとWindows)

鈴木楓
更新日 2023年01月11日 Preview 8.2K Preview 0
share it facebook share it Twitter

PDFで直接特定箇所に移動するにはどうしたらいいですか?文書内にリンクがなければ、特定の文字を検索してその場所まで飛ぶのが一番簡単な方法かもしれません。しかし、PDFと一口で言っても、検索できるPDFと、検索できないPDFがあります。スキャンした本や、新聞、学術文献など、このようなPDF文書は文字検索できません。特に数ページのあるPDFを読む時、検索ができないと、読みたい部分を探すのが大変なことになるかもしれません。

では、このようなPDFを文字検索できるようにする、つまり、スキャンしたPDFを検索可能なPDFに変換する方法はありますか?

この記事では、WindowsやMacでスキャンしたPDFを検索可能なPDFに変換する方法を紹介します。Adobe Acrobatを使う方法と使わずにできる方法、有料方法と無料方法など、いろいろな方法を紹介しますので、その中からご自分のニーズに合っているのを選びましょう。

 

紹介方法一覧

製品名称

一括変換

出力品質

変換効率

互換性

価格

Cisdem PDF Converter OCR 無劣化 ハイスピード Mac, Windows

¥5,980/年;
¥8,980/
永久;

Adobe Acrobat Pro DC 無劣化 ハイスピード Mac, Windows ¥1,980/月
¥23,760/年
Kofax Power PDF 5 Standard 高品質 早め Windows $129/永久
=¥19,842
Readiris PDF Standard 無劣化 早め Mac, Windows ¥15,261/年
¥19,885/永久
OCR2Edit プレミアムだけ 一般品質 普通 オンライン 無料
Google Docs × 低品質 普通 オンライン 無料

 

【おすすめ】PDFが文字検索できない理由と解決策

PDFを文字検索する方法

PDFを文字検索するには、まずEdgeやChromeでPDFを開きます。そして「Ctrlキー+F」をタップして特定のテキストを入力します。ハイライトされた検索結果がなければ、このPDFは文字検索できないと断言できます。

PDFが文字検索できない理由は?

検索できるPDFは、画像層とテキスト層との二部で構成されています。テキスト層は文字内容を保存していて、ユーザーが直接文字キーワードを検索できるようになります。

PDFを文字検索できるようにする方法

検索できないPDFの場合、そのPDFはAdobe、Microsoft Officeなどの文書編集ソフトによって作成されたものではない可能性が高いです。例えばスキャンしたPDFの場合、その内容はまったく画像であるため、パソコンが認識できるテキストデータがなく、文字検索もできないです。

それによって、PDFを文字検索できるようにするには、その画像にある文字を識別して、パソコンが認識できるテキストに変換する必要があります。これは、OCR(光学文字認識)と言います。

 

PDFを文字検索できるようにするベスト方法(MacとWindows対応)

PDFを管理する時の一番ソフトは、Adobe Acrobatかもしれません。でも、その値段などによって、Adobeを使っていない方もいると思います。ここでは、Adobeを使わなくてもPDFを編集・文字検索できるようにする方法を紹介します。では、まずMacとWindows対応のPDFのOCRソフトをおすすめします。

Mac/WindowsでスキャンしたPDFを文字検索可能なPDFに変換する方法

PDFを検索可能なPDFに変換するには、Cisdem PDF Converter OCRがおすすめです。専門なPDF OCRソフトで、ネイティブPDFにもスキャンしたPDFにも対応する上、画像を検索可能なPDF、Word、Excel、PPT、Keynote、HTML、Keynoteなどに変換することもできます。そして、文字の書式やレイアウト、画質もできるだけ維持できます。複数のファイルを一括変換できる他、200種以上の言語にも対応しています。

主な特徴:

  • 検索できないPDFを文字検索できるようにする
  • OCR機能で画像を検索可能なPDFに変換したり、編集できるWord、Excel、PowerPointなどに変換したりできる
  • ネイティブPDFを16種の形式(Word、Excel、PowerPoint、HTML、ePub、Keynote、Pages、画像など)に変換する
  • 複数のファイルの一括変換と一括OCRができる
  • 書式やレイアウトが崩れることなく変換/OCRを行う
  • Word、PowerPoint、CHM、ePub、HTMLなどから検索可能なPDFを作成する
  • PDFを作成する時、PDFの圧縮、結合、暗号化などができる

検索できないPDFを文字検索できるようにする操作手順(Macを例に)

  1. 公式サイトでCisdem PDF Converter OCRの無料体験版をダウンロードしインストールします。
    無料ダウンロード   無料ダウンロード
  2. ソフトを起動すれば、直接「Converter」タブで表示されます。PDFをドラッグ&ドロップで追加します。あるいは、「 + 」ボタンを押して追加します。cisdem converter mac
  3. 文字検索できない理由は権限パスワードであるPDFファイルなら、ソフトは自動でプリント・コピー・編集を阻む暗号化を解除します。
  4. ソフトは自動で読み込んだファイルはスキャンしたPDFであるかどうかを探知します。初めてスキャンしたPDFを読み込む場合、ソフトはOCRモジュールをインストールするウィンドウを表示します。「OK」ボタンをクリックします。cisdem ocr module mac
  5. PDFを変換できるオンラインサービスとは違って、CisdemはPDFを変換する範囲を選択できます。全PDF、一部のページか1ページ、好きなように設定しましょう。cisdem ocr pdf mac
  6. OCR項目の中でPDFに含まれている文字の言語を選択します。ここで選択した言語が正確なほど、認識した文字も正しくなります。ソフトは英語、フランス語、ドイツ語、イタリア語、ロシア語、スペイン語、ポーランド語、ルーマニア語、トルコ語、簡体字中国語、ポルトガル語、日本語、チェコ語、ウクライナ語、ギリシャ語、アラビア語、韓国語のPDFファイルをサポートします。「OCR Setting」をクリックして、ファイル言語を選択したら「OK」をクリックします。ここの設定は読み込んだ全てのファイルに適用できます。
    cisdem ocr pdf settings
  7. 「Convert」ボタンを押してMacで検索できないPDFを文字検索できるようにします。

OCRしたファイルは次のように検索できるようになりました。

 

【オンライン】無料サービスで文字検索可能なPDFに変換する方法

ソフトをインストールする必要がなく、オンラインで検索できないPDFを文字検索できるようにするツールもあります。ここでは2つ紹介します。しかし、無料でインストール不要とは言え、色々制限もあります:

  • ネットの調子が悪い時、かなり時間がかかるかもしれません。
  • アップロードできるファイルサイズに制限があります。
  • 機能(入力形式、出力形式、テキスト編集ツールなど)が限られています。
  • ファイルの画質によって変換効果も影響されます。

#1 Online2PDFを使ってPDFを文字検索可能なPDFに変換する

onlineocr、freeonlineocr、newocr、freeocrなど、オンラインでOCRできるサイトが複数ありますが、online2pdfの方が効果がよく、ファイルを管理する機能も備えているため、一番おすすめです。

Online2PDFは、PDF編集、圧縮、暗号化、暗号化解除、結合、分割、変換、OCRなど様々な機能を持つオンラインツールです。そのOCR機能は30種以上の言語に対応していて、複数のファイルを一括変換することもできます。

メリット:
  1. 検索できないPDFを文字検索できるようにする
  2. PDFをWord、Excel、PowerPoint、画像などに変換する
  3. 30種以上の言語を認識できる
  4. 一括変換
デメリット:
  1. 20ページ以内のPDFしか変換できない
  2. 1つのファイルのサイズは最大100MBで、すべてのファイルの合計サイズは最大150MBに制限される
  3. 情報漏洩のリスクがある
  4. 認識できない文字、間違いなどが発生するので手動で修正する必要がある

無料のオンラインサイトで検索できないPDFを検索可能なPDFに変換する操作手順

  1. 「Select files」をクリックしてファイルをアップロードします。
  2. 出力形式を検索可能なPDFと選択し、ファイルの言語を選択します。online2pdf searchable
  3. 「Convert」をクリックしてPDFを文字検索できるように変換します。
  4. 変換後のPDFをパソコンにダウンロードします。

 

#2 Googleドキュメントを使ってPDFを文字検索できるようにする

GoogleドキュメントはGoogleが無料で提供しているサービスで、オンラインでWebブラウザで利用できます。PDFや画像の閲覧や編集ができる他、OCR機能もありますので、スキャンしたPDFや画像から文字テキストを認識できます。Googleドキュメントを利用すれば、検索できないPDFを文字検索できるようにすることができます。

メリット:
  1. PDFと画像を検索可能なPDFに変換する
  2. PDFをWord、ODT、RTF、TXT、HTML、ePubなどに変換する
  3. 100種以上の言語に対応
  4. PDFを編集する
デメリット:
  1. 書式やレイアウトの維持ができない可能性がある
  2. 一括変換できない

Googleドキュメントを使って無料かつインストール不要でPDFを文字検索できるようにする操作手順:

  1. GoogleアカウントにログインしてGoogle Driveにアクセスします。
  2. 「新規」をクリックしてファイルをGoole Driveにアップロードします。
  3. アップロードされたファイルは右のパネルに表示されます。右クリックしてGoogleドキュメントで開きましょう。
  4. 自動的にOCRが行われます。GoogleドキュメントでPDFファイルを検索・編集できるようになります。
  5. 「ファイル」>「ダウンロード」>PDFをクリックします。これで無料でPDFを検索可能なPDFに変換できました。make pdf searchable google drive

 

【無料】ソフトで文字検索可能なPDFに変換する方法

#1 KofaxでスキャンしたPDFを文字検索可能なPDFに変換する方法

Kofax Power PDFは千万人を超えるユーザーに愛用されている多機能なPDF編集ソフトです。PDFを文字検索できるようにするほか、KofaxではPDFの形式変換、フィールドフォーム追加、注釈・ハイライト追加、墨消しと電子署名ができます。さらに、KofaxはiOSとAndroidバージョンを開発しため、プレミアムプランを購入したかたは自由にPDF閲覧・注釈・署名・マークアップ・シェアできます。

Kofaxで検索できないPDFを文字検索できるようにする操作手順:

  1. 「File」「Open」をクリックして、ローカルからファイルを読み込みます。
  2. 「Home」タブで「Make PDF Searchable」をクリックします。make searchable pdf kofax1
  3. ポップアップウィンドウでOCR設定を行います。ここではOCR言語・範囲・検査方法を変更できます。make searchable pdf kofax2
  4. OCRしたあとの検査をサポートするため、文字認識した変な表現を書き直しましょう。
  5. 文字検索できるようになったPDFは検索ツールで簡単にコンテンツを検索できます。make searchable pdf kofax3

 

#2 ReadirisでスキャンしたPDFを文字検索可能なPDFに変換する方法

Windowsユーザーには、Readiris PDF Standardもおすすめです。書式やレイアウトを維持するまますべてのPDFを検索/編集できるPDF、Word、Excel、ODT、ePub、Audioと画像形式に変換できる上、PDFの暗号化、圧縮、ページ管理などもできます。また、このソフトは直接スキャナーにつながってスキャンしたPDFを追加できます。

Windowsで検索できないPDFを文字検索できるようにする操作手順:

  1. PDFをソフトに追加します。
    「Scan」をクリックして、紙の文書をスキャナーでスキャンするか、「From File」をクリックして、パソコンからPDFをソフトに追加します。make pdf searchable on windows 01
  2. 出力フォーマットをPDFと設定します。出力フォルダやファイル名の設定も行います。make pdf searchable on windows 02
  3. PDFを文字検索できるように変換します。make pdf searchable on windows 03
  4. 変換後の検索可能なPDFをWindowsパソコンに保存します。

 

#3 Microsoft OneNoteでスキャンしたPDFを文字検索可能なPDFに変換する方法

お金を払う前に、まずは無料方法を試してみるのもいいと思います。フリーソフトで問題を解決できるなら、有料ソフトを購入する必要もありません。

Microsoft OneNoteはメモ用ソフトで、複数のデバイスの情報を簡単に集められます。そして、OCR機能も内蔵しているため、PDFや画像などからテキストをコピーする、文字検索できるようにするなどのことができます。

フリーソフトを使って検索できないPDFを文字検索できるようにする操作手順

  1. Microsoft OneNoteを起動し、新しいOneNoteファイルを作成します。
  2. 「Insert」>「File Printout」をクリックしてPDFファイルをロードします。make pdf searchable onenote 01
  3. PDFファイルを右クリックして、「Copy Text from This Page of the Printout」を選択すれば、OneNoteはそのPDFファイルに機能します。make pdf searchable onenote 02
  4. 検索可能になったPDFのテキストをコピーしてメモに貼り付けます。

 

【Adobe】Acrobatの場合、PDFを文字検索できるようにする方法

Adobe Acrobatのユーザーの場合、わざわざ他のソフトや方法を探す必要はありません。Adobe AcrobatはOCR機能を内蔵していて、検索できないPDFを自動的に認識し文字検索できるようにすることができます。

Adobe Acrobatを使ってPDFを検索可能なPDFに変換する操作手順:

  1. Adobe Acrobat(Adobe Acrobat Pro DCなど)でスキャンしたファイルを開きます。
    そのファイルはスキャンしたPDFの場合、直接Adobeで開いてください。
    そのファイルは画像の場合、Adobeを起動し、ウィーザードで「PDF作成」をクリックして、画像ファイルを選択すればOKです。import pdf to adobe mac
  2. 「Tools」>「Enhance Scans」>「Recognize Text」>「In This File」をクリックします。
    「Recognize Text」をクリックすればAdobeはOCRを行い始めます。recognize text with adobe
  3. ファイル>保存をクリックすれば、検索できないPDFは検索可能なPDFに変換されました。make pdf searchable with adobe 03

豆知識:Adobe Acrobat Reader DCでPDFを文字検索できるようにすることはできるか?

いいえ、できません。

ネイティブPDFの場合、Adobe Acrobat Reader DCを使ってPDFの閲覧や検索ができますが、検索できないPDFの場合、Adobe Acrobat Reader DCを使ってそれを検索可能なPDFに変換することができません。Adobe Acrobat Reader DCは、PDFの閲覧、署名、コメント、ハイライトなどしかできません。OCR機能を利用するには、Adobe Acrobatを購入する必要があります。

 

おまけ:MacのプレビューでPDFを検索可能なPDFに変換することはできるか?

いいえ、できません。

MacのプレビューでPDFを開き、Command+Fキーを押して文字を検索することができますが、そのPDFは文字検索できないPDFである場合、それを検索可能なPDFに変換することができません。プレビューにはOCR機能がないため、スキャンしたPDFや画像の場合、他の方法を使ってそれを検索可能なPDFに変換しなければ、プレビューで文字検索したりできません。

ただし、Macユーザーはテキスト認識表示機能で画像に収められたテキスト・文字をコピー・操作できます。

テキスト認識表示機能では画像にある文字を辞書で検索したり、ネット上で検索したり、他言語に翻訳したりできます。

 

まとめ

検索できないスキャンしたPDFを文字検索できるようにするのはそれほど難しいことではありません。無料方法はいくつかありますが、書式やレイアウトが崩れることなくPDFを検索可能なのに変換したい場合は、専門のソフトを利用する方がおすすめです。

avatar
鈴木楓

本を読み、自分の感想を記録するのは鈴木の趣味です。そのため、Cisdemの編集者になるのは彼女に向いています。PDFの編集・変換方法についての文章を書くことに没頭しています。

Loved the article, share!
コメント (0) 返信する

お名前 *

コメント *

人気記事

書式付き!MacでPDFをEPUBに変換 する方法 MacでPDFをKeynoteに変換する6つの方法(2023年) 読めない漢字を調べる方法【読めそうで読めない漢字の入力法】
ホームページ > PDFを文字検索できるようにする方法(MacとWindows)