読めない漢字を調べる方法【読めそうで読めない漢字の入力法】

鈴木楓
更新日 2024年06月26日 Preview 63 Preview 0
share it facebook share it Twitter

読書よくしている方は読めない漢字が出てくる時どうしますか。

漢字はローマ字とは全然違って、その書き方から読み方がわかりません。

こういう問題は漢字ORC(光学文字認識)ソフトで簡単に解決できます。今回の記事を書くため、我々はほとんどのORCソフトを使ってみました。ここでは無料・有料問わずにランキング8のソフトをみなさんにご紹介します。記事を読んで、好きなツールで読めない漢字を入力して調べましょう。

 

読めない漢字をどう調べられますか

読めない漢字は簡単に入力できませんが、OCRソフトで認識したら、パソコンに入力できるようになれます。ただし、漢字はローマ字と違って、複雑で何万個もあります。もし漢字の認識データを引き続き取り入れていなかったら、漢字はローマ字として認識されるかもしれません。次は誤認になるいくつかの原因です。

字数の違い - 英語のアルファベットはただ26個ある一方、常用漢字は2000個あり、本の中でよく見られる字は3000個という高い数になります。

複雑な形 - 字数が多い他、漢字の形も複雑です。特に「主」・「王」・「玉」のような極似ている漢字も多くあることで、間違った字として読み取られることになります。

新字体 vs. 旧字体 - さらに、古い本なら、旧字体の感じもよく見られます。こうしたことで、同じ字でも二倍の訓練を受けなければ精度の高い結果を得ることが不可能です、

こんなに難しいことでも、それができる漢字OCRソフトがいくつかあります。

 

【おすすめ】Mac・Windowsでの一番の読めない漢字認識・入力ソフト

画像・PDFから漢字を認識して入力するなら、一番の解決策は専門的な漢字OCRソフトです。こういうソフトでは精度の高いを得られる他、モジュール・拡張機能で他のPDF編集・変換もできます。

使いやすさ・精度・出力形式数・一括認識機能という面の比較からみると、我々はCisdem PDF OCR Converter OCRが一番だと思います。このソフトではローカルのPDF・写真をWord、Excel、PPTX、ePub、Text、HTMLを含む15+の形式に変換することができます。

さらに、Cisdemは15+種類の言語をサポートします:日本語・韓国語・中国語など。それなので、漢字の認識にはとても専門的です。

漢字なら、文庫本・単行本・古籍・申込書・手紙、どこからも認識できます。Cisdemでは簡単に漢字を含むテキストを文字化できます。

今までのOCRソフトと違って、Cisdemは漢字の変体も認識できます。99%の精度はほとんどのOCRツールより優れています。

スキャンしたPDFファイルがあったら、このソフトでOCRして、検索できるようになります。嗣ごはsの手順です。

PDFの漢字を認識する手順

  1. Cisdem PDF Converter OCRをダウンロードしてインストールします。
    無料ダウンロード macOS 10.13 or later  無料ダウンロード Windows 11/10/8/7
  2. 撮った写真・スキャンしたPDFファイルを読み込みます。
    個別や複数の写真・PDFファイルを読み込んで認識します。
    ドラッグ&ドロップや「+」ボタンをクリックして読み込みます。chinese ocr 01
  3. OCRモジュールをダウンロードします。
    初めてPDFや画像ファイルを読み込むばいい、アドバンスOCRモジュールのダウンロードウィンドウが表示られます。ocr module mac
  4. OCR設定をします。
    PDFのOCRだけをしたいなら、出力形式を「OCR PDF」にします。他の形式にしても、Cisdemは自動でOCRプロセスを行います。chinese ocr cisdem 02
  5. 言語を選択します。
    歯車アイコンをクリックして、「Japanese(日本語)」・「Chinese(Simplified)(簡体字)」・「Chinese(Traditional)(繁体字)」を需要に応じて選択します。chinese ocr cisdem 03
  6. PCで漢字OCRを行います。
    「Convert」をクリックして、漢字OCRを行います。ソフトは自動でファイルの漢字を認識して、編集できる文字ファイルを出力します。

注意: 暗号化された漢字PDFを文字化する場合、ロックアイコンをクリックしてパスワードで解除したり内蔵のパスワード解除ツールを使ったりする必要があります。

 

無料で読めない漢字を入力できるオンラインツール

精度と安全性を保証したいなら、専門的な漢字OCRソフトが一番ですが、もしテキストの少ない漢字ファイルやただ数回の認識のみなら、無料のツールでもよく役割を果たします。

#1 Googleサービスで漢字OCR

Googleは周知の通り、生産性向上のオンラインサービスを数多く提供しています。その中で、クラウドディスクGoogle Driveに内蔵されているGoogle Docsはファイルに打開・変換・OCRができます。つまり、Google Docsでは漢字のあるPDF・写真を無料で認識できます。

  1. Googleアカウントをログインして、Google Driveを開きます。google account
  2. 「アップロード」やドラッグ&ドロップすることで漢字PDF・写真をGoogle Driveにアップロードします。
  3. アップロードしたファイルを右クリックして、Google Docsでファイルを開きます。Google Docsは自動で開くファイルをOCRします。chinese ocr google
  4. (選択) 漢字OCRの結果を確認して、校正します。
  5. 「ファイル」 > 「ダウンロード」を選択して、好きな形式としてダウンロードします。chinese ocr google 03

Google漢字OCRの特徴:

  • PDFと画像(JPG, GIF, PNG, BMP)ファイルの文字化をサポートすること。
  • 精度の問題があるので確認する校閲することが必要なこと。
  • 現代でない印刷物のOCR結果がよくないこと。
  • 一括OCR機能がないこと。
  • 機密情報漏洩のリスクがあること。

#2 Convertioサービスで漢字OCR

Convertioもオンラインで漢字のPDF・写真を無料で文字化できます。もともとはオンライン変換サービスであるConvertioは高度なOCR技術で編集できる漢字ファイルの作成にも使えます。特にサポートする形式も数多くあります。ただし、主要な言語をほとんどサポートしていても、Google Docsより少ないです。

  1. Convertio OCRに訪問します。
  2. DropboxやGoogle DriveのようなクラウドディスクやローカルからPDF・写真をアップロードします。
  3. ファイル言語(日本語・中国語)を選択します。そして出力形式をPDFや他の編集できる形式にして変換範囲を選択します。convertio chinese ocr
  4. 認識ボタンをクリックして、読めない漢字を入力しましょう。

Convertio OCRのデメリット:

  • 無料で使えるのは10ページだけであること。
  • 認識結果がよくないこと。
  • 情報漏洩のリスクがあること。

 

オフラインで読めない漢字を認識・入力するソフト

オンラインツールはとても便利ですが、安全・安定・安易の面ではデスクトップが一番かもしれません。次は二つの一番OCRソフトをみなさんにご紹介します。

#1 PDF OCR X(Community Edition)で漢字OCR

PDF OCR X Community EditionはMac・Windowsで通用できる無料の漢字OCRソフトです。使いやすくて軽量な一方、このソフトではスキャンしたPDFを編集できるようにOCRできます。ちなみに、このソフトは60+種類の言語をサポートします。

オフラインツールを使って無料で漢字PDFを認識する手順

  1. ドラッグ&ドロップしてPDFファイルをPDF OCR Xに取り入れます。chinese ocr mac1
  2. OCR変換設定(OCR conversion settings)で、出力形式を「searchable PDF(検索できるPDF)」や「Plain text(テキストファイル)」にします。ここでは出力クオリティや変換クオリティも設定できます。,chinese ocr mac2
  3. 最後に、変換ボタンをクリックして、読めそうで読めない漢字を認識しましょう。

PDF OCR Xの問題:

  • 一回に一ページのPDFや写真だけを変換できること。
  • レイアウトが崩れること。
  • 一括変換したい場合はプロバージョンを講中しなければできないこと。

#2 OneNote OCRで漢字OCR

複数のページを一括にOCRしたい場合、PDF OCR Xはできませんが、ここではもう一つのツールをご紹介します。Microsoft OneNoteは大勢の人に愛用されていますが、自動OCR機能が付いていることがよく知られていません。Microsoft OneNoteはPDF・写真・手書きから漢字を認識ことができます。

写真から漢字を認識する方法

  1. OneNoteを開いて、「挿入」→「画像」を選択して、ローカルから画像を読み取ります。
  2. 画像に右クリックして、「画像からテキストをコピー」を選択します。
  3. こうして、画像にある漢字はコピーできるようになりました。

PDFから漢字を認識する方法How to OCR Chinese PDF to Text?

  1. OneNoteで「挿入」→「ファイルの印刷出力(File Printout)」を選択して、認識したいPDFを読み取ります。
  2. 挿入したファイルに右クリックして、このページや全ファイルからテキストをコピーします。chinese ocr onenote2
  3. こうしてコピーした漢字を他のファイルに貼り付けます。

OneNoteの欠点:

  • 一部のレイアウトが崩れること。
  • OneNote 2016以降のバージョンしか使えないこと。
  • 複数のファイルを一括にOCRできないこと

 

iPhone・Androidスマホで読めない漢字を認識・入力する方法

iPhoneの一番漢字OCRアプリ

Scan & Translateは漢字テキストを他の90種類の言語に翻訳でき、アプリストアにも高評価されていてる漢字OCRアプリです。.

Scan & Translateの特徴:

  • 70種類の言語の認識をサポート:日本語、中国語、ロシア語、ドイツ語など。
  • 90+種類の言語の翻訳をサポートします。
  • 写真からテキストを抽出できます。
  • SNSに認識した漢字テキストをシェアできます。

iPhoneで漢字をOCRして文字化する方法

  1. Scan & Translateをアプリストアからインストールします。
  2. 認識言語を日本語にします。
  3. ライブラリから写真をアップロードして、スナップします。
  4. 認識が終了したら、目標言語を選択して、翻訳できます。ocr chinese iphone 02

Androidスマホの一番漢字OCRアプリ

Text FairyはGoogleストアで高評価されている漢字OCRアプリです。ただし、認識できる言語はScan & Translateより少なくて、自動で翻訳することもできません。

Text Scannerの主要な特徴

  • 写真やカメラから漢字を認識します。
  • 漢字テキストをテキストファイルやPDFで出力できます。
  • 日本語も含めて、50+種類の言語をサポートします。
  • 認識したテキストはクリップボードに保存できます。

Androidスマホで漢字を認識する方法

  1. AndroidにText Fairyをインストールします。
  2. 写真を選択したら、カメラで漢字をとったりして、漢字の写真を取り入れます。
  3. 開始ボタンをクリックして、漢字を認識し始めましょう。
  4. 認識終了したら、認識されたテキストを友達に送ったり、コピーしたり、保存したりできます。ocr chinese on android phone

 

結論

では、上で述べた9つのツールの中で、一番のツールは一体どれでしょうか。

どのツールも異なった特徴が備えています。もし頻繁に漢字OCRが必要ではないなら、無料のオンラインツールでも済むことができます。でも、もし頻りに漢字を認識する必要があったら、Cisdem PDF Converter OCRがおすすめです。このソフトでは高精度で複数のファイルを一括に認識できます。

もし何かの問題があったら、次のリストを参考しましょう:

  1. 一番のオフライン漢字OCRツール: Cisdem PDF Converter OCR
  2. 一番のAndroidスマホ漢字OCRツール: Text Fairy
  3. 一番のオンライン漢字OCRツール: Google Chinese OCR
  4. 一回だけの認識なら: PDF OCR X Community Edition
  5. 一番のiPhone漢字OCRツール: Scan Translate
avatar
鈴木楓

本を読み、自分の感想を記録するのは鈴木の趣味です。そのため、Cisdemの編集者になるのは彼女に向いています。PDFの編集・変換方法についての文章を書くことに没頭しています。

コメント (0) 返信する

お名前 *

コメント *

人気記事

PDFをWordに貼り付ける4つの方法(レイアウト崩れせず) PDFをKindleで読むための変換法 【2024年更新】 PDFをエクセルに貼り付ける/取り込む方法(Mac/Windows)
ホームページ > 読めない漢字を調べる方法【読めそうで読めない漢字の入力法】