このページでは設定済の辞書を個別の読取範囲へ適用する方法を説明しております。辞書自体の活用方法や設定方法は「ユーザ辞書の概要」や「辞書の新規登録と編集」をご参照ください。
- ユーザ辞書の使い方には2種類あります。
- OCR時に辞書を参照して置換する。エントリー画面では辞書変換後の出力が表示されます。このページではOCR時の辞書利用の設定方法を説明します。
- データ加工設定で辞書を指定することによりCSV出力時に辞書変換もできます。エントリー画面では辞書変換前の出力が表示されます。詳細は「ユーザ辞書一致処理」をご参照ください。
読取範囲への辞書設定
例えば、銀行番号(4桁)を読み取って、辞書にある銀行名に変換できます。
- 対象の読取範囲を選択して、右側の歯車ボタンをクリックします。
- 「辞書設定」タブをクリックして、「辞書変換処理」を「行う」を選びます。表示された各項目を設定します。
ユーザ辞書:作成済みの辞書を選択します。
出力列:辞書の参照キーに「銀行番号」、値1に「銀行名」がある場合、「値1」を選びます。
-
- 辞書には変換元に対して変換先を最大3つまで設定できるため、値1~3を選択します。値2に銀行名(英語表記)を登録しておき、値2を選ぶと英語表記の銀行名が出力されます。
- 参照キーを出力したい場合は、参照キーにチェックを入れたままで登録します 。(例えば、参照キーに「株式会社第二オフィス産業」と登録して、読取結果が「株式会社第三オフィス産業」の誤読の場合に、以下の尤度閾値を1.0よりも下げることで、正解である参照キー「株式会社第二オフィス産業」を出力します。
辞書データ自動追加:エントリーで修正した値を辞書データ(値)として自動登録する場合には「行う」を選択します。数字や文字が少ないものは誤変換になる可能性があるため、自動追加の設定を推奨しておりません。
-
- 「行う」に設定しても3文字未満の場合は自動登録されません。
尤度閾値:「尤度閾値」は、どの程度参照キーと読取り結果が一致したら置換を行うのかという 閾値となります。1.0とすると完全一致時のみ辞書置換を行います。閾値を下げると参照キーと読み取った文字列が一致しなくても置換を行います。閾値を下げすぎると本来置換すべきでない読取結果まで置換してしまいますので、1.0から少しずつ下げて適切な閾値を設定ください。