ベクタ形式で作成したコンテンツの検索結果が0件になるのはなぜですか?
テキスト情報があるPDFです。
原因(形式ごとの仕様の違い)
形式により使用している検索ライブラリが異なります。
ラスタ形式:xmlファイルより正確にテキスト情報を拾っている
ベクタ形式:PDF表面上のテキスト情報を拾っており、スペースとカーニングの判断ができない。
カーニングとは「文字間隔の調整」を指しますが、文字間隔が統一されていない場合
システムがカーニングをスペースと判断し、正確に検索が行えない可能性がございます。
解消方法
表示形式をラスタ形式に変更する
上記よりラスタ形式では正確なテキスト情報の抽出が行えるため
表示形式の変更で解消されるケースが多いです。表示形式は基本設定より変更できます。
Adobeacrobatで文字間隔を修正する
Adobe AcrobatでPDFを開き「編集>テキスト」より文字間隔の修正が行えます。
該当単語もしくは、該当文章を選択し文字間隔を統一してください。
修正後はベクタ形式のまま再アップロードか、PDFの差し替えを行ってください。
- ブック内検索
- 検索結果
- ヒットしない