OCR - 光学式文字認識

AIを活用したオンスクリーン文字認識

OCR(光学式文字認識)とは、印刷物や手書きの文字をスキャンした画像を、機械で読み取れるデータに変換し、その後デジタル編集に利用する技術です。Squishは、パワフルなオブジェクトベースと画像ベースの両方の認識技術を搭載し、画面上のテキストの優れた認識・検証の方法として提供しています。

プラットフォームに依存しないテストを作成しようとすると、フォント、フォントサイズ、装飾、レンダリングモードが多岐に渡るため、コンポーネントの外観のばらつきが特に画面上のテキストで目立ちます。そのため、ファジー画像検索を含む画像ベースの認識手法は、一般的に画面上のテキストを探すのに適していません。OCRは、同じテキストが異なるパラメータでレンダリングされ、ピクセル間の比較で大きく異なって見えるようなケース(文字幅が異なる、カーニングが異なる、改行位置がずれるなど)でも、効率的にテキストを処理することが可能になります。

OCR_png-03