ホーム > 製品情報 > SophiaFramework UNIVERSE > BREW 文字認識アプリ "Recog" > -2-

BREW 文字認識アプリ "Recog"

文字認識アプリの使用方法と構造

使用方法

最初に、文字を認識するために、文字の「形」に関する情報を収集します。

文字認識アプリ "Recog" を MAKE_PARCOR_TABLE マクロを定義してコンパイルし、エミュレータで実行して、table.dat ファイルを作成します。

BREW 2.1 のエミュレータでは、カメラ機能を使用できません。エミュレータでテストするには、"Recog" を EMULATOR_TEST マクロを定義してコンパイルします。テストで使用する画像は、Recog.cpp ファイルの TEST_CHAR で決定します。

エミュレータのテストは、文字の認識結果を表示するだけです。輪郭の検出結果を知りたい場合は、EMULATOR_TEST マクロに加えて DRAW_CHAR マクロを定義してコンパイルします。

判別処理中...

実機で実行する場合、マクロは定義せずにコンパイルします。実行ファイルを端末に転送するとき、table.dat もコピーします。

認識結果

実機での操作方法は次の通りです。

キー機能
選択撮影 (認識) / プレビュー モードに復帰
画像を暗くする
画像を明るくする
0終了

※ 処理の経過をデバッグ ウィンドウに表示する設定になっています。不要な場合は QUIET マクロを追加定義してコンパイルします。

構造

文字認識アプリは、以下のクラスから構成されています。

クラス名機能
Array任意の型を保持できる動的配列です。
Bitmap画像を取り扱うクラスです。このチュートリアルで詳しく解説します。
Cameraカメラを処理するクラスです。詳しくは SimpleCamera チュートリアル をご覧ください。
Complex複素数を取り扱うクラスです。
Matrix2 次元配列を取り扱うクラスです。
Recogアプレット クラスです。
RecogEngine画像解析と認識処理を行うクラスです。

このチュートリアルでは解説しませんが、RecogEngine クラスで行っている処理は順に、

  1. グレイ スケール化
  2. ノイズ除去
  3. 2 値化
  4. 輪郭検出
  5. 複素 PARCOR 係数の計算
  6. 判定

となっています。

各処理の詳細は パターン認識入門 をご覧ください。