@ 書籍読み上げシステム(1次、2次)

書籍の自動ページめくり機構と頁認識部、文章解析部、音声発生部で構成

頁認識部を開発
 書籍の頁画像から、表題、外題、章題、本文、ルビ、線、図、写真などの領域を抽出し、
本文領域から文字を切り出し、文字認識を行い、漢字コードを出力する。

基本仕様
     読み取り対象:   文庫本、新書本
     スキャナ入力:   600DPI(1次)、400DPI(2次)
     最小文字構成画素:64×64画素(1次)、42×42画素(2次)
     認識率:       99.98%

処理
   1.頁抽出
   2.頁領域補正
   3.頁構造解析(レイアウト認識、縦書き、横書き検出,領域分割、属性の生成と割付)
   4.文字行、ルビ候補領域の抽出
   5.文字行ピッチ推定と文字の切り出し
   6.文字特徴抽出し辞書と照合を行い文字コードの出力
   7.認識辞書の生成、編集、学習処理

Copyright (C)2007 I Techno co.,LTD. All Rights Reserved.