@ 書籍読み上げシステム(1次、2次)
書籍の自動ページめくり機構と頁認識部、文章解析部、音声発生部で構成
頁認識部を開発
書籍の頁画像から、表題、外題、章題、本文、ルビ、線、図、写真などの領域を抽出し、
本文領域から文字を切り出し、文字認識を行い、漢字コードを出力する。
基本仕様
読み取り対象: 文庫本、新書本
スキャナ入力: 600DPI(1次)、400DPI(2次)
最小文字構成画素:64×64画素(1次)、42×42画素(2次)
認識率: 99.98%
処理
1.頁抽出
2.頁領域補正
3.頁構造解析(レイアウト認識、縦書き、横書き検出,領域分割、属性の生成と割付)
4.文字行、ルビ候補領域の抽出
5.文字行ピッチ推定と文字の切り出し
6.文字特徴抽出し辞書と照合を行い文字コードの出力
7.認識辞書の生成、編集、学習処理
Copyright (C)2007 I Techno co.,LTD. All Rights Reserved.