文書管理システムの構築

昔から企業ではぺーパーレスのニーズがありました。 しかし、企業内にある紙書類は、様々な書式があります。 書庫に保管する経理帳票や技術資料、図面、見積書、発注書等まで含めると、多岐に渡ってきます。 これらをスキャンニングして、電子データとして保管することは、至って簡単なのですが、大変なことは検索性を高めること。 そのためには、電子データを検索するキーワードデータをどのように付与していくかです。 世の中には、OCR(光学式読み取り)という技術があるのですが、これを応用して、書類の決まったエリアを認識させて、検索キーワードを自動生成するソフトとデータベースを構築。 ここで大変なことは、OCRの認識が100%ではないこと。 認識率を高めるための技術が未だに確立されていないことから、数多くある書類の中から認識しやすいキーワードの抽出に苦労。 それと認識 させるためのスキャン装置の選定と相互検証に苦労しました。