DataCraft

Topics

古文書テキスト化サービス

2008.5.26

 弊社ではMIL スペックを含むあらゆる公共スペックの改訂に伴う各種タイムリーなサービスを実現するために、その過程で発生するスキャン・イメージデータのテキスト化サービスや新旧文書比較サービスも検討している。これらサービスは関連して行われる認定品調査や代替品調査などと相まって、迅速化を推進するユーザの負担を軽減し、強いてはより効果的な資材調達を支援するものとして期待されている。

                                (参考画像)
 旧世代MIL スペック(1990 年以前に発行された)に見られる、スキャンされたイメージ文書のテキスト化は全文検索を可能にするために重要なポイントとなる。また新旧スペックを比較するためにはいかに忠実にこれら旧世代のスペックを認識可能なテキストスタイルに変換することができるかにある。弊社では文字検索が不能なイメージ文書(PDF)を検索可能なテキスト文書(PDF)に変換する。
 また、用途に応じてPDF形態、Word形態への変更が可能で、本文に対し添削可能である文書形態にすることもできる。他にも既にスキャンされておりイメージデータとして保管されている文書はもちろん、現在紙媒体によって保管されている文書に関しても弊社ではテキスト化することが可能である。
(注:内容により個別の対応を必要とする場合がある)
以上のサービスを利用することでユーザの負担を軽減し、強いてはより効果的な資材調達を支援するものとして弊社では考えている。