 |
CLiDE Batch の機能 |
- 使いやすいコマンドラインツール
- 取扱い可能な文書ファイル形式:PDF および Word
- 取扱い可能な画像ファイル形式:BMP, GIF, JPEG, PBM, PGM, PNG, PNM, PPM, TIFF, XBM, XPM
- 構造式の画像から分子を抽出
- 一般構造式の読み込み可能
- 読み込んだ構造内の原子位置をクリアにし、すべての環や鎖を元の文書または画像と同じように形成
- 読み込み (認識) エラーを検出
- 異常のある分子を表示 (認識エラーおよび原子価の異常)
- 0 から 1 の信頼度スコアで、構造抽出の精度に対する CLiDE の信頼度を提示
- オプション機能:認識プロセスと出力ファイルに保存する情報をコントロール
- 分子を保存する形式
- MDL Mol ファイル
- MDL SD ファイル
- MDL RG ファイル
- CDX (ChemDraw)
- CML (Chemical Markup Language)
- MRV (ChemAxon Marvin Document)
- XML (Extensible Markup Language)
- 出力された XML ファイルは CLiDE Professional で表示可能。入力文書または画像と並行して抽出された分子を確認可能
CLiDE Batch 使用例
CLiDE Batch は高スループットに最適です。以下は CLiDE Batch で処理した 71 ページの WIPO (世界知的所有権機関) の特許データページの抜粋です。CLiDE Batch から抽出結果を出力した XML を CLiDE Professional で開いて生成しています。
CLiDE Batch の処理時間は、Intel Core i7-12700H CPU と 64 GB RAM を搭載したマシンで 1 分 10 秒、Intel Core i7-3630-QM CPU と 8 GB RAM を搭載した弱小マシンで 2 分 36 秒です。