日本語 English
株式会社ヒューリンクス
TEL:03-5642-8384
営業時間:9:00-17:30

創薬ソフトウェアにおけるデータ統合

Author: Chris Leeding, PhD

StarDropがデータに接続する仕組みを理解する

創薬研究者が直面する課題の一つは、日常業務を支える様々なソフトウェアツール間で一貫したデータを維持することです。データは多様なソースから様々な形式で提供されるため、形式変換に時間を費やすことになり、本来行うべき重要な作業が後回しにされがちです。また、作業対象のデータがその時点で最良かつ最新のものであることを保証するための継続的な努力が求められます。

Optibrium社では、お客様が当社開発ツールだけでなく他社ツールも併用されることを認識しており、ワークフローを妨げずにツール間を可能な限り容易に切り替えられるようにすることが、常に当社の基本方針の一つです。

非常に基本的なレベルでは、これはStarDropが多くの異なる標準ファイル形式(SDF、MOL2、SMI、CVSなど)や当社独自のデータ形式からのデータ読み込みをサポートし、さらにそれらの形式でデータを保存することもサポートしていることを意味します。これにより、データを他のアプリケーションに簡単に渡して、さらなる分析やレポート作成を行うことが可能になります。
しかしながら、これは解決策の一部に過ぎないことを認識しており、当社ソフトウェアと他アプリケーション間のシームレスな統合を実現する方法にも注力してきました。これにより、ユーザーは中間ファイルを一切使用することなく、アプリケーション間でデータを移動できるようになります。StarDropにおけるデータ統合の仕組みについて、以下をご参照ください。

StarDropはどのように私のデータにアクセスするのですか?

StarDropを既存のテクノロジーと統合する鍵となるのはPythonインターフェースです。これによりアプリケーション内で追加機能を実装できます。技術的背景のないユーザーには少し難しそうに聞こえるかもしれませんが、このインターフェースを開発する上での主な目的の一つは、内部で何が起きているかの詳細からユーザーを保護することでした。

Pythonスクリプト環境の柔軟性

このインターフェースにより、ユーザーや管理者はStarDropのCustom Scriptsメニューを通じて追加機能を追加できます。

この機能の導入とメンテナンスを支援するため、StarDropは共有の場所からスクリプトを自動的に読み込むよう設定できます。これにより管理者は、個々のユーザーが自ら変更を加える必要なく、全ユーザーにスクリプトを配布し、それらのスクリプトを保守・更新することが可能になります。ユーザー側から見ると、StarDropアプリケーションに新しいメニュー項目が表示されるだけで、これらは通常の方法で起動できます。

当社では長年にわたり独自のスクリプト群を開発してきました。また、多くの顧客が独自の新たな機能を開発し、特定のニーズに合わせてStarDropをカスタマイズする支援も行っています。Python言語はその使いやすさと柔軟性で人気が高く、膨大な機能範囲をサポートする可能性があります。実際のところ、顧客が主に興味を示す領域は大きく3つに分類されます:

  1. リモートソース(例:社内データベース)からデータを取得し、StarDropに読み込む。
  2. StarDrop内のデータセットから情報を抽出し、そのデータをリモートアプリケーションまたはサービスに渡す。これにより、StarDropデータセットに追加の列を生成できる。
  3. StarDropデータセットの内容を別のアプリケーションに送信する。
    例:ユーザーが作業するためのSDFファイルとして。

本記事では、これらのシナリオのうち最初のシナリオに焦点を当てます。

Query Interface

StarDropに追加された最も人気のある機能の一つが、Query Interfaceツールです。これは簡単なインストール手順で、あらゆるStarDrop環境に追加できます。

Query Intergfaceの基本理念は、StarDropユーザーがデータの保存場所、構成方法、アクセス方法の詳細を知らなくても、シンプルで直感的なユーザーインターフェースを通じて多様なソースからのデータにアクセスできることです。

クエリを実行するには、ユーザーが検索可能なリストから関心のあるプロパティを選択し、データに適用するフィルターを指定します。例えば、以下のスクリーンショットでは、特定の範囲のlogP値を持つ全化合物について、化学情報、構造、企業ID、および一部の試験データを取得するよう選択しています:

ユーザーは数値、テキスト、日付フィールドに対してフィルターを指定できます。これらを連結して検索をさらに絞り込むことが可能です:

さらに、データソースが対応している場合、化学構造のフィルタリングも実行可能です。以下に示します:

カスタマイズ

標準のQuery Interfaceは、単純なデータベーススキーマやフラットファイルに対応するよう設定可能です。しかし、興味深いデータが常にこれらの形式で入手できるとは限りません。そのため、多くのユーザーと連携し、より複雑なデータ構造を内部で処理しながらも、まったく同じユーザー体験を提供するカスタマイズされたQuery Interfaceを開発してきました。これには、複数のデータソースからのデータ統合(例:実験結果用データリポジトリと化学構造情報用登録システム)、代替データソースへのアクセス(例:Webサービス)、データの前処理(例:複数実験結果の集計)などが含まれます。

複雑なデータソースの処理に加え、カスタマイズによりデータ活用を最大化する個別機能を追加できます。例:

  • 異なる集計レベルでのデータ表示(例:バッチ単位 vs 化合物単位)
  • 頻繁に使用するクエリへのワンクリックアクセス(例:
    • 私のプロジェクトの全データを表示
    • このアッセイのデータがある全化合物を表示
    • これらの化合物の全データを表示)
  • データセット内の集計値の背景にある個々の実験結果を確認(例:明らかに異常な値を調査するため)

その他の接続モデル

Query Interfaceは、様々なデータソースにアクセスするための柔軟なツールです。ただし、他のアプリケーションからのデータ取得をサポートするため、より特化したツールも開発しています。これにはCDD Vaultなどの他社ソフトウェアベンダー製品や、お客様が自社で開発したアプリケーションも含まれます。

これらのツールの一部は既に当社ウェブサイトからダウンロード可能ですが、特定の要件がある場合は、提供ツールの拡充についていつでもご相談ください。

Refresh機能

データへの即時アクセスに加え、StarDropを最新の状態に保つ機能も重要です。このため、StarDropではデータセットを更新して最新データを含める機能をサポートしています。これはQuery Interfaceから生成されたあらゆるデータセットに適用可能です。さらに、よりカスタマイズされた多くのシナリオでも適用できます。ユーザー視点では、メニュー項目を1回クリックするだけで実行できます。

StarDropは、データセットを生成した元の操作を再実行します。その後、新規データを既存データと統合します。新規および更新されたデータはハイライト表示され、ユーザーが変更点を容易に確認できるようになっています:

StarDropを試してみませんか?

具体的なプロジェクトやご要望についてご相談ください。デモ利用にあたり支援いたします。

著者について

Chris Leeding, PhD

ChrisはKing’s College Londonで化学の理学士号と博士号を取得し、有機反応機構を専門としています。Royal Society of Chemistry(王立化学会)での勤務を経て、2006年にInpharmatica 社に入社し、Auto-Modellerなどの初期StarDropに含まれる機能の開発に貢献しました。
Optibrium社ではStarDropの主要な開発を推進し、2018年以降はOptibrium社のソフトウェアと顧客の社内ツールを統合するカスタムプロジェクトを主導してきました。

 (原文)https://optibrium.com/knowledge-base/blog-data-integration-in-drug-discovery-software/