データベイス (database)

説明 (2002.03.18)

大量のデータを効率よく集中管理するために, 情報の入力・更新・検索などのための形式を提供し実行する ソフトウェアシステム. データベイスは database management system (DBMS) によって管理されており, 現在では ANSI/ISO/JIS によって標準化されている データベイス (定義・操作) 言語 SQL によって制御される.

SQL によって制御されている DBMS で採用されている データモデルはリレイショナル (関係) 型と呼ばれる. 集合論に基づく汎用的なデータ構造によって特徴づけられる. 要素間の「関係」によって定義される集合は表とよばれ, 自在に再結合可能であり構造の変更が容易という利点がある.

データベイスの規模は個人利用のための小さなものから, 公的機関によって構築されインターネットを介して検索できるものまで さまざまである. このうち大規模な公開データベイスのほとんど 上述のリレイショナル型 DBMS によって管理されている. しかしながら利用者は SQL を意識することなく 情報検索できるようなインターフェイスが用意されていることが多い.

生態学におけるデータベイス利用の今後の発展の方向のひとつは, ネットワークを介したデータ共有のいっそうの促進にある. この目的のために, 「生態学的なデータと情報を生産,処理,理解し, そして普及させるための学際的で幅の広い科学」 (Michener et al., 2001) として生態学インフォマッティックス が提案され始めている. その成果の例として, アメリカ合州国長期生態学的研究 (US LTER) ネットワークでは, データをとった研究者の優先権を保護しつつ利用者の便宜をはかりうる アクセスポリシーの策定, また観測データに関するデータを記述するための 生態学メタデータ言語の設計が挙げられている (Michener et al., 2001).

[文献] Michener, W.K. et al. 2001. 生態学インフォマティックス: Long-Term Ecological Research における展望. 日本生態学会誌 51: 291-303.
JIS X 3005. (1995) データベース言語SQL . 日本工業規格.

(xxx 字/800 字)


メモ・資料


変更の履歴

査読者の訂正原案 (2002.03.18)

大量のデータを効率よく集中管理するために, 情報の入力・更新・検索などのための形式を提供し実行するソフトウェアシステム.研究者個人などが作成した非公開のものと, 公的研究機関などが構築した公開データベースがある.現在の管理システムの主流RDBMS(relational data base management system)は、データ要素の形式と要素間の「関係」によって連結した集合(表)をもち,AND,ORなどの関係演算によって自在に検索できるという利点がある.RDBMSは、SQLという仕様が公表されたプログラミング言語によって制御され、利用者は SQLを意識することなくデータ検索などが可能である。多数の利用者が大量データのごく一部だけを検索する場合の負荷を避けるため、通常、データの管理機能を集中的に行う計算機(サーバ)と,利用者が検索したい情報をサーバに伝えたときに、必要な情報だけを取り出して利用者に返送する計算機(クライアント)を分けている。今日ではインターネット経由で情報のやりとりができるため、データベースは急速に普及し、重要性を増しつつある。

 生態学におけるデータベイス利用の今後の発展の方向のひとつは, ネットワークを介したデータ共有にある.これを実現するためには、アメリカ合州国Long-Term Ecological Research(LTER).ネットワークが進めているように、データ公開・利用のためのルール整備と公開データを円滑に利用できるデータ構造の策定が必要となる(Michener et al. 2001).

###できれば「生態学インフォマティクス」をごく簡単に文中で紹介ください。###

最初の説明 (2002.03.14)

大量のデータを効率よく集中管理するために, 情報の入力・更新・検索などのための形式を提供し実行する ソフトウェアシステム. この管理機能を集中的に実現しているデータベイスサーヴァーと, 利用者がサーヴァーにアクセスするときに利用する データベイスクライアントに大別される. こんにちではネット経由で (オンラインで) 情報のやりとりできる機能をもった データベイスサーヴァー・クライアントの組み合せによって, サーヴァーでデータの集中管理しつつ, 多くの利用者が共有利用ができるようになっている.

データベイスソフトウェアにはさまざまなデータモデルが採用されてきた. 現在の主流はリレイショナル (関係) 型であり, 集合論に基づく汎用的なデータ構造によって特徴づけられる. 要素間の「関係」によって定義される集合は表とよばれ, 和・積・差といった要素の関係演算によって 自在に再結合可能であり構造の変更が容易という利点がある. リレイショナル型モデルのデータベイスを管理できるソフトウェアを relational data base management system (RDBMS) という.

RDBMS はデータベイス (定義・操作) 言語 SQL によって制御される. これは ANSI/ISO/JISで仕様が明示的に定義され公開されているために, 広く普及している. この SQL で命令を組んで RDBMS を直接操作できるだけでなく, わかりやすいインターフェイスを備えた データベイスクライアントソフトウェアに SQL 生成を代行させることで, 利用者自身は SQL を意識することなく RDBMS からデータ検索などが可能である.

生態学におけるデータベイス利用の今後の発展の方向のひとつは, ネットワークを介したデータ共有にある. これを実現するためにはデータ公開・利用のためのルール整備と 公開データを円滑に利用できるデータ構造の策定が必要となる. 例えば, この方面に関して先進的なアメリカ合州国 LTER ネットワークでは, 前者に関しては データをとった研究者の優先権を保護しつつ利用者の便宜をはかりうる アクセスポリシーを摸索しており, 後者に関しては W3C によって標準化のすすめられている XML (extensible markup language) を基礎とする生態学メタデータ言語が設計されて公表されている.

[文献] Michener, W.K. et al. (2001) 日本生態学会誌 51: 291-303.

(920 字/800 字)

目次に戻る