データベースとは、コンピューターやサーバー、クラウド上にデジタル形式で保存されている情報の集合体です。データの構造や編成に応じて、極めて単純なデータベースもあれば、極めて複雑なデータベースもあります。データベースシステムは一般に、情報本体とデータベース管理システム(DBMS)で構成され、ユーザーは情報へのアクセス、更新、分析、管理を容易に行うことができます。
データベースにはさまざまな種類があります。最も一般的でオーソドックスなタイプは、テーブルにデータを保存するリレーショナルデータベースです。テーブルは行と列で構成され、テーブル同士が関連付けられています。リレーショナルデータベースには、連絡先情報を含む顧客リストや、インベントリ記録、売上情報、財務情報など、さまざまなデータを保存できます。リレーショナルデータベースは、eコマース、インベントリ追跡、顧客関係管理(CRM)など、さまざまな種類のアプリケーションで使用されます。
ほぼ全てのリレーショナルデータベースは、データの追加、更新、クエリ、削除に SQL(構造化問合わせ言語)を使用します。SQL は IBM 社が 1970 年代に考案したプログラミング言語です。データベースの作成や変更、データの操作、特定の情報の抽出、各種レポートを実行するときに、リレーショナルデータベースでは SQL を使用します。
リレーショナルデータベース以外の種類のデータベースには、キーバリュー型データベース、ドキュメントデータベース、ワイドカラムデータベース、グラフデータベースなどがあり、これらを総称して非リレーショナルデータベースや NoSQL データベースと呼びます。リレーショナルデータベースとの違いは、テーブル以外の形式でデータを保存し、SQL 以外の手段で操作する点です。このため、非リレーショナルデータベースはさまざまななユースケースに適しています。一方で、非リレーショナルデータベースには、例えばトランザクションの ACID 特性 (英語のみ) を満たしていない場合があるなどのマイナス面も存在します。
何らかの形でデジタル技術を利用している現代の組織にとって、データベースは重要な存在であり続けています。最新鋭のアプリケーションやビジネスサービスであっても、そのほぼ全ての運用をデータベースが支えています。
データベースでは、構造化または非構造化を問わず、さまざまな情報を扱うことができます。保存したデータはソフトウェアプログラムを通じて目的に応じて操作し、情報間を関連付けることができます。
前述の DBMS は全てのデータベースに必須の構成要素です。DBMS はデータベースの頭脳にあたり、データ本体とユーザーとの橋渡しとなります。ユーザーがデータの保存場所や格納方法を正確に知らなくてもデータを操作できるのは、DBMS の働きです。ユーザーに代わって DBMS がデータの場所を特定し、アクセスします。DBMS が提供する機能は、情報の追加、削除、変更、更新、編成だけではありません。バックアップとリカバリや、性能監視と最適化といった各種の管理機能も提供しています。
DB-Engines (英語ページ) の最新のランキングでは、広く利用されている DBMS として以下の名前が挙がっています。
スプレッドシートもデータベースと同様にデータの保存や整理に広く使われていますが、両者は異なります。Microsoft Excel などの一般的なスプレッドシートは、データベースに比べて格段にシンプルで、通常は 1 人から数人程度のユーザーを対象にしています。数十人や数百人、数千人以上のユーザー向けではありません。
データベースとスプレッドシートで特に大きな違いは 3 つあります。(1)データの保存・アクセス・操作の方法、(2)保存できる情報の量、(3)情報にアクセスできるユーザーの数です。
データベースには、単なるスプレッドシートで扱うには煩雑な、膨大な量のデータを保存できます。また、多数のユーザーがデータにアクセスして操作できるようになっています。また、データベースでは、スプレッドシートにはない複雑で包括的なパラメーターを指定してクエリを実行し、特定の情報を抽出できます。
データベースの構造はさまざまなバリエーションが考えられますが、一般には、次の 5 つの主要な構成要素を含みます。
ハードウェア:データベースのソフトウェアが動作する物理的なコンピュータ、ストレージシステム、デバイス。
ソフトウェア:DBMS、またはデータの管理やアクセスを可能にするシステム。通常は使いやすいインターフェースやコントロールパネルを備えている。
データ:データベースに保存されている情報本体。アクセスや管理が容易になるように編成されている。
データアクセス言語:DBMS がデータの管理や編成に使用する SQL などのプログラミング言語。ユーザーも、コマンドの作成やデータベースへのクエリにこの言語を使用する必要がある。
プロシージャ:ユーザーが DBMS を介してデータにアクセスし、データの編成を行うときに従う、定義済みの規則。
都会の大病院の診療記録から、街角の生花店の販売記録、グローバルな通信プロバイダでのソーシャルメディアの使用統計や使用パターンに至るまで、データベースはさまざまなビジネスの場面で、重要な情報の保存・整理・アクセス・管理に使用されています。組織にとって、データベースのデータには次のような用途があります。
データベースのほとんどは、アプリケーションに関するデータを管理するために使われています。逆に言うと、データを使用するアプリケーションにはデータベースが不可欠です。例えば、商品やサービスを販売する eコマースサイトには、各取引を記録を作成するデータベースが必要です。CRM アプリケーションには、顧客に関するデータを整理し、変更を追跡・保存するためのデータベースが必要です。このタイプのアプリケーションを総称してトランザクションアプリケーションと呼びます。トランザクションアプリケーションが扱うデータは、追加や更新、削除が頻繁に発生します。そのため、高頻度での読み込み(データの参照)と書き込み(データの変更や操作)の両方をサポートするデータベースが必要です。
データベースはトランザクションアプリケーションのほか、分析アプリケーションからの利用にも対応しています。分析アプリケーションのユーザーは、データに隠れている傾向を容易に視覚化し、ビジネスにメリットをもたらすインサイトを抽出できます。分析アプリケーションには、膨大な量のデータの読み取りとクエリが可能なデータベースが必要です。企業のリーダーは、データベースのデータを分析することによって、より多くの情報を使用して、自社の将来について、スマートな意思決定を行うことができます。現代の高度なデータ分析プラットフォームを利用することで、データを深堀りし、自分たちでは気づくことできなかった実用的な情報を取得できます。AI と機械学習はデータ分析を変革しており、組織に業界における優位性をもたらしています。例えば、販売データやインベントリデータ、顧客データなどを保持している企業は、データからパターンを割り出し、業務プロセスや顧客エクスペリエンス、ROI の改善に役立つ要素を特定できます。
組織が扱うデータが増え続けるなか、今日のデータベースは巨大化・複雑化がますます進み、それに伴って課題も増えています。主な課題は次のとおりです。
Nutanix は、データベースの運用と管理を強化する 2 つの重要なソリューションを提供しています。
Nutanix クラウドプラットフォーム(NCP):NCP は、ハイブリッドマルチクラウド環境でビジネスクリティカルなアプリケーションとデータベースを稼働するのに最適なソリューションです。エンドユーザーの要求に応える一貫したパフォーマンスや、優れた可用性、フルスタックの強固なセキュリティ、ビジネスニーズの変化に対応できる高い俊敏性を備えており、運用コストの削減とシンプルな管理を可能にします。NCP は、レガシーとモダンの両方のビジネスアプリケーションやデータベースを、オンプレミス、クラウド、エッジのいずれにもデプロイできる他に類を見ないソリューションです。
Nutanix データベースサービス(NDB):NDB は、データベース管理の複雑さを大幅に軽減し、ソフトウェア開発を加速させます。 Microsoft SQL Server、Oracle Database、PostgreSQL、MySQL、MongoDB の各データベースの利用に対応し、オンプレミスとパブリッククラウドにわたってデータベースのライフサイクル管理を簡素化・自動化できる唯一の DBaaS(サービスとしてのデータベース)です。NDB を利用することで、データベース管理者やプラットフォームチームは、数百から数千に及ぶデータベースの効率的かつセキュアな管理が可能となり、制御や柔軟性を犠牲にすることなく、性能、拡張性、セキュリティ、高可用性、ディザスタリカバリ、コストの要件を満たすことができます。また、NDB はアプリケーションのアジャイル開発を行う開発者が、データベースのプロビジョニングをシンプルで迅速かつセキュアに行えるよう支援します。
データベース管理は、今後ますます困難になることが予測できます。主な理由は 3 つあります。
まず、組織が開発しデプロイするアプリケーションがかつてないほど増えている点です。IDC は、2025 年までに新たに開発されるモダンアプリケーションの数は 7.5 億を超えると予測しています。データベースはほぼ全てのアプリケーションに必要であることから、組織が管理するデータベースの数は増加の一途をたどることになります。運用するデータベースの数が増えると、全体を管理してセキュリティを確保する面での課題や、開発者にスムーズなアクセスを提供する面での課題も大きくなります。
第二は、単一のデータベースプラットフォームを標準化する時代ではなくなった点です。今日の開発者は、使用するテクノロジーを自ら決定する権利を有しています。開発者は定番の商用リレーショナルデータベース以外にも次第に関心を寄せ始め、従来のリレーショナルデータベースに加えて、オープンソースのデータベースや非リレーショナルデータベースの併用を検討しています。この結果、多くの組織では、種類が異なる複数のデータベースを管理する必要が生じ、複雑さが増します。
第三は、大半の組織がハイブリッドマルチクラウド戦略を採用しつつある点です。アプリケーションやデータベースを稼働する環境として、オンプレミスのデータセンターのほかに、プライベートクラウド、複数のパブリッククラウド、コロケーション施設、エッジを組み合わせた複数の運用環境を利用しているか、または利用を計画しています。運用モデルは環境ごとに異なるため、開発者やデータベース管理者、IT 部門、運用チームは複数の API の使い方を習得し、さまざまなツールやプロセスを使用して、データベースを管理する必要があります。したがって、データベース管理はいっそう複雑化します。
データベース関連のこのような課題に対処して、顧客満足度を高め、データから引き出す価値を最大化するには、ハイパーコンバージドインフラや DBaaS(サービスとしてのデータベース)のようなテクノロジーが効果を発揮します。