ストレージ知識確認チェックリスト(随時更新)【クラウド活用の教科書を読んでみた】

はじめに

前回に続き「クラウド活用の教科書」の知識チェックリストに記載されていたワードについて 調べてまとめました。今回はストレージの記事となります。 参考

ストレージチェックリスト

ブロックストレージ

ブロックストレージでは、データをブロックに切り分けて、別々のピースとして保存する。ブロック単位でのデータアクセス※を行うため、DBMSにおける データファイル格納先として利用されるのが一般的。iSCSI、FCといったストレージネットワークを用いてストレージクライアントに割り当てられる。 ブロックストレージは、データ経路のオーバーヘッドが少ないため、大容量のデータを高速に転送できる。
※ブロックアクセス・・・固定長のブロック単位でデータを読み書きする手法

f:id:xxyoko10:20210120205739p:plain

SAN(Storage Area Network)

ストレージ装置やテープ・ライブラリ装置をサーバと接続させる、LAN(Local Area Network)とは別の専用のネットワークのこと。 SANでは「ファイバ・チャネル」という、TCP/IPとはまったく異なるプロトコルが用いられる。 光ファイバ・ケーブルを用いて各デバイス(サーバ、ストレージ/テープ装置)同士を接続する。 中継装置として「ファイバ・チャネル・スイッチ」と呼ばれるものが利用される。 ファイバ・チャネル・スイッチを利用することで、複数のサーバとSAN対応ディスク・システムを接続して、その共有が行える。 また、LANとは別のストレージ専用のネットワークとなるため、サーバが抱える大容量データのバックアップなどが発生しても、LANへの負荷がほとんど発生しないというメリットがある。

NAS(Network Attached Storage)

LAN(イーサネットFDDIなど)に直接接続されるストレージである。 ほとんどのNASは、RAID構成のハードディスクを内蔵し、NAS専用OS(NAS OS)によってネットワークを経由したファイル共有を可能にしている。 クライアントとの通信インターフェイスはネットワークのみであり、設定なども通常はネットワークを介して行うことになる。クライアントからは、NFS(Network File System)やCIFS(Common Internet File System:Windowsネットワークでネットワーク上のリモート・ファイル・システムにアクセスするためのプロトコル)などのファイル転送プロトコルを使って、ファイルの読み書きが可能である。このようにファイル転送プロトコルを用いるため、異機種間のファイル交換や共有も可能となっている。

ミラーリング、RAID10、RAID5、RAID6

RAIDとは複数のハードディスクを組み合わせて、信頼性の高いディスク装置を実現しようとする方式のこと。 RAIDには複数の種類がある。ミラーリングを実現するのがRAID1である。ミラーリングとは全く同じデータを複数のディスクに書き込むこと。 あるディスクが故障しても、処理を継続できるため可用性の高いシステムを構築することができる。 RAID5はデータを複数のハードディスクに分散して格納する方式。さらにパリティデータもあわせて書き込みを行うことで、耐障害性を高めた構成となっている。 エラーを修復するためのパリティデータをデータ・ブロックの組ごとに生成し、分散して記録する。たとえ1台のディスクが壊れても、 残りのディスクに格納されたデータとパリティから、失われたデータを復活させることができる。 RAID6はデータを複数のハードディスクに分散して格納する。さらにパリティデータを二重で書き込みを行うことで、耐障害性を大幅に高めた構成となっている。

コントローラー

データを入出力するための各種インターフェース、入出力を制御するプロセッサーとメモリ、および専用のソフトウェアで構成される 「データ入出力専用に特化したコンピューター」のこと。

キャッシュ

ストレージが持っている機能で、一時的なデータが保存される。読み込みにおいて、ストレージにキャッシュが存在すれば実際にディスクまでアクセスしなくて済むので、処理が高速になる。キャッシュの管理はLRUアルゴリズムで行われる。(使用頻度の高いデータがキャッシュに残るようにするアルゴリズム)またストレージの仮想化/階層化も一般的になってきており、使用頻度の高いデータは高速なストレージに、使用頻度の低いデータは低速なストレージに移すこともできる。

同期コピー・非同期コピー

同期コピーは、ほぼリアルタイムでコピーし続けることになる。万一のデータ喪失のリスクを最小に抑えられるが、ネットワークの帯域消費も大きくなる。非同期は、ある程度の時間差を許容しつつコピーしていくもの。同期コピーの場合、データがもっとも頻繁に変更される時点でのデータ転送量に合わせて帯域を確保する必要がある。

マウント・アタッチ・デタッチ

マウントは別々のディスクに格納されているファイルシステムをくっつけることができる。ファイルシステムを分けておくことで、領域不測の際の影響を小さくすることができる。 f:id:xxyoko10:20210207232624p:plain アタッチはストレージ装置や記憶領域など、ハードウェア資源を特定の仮想化環境に追加して利用できるようにすること。 デタッチはハードウェア資源を切り離して無効にする操作や動作のこと。

シンプロビジョニング

ストレージの仮想化で用いられる機能で、OSに対してストレージ装置に搭載している実際の容量以上のサイズに見せることができる。 OSには搭載サイズ以上のディスク容量を認識させつつ、ストレージ側で必要に応じて徐々にディスクを追加していくことができるようになる。 データ容量の将来予測が難しい場合の手段の一つと言える。

差分バックアップ

差分バックアップは、最後のフルバックアップ以降に変更されたファイルのみをバックアップすること。 フルバックアップに比べて時間短縮が可能。

https://active.nikkeibp.co.jp/atclact/active/14/100700086/111700009/?ST=act-server&P=2 https://www.atmarkit.co.jp/fsys/keyword/007san_nas/007san_nas.html#:~:text=NAS%E3%81%A8SAN%E3%81%AE%E6%8E%A5%E7%B6%9A,%E3%83%90%E3%83%83%E3%82%AF%E3%82%A2%E3%83%83%E3%83%97%E8%A3%85%E7%BD%AE%E3%82%92%E6%8E%A5%E7%B6%9A%E3%81%99%E3%82%8B%E3%80%82 https://note.cman.jp/server/raid/raid6/

https://www.itmedia.co.jp/enterprise/spv/0705/28/news005.html