웹사이트 검색

RAID 소개, RAID 및 RAID 수준의 개념 - 1부


RAID는 저렴한 디스크의 중복 배열이지만 현재는 독립 드라이브의 중복 배열이라고 합니다. 예전에는 작은 크기의 디스크라도 구입하는 것이 매우 비쌌지만, 요즘은 예전처럼 같은 양으로 큰 크기의 디스크를 구입할 수 있습니다. Raid는 논리 볼륨이 되는 풀의 디스크 모음입니다.

Raid에는 그룹, 세트 또는 배열이 포함됩니다. 드라이버 조합은 디스크 그룹을 만들어 RAID 어레이 또는 RAID 세트를 형성합니다. RAID 컨트롤러에 최소 2개의 디스크를 연결하고 논리 볼륨을 만들거나 더 많은 드라이브를 그룹에 포함할 수 있습니다. 디스크 그룹에는 하나의 Raid 수준만 적용할 수 있습니다. Raid는 뛰어난 성능이 필요할 때 사용됩니다. 선택한 레이드 레벨에 따라 성능이 달라집니다. 내결함성 및 고가용성을 통해 데이터를 저장합니다.

이 시리즈의 제목은 1~9부를 통한 RAID 설정 준비이며 다음 주제를 다룹니다.

이것은 9개 튜토리얼 시리즈 중 1부입니다. 여기에서는 RAID 소개, RAID 개념 및 Linux에서 RAID를 설정하는 데 필요한 RAID 레벨을 다룹니다.

소프트웨어 RAID 및 하드웨어 RAID

소프트웨어 RAID는 호스트에서 리소스를 소비하기 때문에 성능이 낮습니다. 소프트웨어 RAID 볼륨에서 데이터를 읽으려면 Raid 소프트웨어를 로드해야 합니다. RAID 소프트웨어를 로드하기 전에 OS를 부팅하여 RAID 소프트웨어를 로드해야 합니다. 소프트웨어 공격에는 물리적 하드웨어가 필요하지 않습니다. 제로 비용 투자.

하드웨어 RAID는 고성능입니다. PCI Express 카드를 사용하여 물리적으로 구축된 전용 RAID 컨트롤러입니다. 호스트 리소스를 사용하지 않습니다. 캐시를 읽고 쓸 수 있는 NVRAM이 있습니다. 정전이 발생하더라도 재구축하는 동안 캐시를 저장하며 배터리 전원 백업을 사용하여 캐시를 저장합니다. 대규모에는 매우 비용이 많이 드는 투자가 필요합니다.

하드웨어 RAID 카드는 다음과 같습니다:

RAID의 주요 개념

  1. Raid의 패리티 방법은 패리티에 저장된 정보에서 손실된 콘텐츠를 재생성합니다. RAID 5, RAID 6은 패리티 기반입니다.
  2. 스트라이프는 데이터를 여러 디스크에 무작위로 공유하고 있습니다. 단일 디스크에는 전체 데이터가 포함되지 않습니다. 3개의 디스크를 사용하면 데이터의 절반이 각 디스크에 저장됩니다.
  3. 미러링은 RAID 1 및 RAID 10에서 사용됩니다. 미러링은 동일한 데이터의 복사본을 만드는 것입니다. RAID 1에서는 동일한 내용을 다른 디스크에도 저장합니다.
  4. 핫 스페어는 고장난 드라이브를 자동으로 교체할 수 있는 서버의 예비 드라이브입니다. 어레이에서 드라이브 중 하나라도 오류가 발생하면 이 핫 스페어 드라이브가 사용되고 자동으로 재구축됩니다.
  5. 청크는 최소 4KB 이상일 수 있는 데이터 크기입니다. 청크 크기를 정의하면 I/O 성능을 높일 수 있습니다.

RAID는 다양한 레벨로 구성됩니다. 여기에서는 실제 환경에서 주로 사용되는 RAID 레벨만 살펴보겠습니다.

  1. RAID0=스트라이핑
  2. RAID1=미러링
  3. RAID5=단일 디스크 분산 패리티
  4. RAID6=이중 디스크 분산 패리티
  5. RAID10=미러와 스트라이프의 결합. (중첩 RAID)

RAID는 대부분의 Linux 배포판에서 mdadm 패키지를 사용하여 관리됩니다. 각 RAID 레벨을 간략하게 살펴보겠습니다.

RAID 0(또는) 스트라이핑

스트라이핑은 탁월한 성능을 발휘합니다. Raid 0(스트라이핑)에서는 공유 방법을 사용하여 데이터가 디스크에 기록됩니다. 콘텐츠의 절반은 한 디스크에 저장되고 나머지 절반은 다른 디스크에 기록됩니다.

2개의 디스크 드라이브가 있다고 가정합니다. 예를 들어 논리 볼륨에 "TECMINT" 데이터를 쓰면 'T'로 저장되고 첫 번째 디스크에 저장됩니다. 'E'는 두 번째 디스크에 저장되고 'C'는 첫 번째 디스크에 저장되고 다시 'M'은 다음 디스크에 저장됩니다. 두 번째 디스크이며 라운드 로빈 프로세스로 계속됩니다.

이 상황에서 드라이브 중 하나에 오류가 발생하면 디스크 중 하나의 데이터 절반이 RAID를 재구축하는 데 사용할 수 없기 때문에 데이터가 손실됩니다. 그러나 쓰기 속도와 성능을 비교하면 RAID 0이 뛰어납니다. RAID 0(스트라이핑)을 생성하려면 최소 2개의 디스크가 필요합니다. 귀중한 데이터가 필요한 경우 이 RAID 레벨을 사용하지 마십시오.

  1. 고성능.
  2. RAID 0에는 용량 손실이 없습니다.
  3. 제로 내결함성.
  4. 쓰기와 읽기는 좋은 성과를 낼 것입니다.

RAID 1(또는) 미러링

미러링 성능이 좋습니다. 미러링은 우리가 가지고 있는 것과 동일한 데이터의 복사본을 만들 수 있습니다. 두 개의 2TB 하드 드라이브가 있다고 가정하면 총 4TB가 됩니다. 그러나 미러링에서는 드라이브가 RAID 컨트롤러 뒤에 있어 논리 드라이브를 형성하는 동안 2TB의 논리 드라이브만 볼 수 있습니다.

데이터를 저장하는 동안 두 2TB 드라이브 모두에 기록됩니다. RAID 1 또는 미러를 생성하려면 최소 2개의 드라이브가 필요합니다. 디스크 장애가 발생한 경우 새 디스크를 교체하여 RAID 세트를 재현할 수 있습니다. RAID 1에서 디스크 중 하나에 오류가 발생하면 다른 디스크에 동일한 콘텐츠의 복사본이 있었기 때문에 다른 디스크에서 데이터를 가져올 수 있습니다. 따라서 데이터 손실이 전혀 없습니다.

  1. 좋은 성능.
  2. 여기서 공간의 절반이 전체 용량에서 손실됩니다.
  3. 완전한 내결함성.
  4. 재건축이 더 빨라질 것입니다.
  5. 쓰기 성능이 느려집니다.
  6. 읽기가 좋을 것입니다.
  7. 소규모 운영 체제 및 데이터베이스에 사용할 수 있습니다.

RAID 5(또는) 분산 패리티

RAID 5는 주로 기업 수준에서 사용됩니다. RAID 5는 분산 패리티 방식으로 작동합니다. 패리티 정보는 데이터를 다시 작성하는 데 사용됩니다. 나머지 양호한 드라이브에 남아 있는 정보를 바탕으로 재구축됩니다. 이렇게 하면 드라이브 오류로부터 데이터를 보호할 수 있습니다.

4개의 드라이브가 있다고 가정하고, 하나의 드라이브에 오류가 발생하면 오류가 발생한 드라이브를 교체하는 동안 패리티 정보를 통해 교체된 드라이브를 재구축할 수 있습니다. 1TB 하드 드라이브가 4개 있는 경우 패리티 정보는 4개 드라이브 모두에 저장됩니다. 패리티 정보는 각 드라이버의 256GB에 저장되며 각 드라이브의 다른 768GB는 사용자에 대해 정의됩니다. RAID 5는 단일 드라이브 오류에서도 살아남을 수 있으며, 드라이브가 2개 이상 오류가 발생하면 데이터가 손실될 수 있습니다.

  1. 우수한 성능
  2. 읽기 속도는 매우 뛰어납니다.
  3. 쓰기는 평균 수준이며 하드웨어 RAID 컨트롤러를 사용하지 않으면 속도가 느려집니다.
  4. 모든 드라이브의 패리티 정보에서 재구축합니다.
  5. 완전한 내결함성.
  6. 1개의 디스크 공간은 패리티 아래에 있습니다.
  7. 파일 서버, 웹 서버, 매우 중요한 백업에 사용할 수 있습니다.

RAID 6 2개의 패리티 분산 디스크

RAID 6은 두 개의 패리티 분산 시스템을 갖춘 RAID 5와 동일합니다. 주로 다수의 배열에 사용됩니다. 최소 4개의 드라이브가 필요합니다. 2개의 드라이브에 장애가 발생하더라도 새 드라이브를 교체하면서 데이터를 재구축할 수 있습니다.

동시에 4개의 드라이버 모두에 데이터를 쓰기 때문에 RAID 5보다 속도가 매우 느립니다. 하드웨어 RAID 컨트롤러를 사용하는 동안 속도는 평균 수준입니다. 6개의 1TB 하드 드라이브가 있는 경우 4개의 드라이브가 데이터에 사용되고 2개의 드라이브는 패리티에 사용됩니다.

  1. 성능이 좋지 않습니다.
  2. 읽기 성능이 좋을 것입니다.
  3. 하드웨어 RAID 컨트롤러를 사용하지 않으면 쓰기 성능이 저하됩니다.
  4. 2개의 패리티 드라이브에서 재구축합니다.
  5. 전체 내결함성.
  6. 2개의 디스크 공간은 패리티 아래에 있습니다.
  7. 대규모 배열에 사용할 수 있습니다.
  8. 백업 용도, 비디오 스트리밍 용도로 사용할 수 있으며 대규모로 사용할 수 있습니다.

RAID 10(또는) 미러 및 스트라이프

RAID 10은 1+0 또는 0+1로 불릴 수 있습니다. 이렇게 하면 미러 및 스트라이핑 작업이 모두 수행됩니다. RAID 10에서는 미러가 첫 번째이고 스트라이프가 두 번째입니다. RAID 01에서는 스트라이프가 첫 번째이고 미러는 두 번째입니다. RAID 10은 01에 비해 더 좋습니다.

4개의 드라이브가 있다고 가정합니다. 일부 데이터를 논리 볼륨에 쓰는 동안 미러 및 스트라이프 방법을 사용하여 4개 드라이브 모두에 저장됩니다.

RAID 10에서 "TECMINT" 데이터를 쓰면 다음과 같이 데이터가 저장됩니다. 첫 번째 "T"는 두 디스크 모두에 쓰고 두 번째 "E"는 두 디스크 모두에 씁니다. 이 단계는 모든 데이터 쓰기에 사용됩니다. 모든 데이터의 복사본을 다른 디스크에도 만듭니다.

동시에 RAID 0 방법을 사용하고 "T"는 첫 번째 디스크에 쓰고 "E"는 두 번째 디스크에 데이터를 씁니다. 다시 “C”는 첫 번째 디스크에 쓰고 “M”은 두 번째 디스크에 씁니다.

  1. 읽기 및 쓰기 성능이 좋습니다.
  2. 여기서 공간의 절반이 전체 용량에서 손실됩니다.
  3. 결함 허용.
  4. 데이터 복사로 빠르게 재구축됩니다.
  5. 고성능 및 가용성을 위해 데이터베이스 스토리지에 사용할 수 있습니다.

결론

이 기사에서는 RAID가 무엇인지, 실제 환경에서 RAID에 어떤 레벨이 주로 사용되는지 살펴보았습니다. RAID에 대한 글을 배웠기를 바랍니다. RAID 설정을 위해서는 RAID에 대한 기본 지식을 알아야 합니다. 위의 내용은 RAID에 대한 기본적인 이해를 충족시킵니다.

다음 기사에서는 다양한 레벨을 사용하여 RAID를 설정하고 생성하는 방법, RAID 그룹(어레이) 확장, 실패한 드라이브 문제 해결 등을 다룰 예정입니다.