Compute DNA

문서의 이전 버전(r4)을 보고 있습니다.

역사 raw
대문 랜덤 문서 최근 토론
분류

AMD CDNA 마이크로아키텍처 기반 그래픽 카드 제품군
CDNA 1 μArchCDNA 2 μArch
INSTINCT MI100미정


1. 개요2. 특징
2.1. [[GCN]]의 진정한 후계자?
3. 세대별 CDNA 일람
3.1. CDNA 13.2. CDNA 2
4. 같이 보기


1. 개요

2020년 3월 5일, AMD 파이낸셜 애널리스트 데이에서 처음 소개된 후 11월 16일에 정식 발표된 GCN 마이크로아키텍처의 후속 GPU 마이크로아키텍처. 데이터 센터용이자 연산 특화용 아키텍처라고 한다. 인스팅트 제품군에 채택된 아키텍처이기도 하다.

2. 특징

2.1. GCN의 진정한 후계자?

신경 네트워킹, 딥 러닝 및 모든 AI 분야의 빠른 발전으로 데이터 센터의 GPU 수요가 급증해서 GPU는 이제 데이터 센터에서도 매우 중요한 존재가 되었다. 그러나 AMD한테는 이러한 호황에서 제대로 힘을 쓰지 못 했는데 NVIDIA는 그 분야에서 수십 억 달러를 벌어 들일만큼 이미 장악한 상태였기 때문. NVIDIA한테 크게 밀리고 있는 시장 규모지만 게이밍 시장보다 더 높은 수익성이 있어서 포기할 수 없었고, 기존의 GCN으로는 더이상 경쟁력을 갖출 수 없다고 판단했는지 먼저 발표된 RDNA 아키텍처가 게이밍을 위해 GCN에서 크게 변경했던 것처럼 연산 특화용인 CDNA를 발표하게 되었다고 한다.

GCN이 게이밍 시장과 데이터 센터 시장에 모두 사용되었지만, 내부적으로는 연산 특화용에 더 적합한 구조를 지녔기 때문에 이러한 특성을 반영하고 더 강화된 CDNA야말로 GCN의 진정한 후속 아키텍처로 보는 의견이 있다. 아키텍처 whitepaper가 공개되면서 소문대로 기존 GCN의 확장판으로 계승되었다. GCN과의 차이점이라면 그래픽스에 필요한 각종 하드웨어 블록들이[1] 전부 제거되었고, RDNA 2부터 도입된 레이 트레이싱 전용 하드웨어 블록인 레이 엑셀러레이터도 당연히 제거되었으며, 심지어 디스플레이 컨트롤러랑 컴퓨트 유닛 안에 포함되어 있던 텍스처 유닛까지 제거되었다는 것. 미디어 디코딩 및 인코딩 기능인 VCN만 제거되지 않고 유지되었다.

3. 세대별 CDNA 일람

3.1. CDNA 1


  • 컴퓨트 유닛이 최다 64개 → 128개로 2배 확장
    그동안 3세대 GCN 이래로 최다 컴퓨트 유닛이 64개를 넘긴 적이 없었는데, RDNA 2 아키텍처와 마찬가지로 64개를 넘는 스펙을 지원하게 되었다. 그에 따라 셰이더 엔진도 최다 4개에서 8개로 확장되었다.
  • L2 캐시 메모리가 최대 4 MB → 8 MB로 2배 확장
    연산부 스펙이 크게 확장되었기 때문에 이를 받쳐주기 위해 L2 캐시 메모리의 용량도 증설되었고, 그에 따라 L2 캐시 메모리의 슬라이스도 최다 16개에서 32개로 증가되었으며, L2 캐시 메모리 슬라이스당 대역폭도 RDNA와 마찬가지로 64 바이트/클럭 사이클에서 128 바이트/클럭 사이클로 확장해서 총 6 TB/s로 구현되었다. L2 캐시 메모리 슬라이스 개수는 2배 증가되었지만 캐시 배치 정책은 여전히 16-way Set Associative이다.
  • HBM2 대역폭이 1 TB/s → 1.23 TB/s로 약 20% 확장
    이전 세대인 7 nm 공정 미세화 버전의 Vega 아키텍처와 마찬가지로 HBM2 규격에 최대 4스택과 최대 32 GB로 구성되어 있으나, 비트레이트가 2 Gbps에서 2.4 Gbps으로 빨라짐에 따라 대역폭도 그만큼 빨라졌다.
  • GPU↔GPU 인터커넥트가 링 토폴로지 → 인피니티 페브릭 토폴로지로 변경
    이전 세대인 Vega 아키텍처에서는 인피니티 패브릭이 GPU 내부에서만 적용되었지만, 이번에는 GPU 외부의 인터커넥트도 인피니티 패브릭으로 적용된 본격적인 인피니티 아키텍처로 구축되었다.
  • 3개의 인피니티 패브릭 링크 지원으로 최대 4개의 GPU 연동 가능
    인피니티 패브릭 링크당 92 GB/s의 대역폭을 구현할 수 있고, 최대 3개의 링크를 지원하므로 총 276 GB/s의 대역폭을 지니며, 점대점(Point-to-Point)으로 연결되므로 4개의 GPU를 연동하면 이론적으로 최대 552 GB/s의 성능이 된다. 하지만, PCI-Express 4.0 기반이기 때문에 이론적인 한계치는 256 GB/s이다.
  • 그래픽스 관련 고정 하드웨어들이 전부 삭제
    범용 연산에 특화된 아키텍처를 모토로 설계되었기 때문에 이에 불필요한 그래픽 관련 하드웨어 블록들이 전부 제거되었다.
  • VCN 2.5
    기능적으로는 AV1 디코딩을 지원하지 않는 RDNA 아키텍처 기반 라데온 RX 5000 시리즈, Vega 아키텍처 기반 3세대 라이젠 APU 내장 그래픽과 큰 차이가 없다.

2020년 11월 16일에 발표된 CDNA 첫 마이크로아키텍처. 이전부터 루머로 알려진 Arcturus가 CDNA 기반 GPU일 가능성이 높으며, 인스팅트 MI100 컴퓨팅 카드에 사용된 것으로 밝혀졌다.

3.2. CDNA 2

2022년 이후에 발표될 예정. 자세한 정보는 아직 밝혀지지 않았다.

4. 같이 보기

[1] 그래픽스 커맨드 프로세서, 지오메트리 프로세서, 프리미티브 유닛, 래스터라이저, 스캔 컨버터, 하이어라키컬-Z, 텍스처 유닛, 렌더 백엔드.