PROFILPELAJAR.COM

Elder N/Testes/Radeon (tradução em progresso)
Lançamento
	13 de dezembro de 2022; há 2 anos
Projetado por
	AMD
Fabricado por
	TSMC
Processo de fabricação
	TSMC N4; TSMC N5; TSMC N6;
Codinome
	Plum Bonito; Wheat Nas; Hotpink Bonefish;
Série de produtos
Desktop
	Radeon RX 7000
Profissional/Workstation
	Radeon Pro W7000
Especificações
Cache L0
	64 KB (por WGP): ; 32 KB instructions cache; 16 KB K data cache;
Cache L1
	248 KB (por matriz)
Cache L2
	6 MB
Cache L3
	até 96 MB
Suporte de memória
	GDDR6
Taxa de clock da memória
	20Gbps
Suporte PCIe
	PCIe 4.0
APIs gráficas suportadas
Direct3D
	Direct3D 12.0 Ultimate (nível de recurso 12_2)
Modelo de Shader
	Shader Model 6.7
OpenCL
	OpenCL 2.1
OpenGL
	OpenGL 4.6
Vulkan
	Vulkan 1.3
Mecânismo de mídia
Codificar codecs
	H.264; H.265; AV1;
Decodificar codecs
	H.264; H.265; AV1;
Profundidade de bits
	8-bits; 10-bits; 12-bits;
Codificador(es) suportado(s)
	AMF; VCE;
Saídas de vídeo
	DisplayPort 2.1; HDMI 2.1a; USB-C;
Histórico
Antecessor
	RDNA 2
Variante
	CDNA 3 (datacenter)
Sucessor
	RDNA 4
	Esta caixa: ver; discutir;

https://en.wikipedia.org/wiki/RDNA_3

RDNA 3 é uma microarquitetura de GPU projetada pela AMD, lançada com a série Radeon RX 7000 em 13 de novembro de 2022.

Background

Em 9 de junho de 2022, a AMD realizou seu Dia do Analista Financeiro, onde apresentou um roteiro de GPU do cliente que continha menção ao RDNA 3 chegando em 2022 e RDNA 4 chegando em 2024.^[1] A AMD anunciou aos investidores sua intenção de alcançar um aumento de desempenho-por-watt de mais de 50% com RDNA 3 e que a próxima arquitetura seria construída usando empacotamento de chiplet em um processo de 5 nm.^[2]

Uma prévia do RDNA 3 foi incluída no final do evento de lançamento do Ryzen 7000 da AMD em 29 de agosto de 2022. A prévia incluía RDNA 3 rodando a jogabilidade de Lies of P, a CEO da AMD, Lisa Su, confirmando que um design de chiplet seria usado, e um uma visão parcial do design de referência da AMD para uma GPU RDNA 3.^[3]

Detalhes completos da arquitetura RDNA 3 foram revelados em 3 de novembro de 2022 em um evento em Las Vegas.^[4]

Detalhes arquitetônicos

Embalagem de chips

Pela primeira vez em uma GPU de consumo, o RDNA 3 utiliza chips modulares. Anteriormente, a AMD teve grande sucesso com o uso de chips em seus desktops Ryzen e processadores de servidor Epyc.^[5]

A decisão de mudar para uma microarquitetura de GPU baseada em chips foi liderada pelo vice-presidente sênior da AMD, Sam Naffziger, que também liderou a iniciativa de chips com Ryzen e Epyc.^[6] O desenvolvimento da arquitetura de chiplet RDNA 3 começou no final de 2017, com Naffziger liderando a equipe gráfica da AMD no esforço.^[7]

Memory Cache Dies (MCDs)

Com respectivos 2,05 bilhões de transistores, cada Memory Cache Die (MCD) contém grandes blocos de cache L3 e duas interfaces de memória física GDDR6 de 32 bits para uma interface combinada de 64 bits por MCD.^[8] A Radeon RX 7900 XTX possui um barramento de memória de 384 bits através do uso de seis MCDs, enquanto a RX 7900 XT possui um barramento de 320 bits devido aos seus cinco MCDs.

Chiplets interconectados

As interconexões de chiplets têm uma largura de banda de 5,3 TB/s.^[9]

Nó de processo

De acordo com Naffziger, o cache e a SRAM não são escalonados tão linearmente quanto a lógica em nós avançados como o N5 em termos de densidade e consumo de energia, portanto, podem ser fabricados no nó N6 mais barato e mais maduro. O uso de matrizes de chips menores em vez de uma matriz monolítica grande é benéfico para maximizar o rendimento do wafer, pois mais matrizes podem ser instaladas em um único wafer.^[7]

Unidades de computação

O RDNA 3 inclui ALUs de shader de dois problemas aprimoradas com a capacidade de executar duas instruções por ciclo. Ele pode conter até 96 unidades de computação gráfica que podem fornecer até 61 TFLOPS de computação.^[10]

RDNA 3 tem aceleração de IA dedicada com instruções Wave MMA (matriz multiplicar-acumular),^[11] que podem melhorar o desempenho baseado em IA em 2,7x e também beneficia instruções de rastreamento de raio, semelhantes aos núcleos Tensor da Nvidia.^[10]

Ray tracing

Cada unidade de computação RDNA 3 contém um acelerador de traçado de raio. O número geral de aceleradores de ray tracing aumentou devido ao maior número de unidades de computação, embora o número de aceleradores de ray tracing por unidade de computação não tenha aumentado em relação ao RDNA 2.

Clock speeds

O RDNA 3 foi projetado para suportar altas velocidades de clock. No RDNA 3, as velocidades de clock foram desacopladas com o front-end operando a uma frequência de 2,5 GHz enquanto os shaders operam a 2,3 GHz. Os shaders operando em uma velocidade de clock mais baixa proporcionam até 25% de economia de energia de acordo com a AMD e a velocidade de clock do shader do RDNA 3 ainda é 15% mais rápida que a do RDNA 2.^[12]

Subsistema de cache e memória

As GPUs RDNA 3 usam memória GDDR6 em vez do GDDR6X mais rápido devido ao aumento do consumo de energia deste último.

16 MB de Infinity Cache estão incluídos em cada MCD. Teoricamente, cache L3 adicional poderia ser adicionado aos MCDs por meio da tecnologia de empilhamento de matrizes 3D V-Cache da AMD, já que os MCDs contêm pontos de conexão TSV não utilizados.^[13]^[14]

Eficiência energética

A AMD afirma que o RDNA 3 atinge um aumento de 54% no desempenho por watt, o que está alinhado com suas afirmações anteriores de aumentos de 50% no desempenho por watt para RDNA e RDNA 2.

Mecanismo de mídia

RDNA 3 é a primeira arquitetura RDNA a ter um mecanismo de mídia dedicado. Ele é integrado ao GCD e é baseado no núcleo de codificação e decodificação VCN 4.0.^[15] O codificador AMF AV1 da AMD é comparável em qualidade ao codificador NVENC AV1 da Nvidia, mas pode lidar com um número maior de fluxos de codificação simultâneos em comparação com o limite de 3 na série GeForce RTX 40.^[16]

Taxas de quadros de codificação (FPS) suportadas por resolução e formato de codificação de vídeo^[17]
Resolução	H.264	H.265	AV1
1080p
1440p
4K	180	180	240
8K	48	48	60

Mecanismo de exibição

As GPUs RDNA 3 apresentam um novo mecanismo de exibição chamado "Radiance Display Engine". A AMD elogiou seu suporte para DisplayPort 2.1 UHBR 13.5, oferecendo largura de banda de até 54 Gbit/s para altas taxas de atualização em resoluções de 4K e 8K.^[18] DisplayPort 2.1 pode suportar 4K a 480 Hz e 8K a 165 Hz com Display Stream Compression (DSC). O padrão DisplayPort 1.4 anterior com DSC era limitado a 4K a 240 Hz e 8K a 60 Hz.

Dies Navi 3x

Produtos

Desktop

Mobile

Desktop Workstation

Processadores gráficos integrados (iGPs)

Modelo	Lançamento	Codinome	Arquitetura & Fab	Tamanho da matriz	Core		Taxa de preenchimento^[a]^[b]^[c]		Poder de processamento^[a]^[d] (GFLOPS)			Cache			TDP	Interface do barramento
Modelo	Lançamento	Codinome	Arquitetura & Fab	Tamanho da matriz	Config^[e]^[f]	Clock^[a] (MHz)	Textura (GT/s)	Pixel (GP/s)	Half	Single	Double	L0	L1	L2	TDP	Interface do barramento
Radeon 740M^[19]	abril de 2023	Phoenix	RDNA 3 TSMC N4	178 mm²	4 CU 256:16:8:4	2500	40	26.7	2,560	1,280	80	64 KB	512 KB	2 MB	15–30 W	PCIe 4.0 ×8
Ryzen Z1^[20]					4 CU 256:16:8:4	2500	40	26.7	2,560	1,280	80	64 KB	512 KB		9–30 W
Radeon 760M^[21]					8 CU 512:32:16:8	1000 2600	32 83.2	21.3 55.5	2,048 5,325	1,024 2,662	64 332.8	128 KB	1 MB		15–54 W
Radeon 780M^[22]					12 CU 768:48:24:12	2700	129.6	86.4	8,294	4,147	259.2	192 KB	1.5 MB		15–54 W
Ryzen Z1 Extreme^[23]					12 CU 768:48:24:12	2700	129.6	86.4	8,294	4,147	259.2	192 KB	1.5 MB		9–30 W

↑ ^a ^b ^c Valores de boost (se disponíveis) são indicados abaixo do valor base em itálico.
↑ A taxa de preenchimento da textura é calculada como o número de Unidades de mapeamento de textura multiplicado pela velocidade básica (ou boost) do clock do núcleo.
↑ A taxa de preenchimento de pixel é calculada como o número de Unidades de saída de renderização multiplicado pela velocidade de clock base (ou boost) do núcleo.
↑ O desempenho de precisão é calculado a partir da velocidade básica (ou boost) do clock do núcleo com base em uma operação FMA.
↑ Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização, Aceleradores Ray e unidade de computação (CU)
↑ GPUs baseadas em RDNA 3 têm processadores de fluxo de emissão dupla para que até duas instruções de shader possam ser executadas por ciclo de clock sob certas condições de paralelismo.

https://en.wikipedia.org/wiki/RDNA_3#Media_engine

Ver também

Lista de unidades de processamento gráfico da AMD

Referências

↑ Smith, Ryan (9 de junho de 2022). «AMD's 2022-2024 Client GPU Roadmap: RDNA 3 This Year, RDNA 4 Lands in 2024». AnandTech (em inglês). Consultado em 15 de setembro de 2023
↑ Walton, Jarred (9 de junho de 2022). «AMD GPU Roadmap: RDNA 3 With 5nm GPU Chiplets Coming This Year». Tom's Hardware (em inglês). Consultado em 15 de setembro de 2023
↑ Wickens, Katie (31 de agosto de 2022). «AMD's Lisa Su confirms chiplet-based RDNA 3 GPU architecture». PC Gamer (em inglês). Consultado em 15 de setembro de 2023
↑ «AMD Unveils World's Most Advanced Gaming Graphics Cards, Built on Groundbreaking AMD RDNA 3 Architecture with Chiplet Design». AMD (em inglês). Las Vegas, NV. 3 de novembro de 2022. Consultado em 15 de setembro de 2023
↑ James, Dave (24 de junho de 2022). «AMD suggests a Ryzen-like design for RDNA 3 chiplets would be 'a reasonable inference'». PC Gamer (em inglês). Consultado em 16 de setembro de 2023
↑ Alcorn, Paul; Walton, Jarred (23 de junho de 2022). «Into the GPU Chiplet Era: An Interview With AMD's Sam Naffziger». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023
↑ ^a ^b Brosdahl, Peter (22 de novembro de 2022). «AMD Lead Engineer Sam Naffziger Explains Advantages of RDNA3 Chiplet Design». The FPS Review (em inglês). Consultado em 16 de setembro de 2023
↑ Walton, Jarred (14 de novembro de 2022). «AMD RDNA 3 GPU Architecture Deep Dive: The Ryzen Moment for GPUs». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023
↑ «AMD Explains the Economics Behind Chiplets for GPUs». TechPowerUp (em inglês). 14 de novembro de 2022. Consultado em 16 de setembro de 2023
↑ ^a ^b Gula, Damien (3 de novembro de 2022). «AMD's RDNA 3 GPUs are Way Cheaper Than the RTX 4090». Gizmodo (em inglês). Consultado em 16 de setembro de 2023
↑ Vasishta, Aaryaman (10 de janeiro de 2023). «How to accelerate AI applications on RDNA 3 using WMMA». GPUOpen.com. Consultado em 16 de setembro de 2023. Cópia arquivada em 10 de janeiro de 2023
↑ Olšan, Jan (7 de novembro de 2022). «AMD RDNA 3 details: architecture changes, AI acceleration, DP 2.1». HWCooling (em inglês). Consultado em 16 de setembro de 2023
↑ Klotz, Aaron (29 de janeiro de 2023). «AMD GPU Appears to Leave Room for Future 3D V-Cache». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023
↑ Ridley, Jacob (30 de janeiro de 2023). «Tiny spots on AMD's RDNA 3 GPU hint at massive cache potential». PC Gamer (em inglês). Consultado em 16 de setembro de 2023
↑ Shilov, Anton (4 de maio de 2022). «First Details About AMD's Next Generation Video Engine Revealed». Tom's Hardware (em inglês). Consultado em 17 de setembro de 2023
↑ Klotz, Aaron (12 de dezembro de 2022). «AMD's Radeon RX 7900 AV1 encoder is almost on par with Intel Arc and Nvidia's RTX 40 series». TechSpot (em inglês). Consultado em 17 de setembro de 2023
↑ Taylor, Adam (14 de dezembro de 2022). «Tested: With RDNA 3, AMD Radeon is finally useful for content creators». PCWorld (em inglês). Consultado em 17 de setembro de 2023
↑ Sag, Anshel (14 de novembro de 2022). «AMD's New Radeon RX 7900XTX And 7900XT Put The Pressure On NVIDIA». Forbes (em inglês). Consultado em 17 de setembro de 2023
↑ https://www.amd.com/en/products/apu/amd-ryzen-5-7540u
↑ https://www.amd.com/en/products/apu/amd-ryzen-z1
↑ https://www.amd.com/en/products/apu/amd-ryzen-5-7640hs
↑ https://www.amd.com/en/products/apu/amd-ryzen-9-7940hs
↑ https://www.amd.com/en/products/apu/amd-ryzen-z1-extreme

Ligações externas

[Boost-19] Valores de boost (se disponíveis) são indicados abaixo do valor base em itálico.

[Texture_fill-20] A taxa de preenchimento da textura é calculada como o número de Unidades de mapeamento de textura multiplicado pela velocidade básica (ou boost) do clock do núcleo.

[Pixel_fill-21] A taxa de preenchimento de pixel é calculada como o número de Unidades de saída de renderização multiplicado pela velocidade de clock base (ou boost) do núcleo.

[FLOPS-22] O desempenho de precisão é calculado a partir da velocidade básica (ou boost) do clock do núcleo com base em uma operação FMA.

[Core_config-23] Shaders Unificados: Unidades de Mapeamento de Textura: Unidades de Saída de Renderização, Aceleradores Ray e unidade de computação (CU)

[Stream_processors-24] GPUs baseadas em RDNA 3 têm processadores de fluxo de emissão dupla para que até duas instruções de shader possam ser executadas por ciclo de clock sob certas condições de paralelismo.

[1] Smith, Ryan (9 de junho de 2022). «AMD's 2022-2024 Client GPU Roadmap: RDNA 3 This Year, RDNA 4 Lands in 2024». AnandTech (em inglês). Consultado em 15 de setembro de 2023

[2] Walton, Jarred (9 de junho de 2022). «AMD GPU Roadmap: RDNA 3 With 5nm GPU Chiplets Coming This Year». Tom's Hardware (em inglês). Consultado em 15 de setembro de 2023

[3] Wickens, Katie (31 de agosto de 2022). «AMD's Lisa Su confirms chiplet-based RDNA 3 GPU architecture». PC Gamer (em inglês). Consultado em 15 de setembro de 2023

[4] «AMD Unveils World's Most Advanced Gaming Graphics Cards, Built on Groundbreaking AMD RDNA 3 Architecture with Chiplet Design». AMD (em inglês). Las Vegas, NV. 3 de novembro de 2022. Consultado em 15 de setembro de 2023

[5] James, Dave (24 de junho de 2022). «AMD suggests a Ryzen-like design for RDNA 3 chiplets would be 'a reasonable inference'». PC Gamer (em inglês). Consultado em 16 de setembro de 2023

[6] Alcorn, Paul; Walton, Jarred (23 de junho de 2022). «Into the GPU Chiplet Era: An Interview With AMD's Sam Naffziger». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023

[Brosdahl-7] Brosdahl, Peter (22 de novembro de 2022). «AMD Lead Engineer Sam Naffziger Explains Advantages of RDNA3 Chiplet Design». The FPS Review (em inglês). Consultado em 16 de setembro de 2023

[Walton-8] Walton, Jarred (14 de novembro de 2022). «AMD RDNA 3 GPU Architecture Deep Dive: The Ryzen Moment for GPUs». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023

[9] «AMD Explains the Economics Behind Chiplets for GPUs». TechPowerUp (em inglês). 14 de novembro de 2022. Consultado em 16 de setembro de 2023

[Gula-10] Gula, Damien (3 de novembro de 2022). «AMD's RDNA 3 GPUs are Way Cheaper Than the RTX 4090». Gizmodo (em inglês). Consultado em 16 de setembro de 2023

[wmma-gpuopen-11] Vasishta, Aaryaman (10 de janeiro de 2023). «How to accelerate AI applications on RDNA 3 using WMMA». GPUOpen.com. Consultado em 16 de setembro de 2023. Cópia arquivada em 10 de janeiro de 2023

[12] Olšan, Jan (7 de novembro de 2022). «AMD RDNA 3 details: architecture changes, AI acceleration, DP 2.1». HWCooling (em inglês). Consultado em 16 de setembro de 2023

[13] Klotz, Aaron (29 de janeiro de 2023). «AMD GPU Appears to Leave Room for Future 3D V-Cache». Tom's Hardware (em inglês). Consultado em 16 de setembro de 2023

[14] Ridley, Jacob (30 de janeiro de 2023). «Tiny spots on AMD's RDNA 3 GPU hint at massive cache potential». PC Gamer (em inglês). Consultado em 16 de setembro de 2023

[15] Shilov, Anton (4 de maio de 2022). «First Details About AMD's Next Generation Video Engine Revealed». Tom's Hardware (em inglês). Consultado em 17 de setembro de 2023

[16] Klotz, Aaron (12 de dezembro de 2022). «AMD's Radeon RX 7900 AV1 encoder is almost on par with Intel Arc and Nvidia's RTX 40 series». TechSpot (em inglês). Consultado em 17 de setembro de 2023

[17] Taylor, Adam (14 de dezembro de 2022). «Tested: With RDNA 3, AMD Radeon is finally useful for content creators». PCWorld (em inglês). Consultado em 17 de setembro de 2023

[18] Sag, Anshel (14 de novembro de 2022). «AMD's New Radeon RX 7900XTX And 7900XT Put The Pressure On NVIDIA». Forbes (em inglês). Consultado em 17 de setembro de 2023

[25] ttps://www.amd.com/en/products/apu/amd-ryzen-5-7540u

[26] ttps://www.amd.com/en/products/apu/amd-ryzen-z1

[27] ttps://www.amd.com/en/products/apu/amd-ryzen-5-7640hs

[28] ttps://www.amd.com/en/products/apu/amd-ryzen-9-7940hs

[29] ttps://www.amd.com/en/products/apu/amd-ryzen-z1-extreme

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[a]

[b]

[c]

[d]

[e]

[f]

[19]

[20]

[21]

[22]

[23]

Usuário:Elder N/Testes/Radeon (tradução em progresso)