RDNA 3 é uma microarquitetura de GPU projetada pela AMD, lançada com a série Radeon RX 7000 em 13 de novembro de 2022.
Background
Em 9 de junho de 2022, a AMD realizou seu Dia do Analista Financeiro, onde apresentou um roteiro de GPU do cliente que continha menção ao RDNA 3 chegando em 2022 e RDNA 4 chegando em 2024.[1] A AMD anunciou aos investidores sua intenção de alcançar um aumento de desempenho-por-watt de mais de 50% com RDNA 3 e que a próxima arquitetura seria construída usando empacotamento de chiplet em um processo de 5 nm.[2]
Uma prévia do RDNA 3 foi incluída no final do evento de lançamento do Ryzen 7000 da AMD em 29 de agosto de 2022. A prévia incluía RDNA 3 rodando a jogabilidade de Lies of P, a CEO da AMD, Lisa Su, confirmando que um design de chiplet seria usado, e um uma visão parcial do design de referência da AMD para uma GPU RDNA 3.[3]
Detalhes completos da arquitetura RDNA 3 foram revelados em 3 de novembro de 2022 em um evento em Las Vegas.[4]
Detalhes arquitetônicos
Embalagem de chips
Pela primeira vez em uma GPU de consumo, o RDNA 3 utiliza chips modulares. Anteriormente, a AMD teve grande sucesso com o uso de chips em seus desktops Ryzen e processadores de servidor Epyc.[5]
A decisão de mudar para uma microarquitetura de GPU baseada em chips foi liderada pelo vice-presidente sênior da AMD, Sam Naffziger, que também liderou a iniciativa de chips com Ryzen e Epyc.[6] O desenvolvimento da arquitetura de chiplet RDNA 3 começou no final de 2017, com Naffziger liderando a equipe gráfica da AMD no esforço.[7]
Memory Cache Dies (MCDs)
Com respectivos 2,05 bilhões de transistores, cada Memory Cache Die (MCD) contém grandes blocos de cache L3 e duas interfaces de memória física GDDR6 de 32 bits para uma interface combinada de 64 bits por MCD.[8] A Radeon RX 7900 XTX possui um barramento de memória de 384 bits através do uso de seis MCDs, enquanto a RX 7900 XT possui um barramento de 320 bits devido aos seus cinco MCDs.
Chiplets interconectados
As interconexões de chiplets têm uma largura de banda de 5,3 TB/s.[9]
Nó de processo
De acordo com Naffziger, o cache e a SRAM não são escalonados tão linearmente quanto a lógica em nós avançados como o N5 em termos de densidade e consumo de energia, portanto, podem ser fabricados no nó N6 mais barato e mais maduro. O uso de matrizes de chips menores em vez de uma matriz monolítica grande é benéfico para maximizar o rendimento do wafer, pois mais matrizes podem ser instaladas em um único wafer.[7]
Unidades de computação
O RDNA 3 inclui ALUs de shader de dois problemas aprimoradas com a capacidade de executar duas instruções por ciclo. Ele pode conter até 96 unidades de computação gráfica que podem fornecer até 61 TFLOPS de computação.[10]
RDNA 3 tem aceleração de IA dedicada com instruções Wave MMA (matrizmultiplicar-acumular),[11] que podem melhorar o desempenho baseado em IA em 2,7x e também beneficia instruções de rastreamento de raio, semelhantes aos núcleos Tensor da Nvidia.[10]
Ray tracing
Cada unidade de computação RDNA 3 contém um acelerador de traçado de raio. O número geral de aceleradores de ray tracing aumentou devido ao maior número de unidades de computação, embora o número de aceleradores de ray tracing por unidade de computação não tenha aumentado em relação ao RDNA 2.
Clock speeds
O RDNA 3 foi projetado para suportar altas velocidades de clock. No RDNA 3, as velocidades de clock foram desacopladas com o front-end operando a uma frequência de 2,5 GHz enquanto os shaders operam a 2,3 GHz. Os shaders operando em uma velocidade de clock mais baixa proporcionam até 25% de economia de energia de acordo com a AMD e a velocidade de clock do shader do RDNA 3 ainda é 15% mais rápida que a do RDNA 2.[12]
Subsistema de cache e memória
As GPUs RDNA 3 usam memória GDDR6 em vez do GDDR6X mais rápido devido ao aumento do consumo de energia deste último.
16 MB de Infinity Cache estão incluídos em cada MCD. Teoricamente, cache L3 adicional poderia ser adicionado aos MCDs por meio da tecnologia de empilhamento de matrizes 3D V-Cache da AMD, já que os MCDs contêm pontos de conexão TSV não utilizados.[13][14]
Eficiência energética
A AMD afirma que o RDNA 3 atinge um aumento de 54% no desempenho por watt, o que está alinhado com suas afirmações anteriores de aumentos de 50% no desempenho por watt para RDNA e RDNA 2.
Mecanismo de mídia
RDNA 3 é a primeira arquitetura RDNA a ter um mecanismo de mídia dedicado. Ele é integrado ao GCD e é baseado no núcleo de codificação e decodificação VCN 4.0.[15] O codificador AMF AV1 da AMD é comparável em qualidade ao codificador NVENC AV1 da Nvidia, mas pode lidar com um número maior de fluxos de codificação simultâneos em comparação com o limite de 3 na série GeForce RTX 40.[16]
Taxas de quadros de codificação (FPS) suportadas por resolução e formato de codificação de vídeo[17]
As GPUs RDNA 3 apresentam um novo mecanismo de exibição chamado "Radiance Display Engine". A AMD elogiou seu suporte para DisplayPort 2.1 UHBR 13.5, oferecendo largura de banda de até 54 Gbit/s para altas taxas de atualização em resoluções de 4K e 8K.[18] DisplayPort 2.1 pode suportar 4K a 480 Hz e 8K a 165 Hz com Display Stream Compression (DSC). O padrão DisplayPort 1.4 anterior com DSC era limitado a 4K a 240 Hz e 8K a 60 Hz.
↑ abcValores de boost (se disponíveis) são indicados abaixo do valor base em itálico.
↑A taxa de preenchimento da textura é calculada como o número de Unidades de mapeamento de textura multiplicado pela velocidade básica (ou boost) do clock do núcleo.
↑A taxa de preenchimento de pixel é calculada como o número de Unidades de saída de renderização multiplicado pela velocidade de clock base (ou boost) do núcleo.
↑O desempenho de precisão é calculado a partir da velocidade básica (ou boost) do clock do núcleo com base em uma operação FMA.
↑GPUs baseadas em RDNA 3 têm processadores de fluxo de emissão dupla para que até duas instruções de shader possam ser executadas por ciclo de clock sob certas condições de paralelismo.