CDNA 3 ve Zen 4 Gelişmiş Bir Paketlemede Bir Araya Geliyor - Dünyadan Güncel Teknoloji Haberleri

CDNA 3 ve Zen 4 Gelişmiş Bir Paketlemede Bir Araya Geliyor - Dünyadan Güncel Teknoloji Haberleri

Bellek, 5,2 TB/s’ye kadar bant genişliği ve 896 GB/sn Infinity Fabric Bant Genişliği sunacak 7 TFLOP’lar FP32 Bilgisayar henüz bilinmiyor TBA 95,7 TFLOP 90,5 TFLOP 45 2 TFLOP’lar 5 ) henüz bilinmiyor 750W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Bu hikayeyi paylaş

Facebook

heyecan



genel-17

3 TFLOP 22 3 TFLOP’lar 12 fazla 1 TFLOP’lar 14 7 TFLOP’lar FP64 Bilgisayar henüz bilinmiyor TBA 47,9 TFLOP 45

Tasarımdan başlayarak ana aracı, yeni nesil Infinity Fabric çözümü kullanılarak ara bağlantı katmanını barındıran pasif bir kalıpla yerleştirildi Bu yeni GPU ve CPU hızlandırmalı aile, AMD’nin 1 numaralı ve şu anda en önemli stratejik önceliği olan yapay zeka segmentinin lider ürünü olacak ve sonunda sadece gelişmiş değil aynı zamanda gereksinimleri karşılayacak şekilde tasarlanmış bir ürünü piyasaya sürecek

Aktif kalıplardan birinde iki adet CDNA 3 GCD kesilip yerine kendi ayrı önbellek ve çekirdek IP havuzları sunan üç Zen 4 CCD yerleştirildi 6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP VRAM henüz bilinmiyor 192 GB HBM3 128 GB HBM2e 128 GB HBM2e 64 GB HBM2e 32GB HBM2 32GB HBM2 16GB HBM2 16GB HBM2 4GB HBM1 16 GB GDDR5 Hafıza saati henüz bilinmiyor 5,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 3,2 Gb/sn 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz Bellek Veriyolu henüz bilinmiyor 8192-bit 8192-bit 8192-bit 4096 bit 4096 bit veri yolu 4096 bit veri yolu 4096 bit veri yolu 2048 bit veri yolu 4096 bit veri yolu 256 bit veri yolu Bellek Bant Genişliği henüz bilinmiyor 5,2 TB/sn 3,2 TB/sn 3,2 TB/sn 1,6 TB/sn 1,23 TB/sn 1 TB/sn 1 TB/sn 484 GB/sn 512 GB/sn 224 GB/sn Form faktörü henüz bilinmiyor OAM OAM OAM Çift Yuvalı Kart Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Tam Uzunlukta Çift Yuvalı, Yarım Uzunlukta Tek Yuvalı, Tam Uzunlukta Soğutma henüz bilinmiyor Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma Pasif Soğutma TDP (Maks 7 TFLOP’lar 13 Şu anda kesin olan bir şey var ki, AI müşterileri alabilecekleri neredeyse her şeyi silip süpürecek ve herkes bundan yararlanacak CCD başına 8 çekirdek ve 16 iş parçacığı elde edersiniz, yani aktif kalıpta toplam 24 çekirdek ve 48 iş parçacığı bulunur

AMD Instinct MI300X, GPU Hızlandırmalı Yapay Zeka İş Yükleri için Tasarlanırken MI300A, Teknik Açıdan En Gelişmiş APU Paketiyle HPC ile Mücadele Ediyor

6 Aralık’ta AMD, ana gündemlerinden birinin MI300 kod adlı yeni nesil Instinct hızlandırıcı ailesinin tam olarak tanıtılması olduğu “Gelişen Yapay Zeka” açılış konuşmasına ev sahipliği yapacak 2 TFLOP’lar 5 CDNA 3 GCD’lerin ayrıca L2 önbelleğinin ayrı olduğu unutulmamalıdır

AMD Instinct MI300A Hızlandırıcı Karşılaştırma yapmak gerekirse, NVIDIA’nın yakında çıkacak olan H200 AI hızlandırıcısı 141 GB kapasite sunarken Intel’in Gaudi 3’ü 144 GB kapasite sunacak 480 çekirdek birim sağlar

AMD Radeon Instinct Hızlandırıcıları
Hızlandırıcı Adı AMD Instinct MI400 AMD Instinct MI300 AMD Instinct MI250X AMD İçgüdü MI250 AMD İçgüdü MI210 AMD İçgüdü MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
CPU Mimarisi Zen 5 (Exascale APU) Zen 4 (Exascale APU) Yok Yok Yok Yok Yok Yok Yok Yok Yok
GPU Mimarisi CDNA 4 Su Vanjaramı (CDNA 3) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Arkturus (CDNA 1) Vega 20 Vega 20 Vega 10 Fiji XT Polaris10
GPU İşlem Düğümü 4nm 5nm+6nm 6nm 6nm 6nm 7 nm FinFET 7 nm FinFET 7 nm FinFET 14 nm FinFET 28nm 14 nm FinFET
GPU Yongaları henüz bilinmiyor 8 (MCM) 2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
2 (MCM)
1 (Kalıp Başına)
1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik) 1 (Monolitik)
GPU Çekirdekleri henüz bilinmiyor 19


AMD Instinct MI300X ve MI300A, yapay zeka segmentinde önümüzdeki ay piyasaya sürülecek en çok beklenen hızlandırıcılardan bazıları Çip, tümü 153 Milyar transistöre (MI300X) kadar sunmak üzere bir araya getirilen 5nm ve 6nm IP’lerin bir karışımını barındıracak 6 TFLOP

8 Sektördeki kritik yapay zeka gereksinimi Bu çip yalnızca CDNA 3 mimarisine göre tasarlandı ve pek çok şey yapılıyor Ancak AMD’nin, yalnızca NVIDIA’ya alternatif olmayı değil, aynı zamanda yapay zeka segmentinde lider olmayı hedefleyen çok güçlü bir çözümü var ve MI300’ün bu başarıya ulaşmalarına yardımcı olabileceğini umuyoruz MI300 sınıfı AI hızlandırıcılar, TSMC’nin gelişmiş paketleme teknolojilerinden yararlanan başka bir chiplet güç merkezi olacak, bu yüzden bu AI canavarlarının altında ne olduğunu görelim

CDNA 3 ve Zen 4’e sahip AMD Instinct MI300A Hızlandırıcı ölür Büyük bellek havuzları, çoğunlukla belleğe bağlı olan Yüksek Lisans’larda çok önemlidir ve AMD, bellek departmanında lider olarak AI yeteneğini kesinlikle gösterebilir 312
6656 7680 4096 3840 4096 4096 2304
GPU Saat Hızı henüz bilinmiyor TBA 1700 MHz 1700 MHz 1700 MHz 1500 MHz 1800 MHz 1725MHz 1500 MHz 1000 MHz 1237 MHz
FP16 Bilgisayar henüz bilinmiyor TBA 383 ÜST 362 ÜST 181 ÜST 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24

AMD Instinct MI300X – CDNA 3 ve Devasa Bellekle NVIDIA’nın Yapay Zeka Üstünlüğüne meydan okuyor

AMD Instinct MI300X, AI segmentindeki NVIDIA’nın Hopper ve Intel’in Gaudi hızlandırıcılarını açıkça hedef aldığından kesinlikle en çok öne çıkacak çiptir 080

13

AMD Instinct MI300A – Yoğun Paketlenmiş Exascale APU’lar Artık Gerçek

Yıllardır AMD’nin sonunda Exascale sınıfı APU vaadini yerine getirmesini bekledik ve Instinct MI300A’nın piyasaya sürülmesine yaklaştığımız gün yaklaşıyor Ayrıca 24 MB L2 önbellek (çekirdek başına 1 MB) ve ayrı bir önbellek havuzu (CCD başına 32 MB) bulunmaktadır AMD, 192 GB’lık bir bellek havuzu elde etmek için MI300X’i 8 HBM3 yığınıyla donatıyor ve her yığın 12-Hi olup, bize IC başına 2 GB veya yığın başına 24 GB kapasite sağlayan 16 Gb IC’leri dahil ediyor MI300A’nın ambalajı, TCO için optimize edilmiş bellek kapasitelerini ve Zen 4 çekirdeklerini kullanması dışında MI300X’e çok benzer

CDNA 3 GPU mimarisini temel alan her bir GCD, 2560 çekirdeğe karşılık gelen toplam 40 işlem birimine sahiptir Aracı, sekiz HBM3 paketi, HBM paketleri arasında 16 yapay kalıp ve dört aktif kalıp içeren toplam 28 kalıp içerir ve bu aktif kalıpların her biri iki hesaplama kalıbı alır Verim açısından AMD bu çekirdeklerin küçük bir kısmını küçültecek ve bundan bir ay sonra kesin yapılandırmalar hakkında daha fazla ayrıntı alacağız AMD’nin ilk tam teşekküllü yapay zeka başyapıtı hakkında pek çok beklenti var ve bugün size bu teknik harikadan neler bekleyebileceğimize dair bir özet sunmayı düşündük 3 TFLOP

23 4 TFLOP’lar 6 6 TFLOP 11

AMD Instinct MI300X Hızlandırıcı

CDNA 3’lü AMD Instinct MI300X Hızlandırıcı ölür Toplamda sekiz hesaplama kalıbı (GCD) vardır, bu da bize toplam 320 Bilgi İşlem ve 20

AMD Instinct MI300 Hızlandırıcıların öne çıkan bazı özelliklerini özetlersek:

  • İlk Entegre CPU+GPU Paketi
  • Exascale Süper Bilgisayar Pazarını Hedeflemek
  • AMD MI300A (Entegre CPU + GPU)
  • AMD MI300X (Yalnızca GPU)
  • 153 Milyar Transistör
  • 24’e kadar Zen 4 Çekirdeği
  • CDNA 3 GPU Mimarisi
  • 192 GB’a kadar HBM3 Bellek
  • 8 Chiplet’e kadar + 8 Bellek Yığını (5nm + 6nm işlem)

Tüm bunları bir araya getiren AMD, ekosistem sağlayıcıları ve ortaklarıyla birlikte çalışarak MI300 AI hızlandırıcılarını, asma konnektörlerle ana karta bağlanan SXM tasarımlarına sahip 8 yollu konfigürasyonlarda sunacak 5 TFLOP

7 Karşılaştırmalar için:

  • İçgüdü MI300X – 192 GB HBM3
  • Gaudi 3 – 144GB HBM3
  • H200 – 141 GB HBM3e
  • MI300A – 128GB HBM3
  • MI250X – 128 GB HBM2e
  • H100 – 96 GB HBM3
  • Gaudi 2 – 96 GB HBM2e

Güç tüketimi açısından AMD Instinct MI300X, 750W olarak derecelendirilmiştir; bu, Instinct MI250X’in 500W’ına göre %50 ve NVIDIA H200’e göre 50W daha fazladır 456’ya kadar

14

Bellek, MI300X’in selefi MI250X’e (128 GB) göre %50 daha fazla HBM3 kapasitesine sahip olmasıyla büyük bir yükseltme göreceğiniz başka bir alandır

Şimdilik AMD, NVIDIA’nın 2024 Blackwell GPU’ları için bazı büyük rakamları açıkladığı ve Intel’in Guadi 3 ve Falcon Shores GPU’larını önümüzdeki yıllarda piyasaya sürülmeye hazırladığını, rakiplerinin de yapay zeka çılgınlığında tam gaz ilerlediğini bilmeli 3 TFLOP’lar

8 Bunların ne tür konfigürasyonlar içinde sunulacağını görmek ilginç olacak ve SXM kartları verilmiş olsa da, PCI-E form faktörlerinde de birkaç değişken bekleyebiliriz