Anlık Bildirim

PCIe tabanlı Tesla V100 hızlandırıcısı duyuruldu

Geçtiğimiz aylarda en güçlü mimarisi Volta’nın duyurusunu yapan Nvidia, yeni mimariyi temel alan Tesla V100 hızlandırıcısının bu kez PCIe tabanlı olanını duyurdu.

Grafik teknolojileri sektörünün tanıtılmış en güçlü ekran kartı olma özelliği taşıyan Tesla V100 hızlandırıcısı, bu hafta bir de PCIe üzerinde şekillenmiş ve görünümü bir ekran kartı haline gelmiş yeni tasarımı ile karşımızda.

Nvidia hızlandırıcıyı ilk tanıttığında SXM2 adını verdiği form faktörüne sahip versiyonu göstermişti. Daha yaygın kullanım için ise PCIe versiyonu da piyasaya sürülecek. İki versiyon arasında bazı önemli farklar mevcut.

İlk olarak SXM2 formunda Nvidia en yüksek iletişim performansını veren NVLINK teknolojisini kullanıyordu. PCIe tabanlı ekran kartında ise mevcut değil. İkincisi ise saat frekansları ve işlem performansı bir miktar daha düşük. Bu sayede TDP değeri 300W seviyesinden 250W seviyesine çekilmiş. Aslında küçük bir düşüş ancak enerji tasarrufu açısından önemli bir mesafe kat edilmiş.

Diğer taraftan bir ekran kartı görünümüne büründüğü için çift slotlu bir hava soğutma sistemi ekleme imkanı doğmuş. Bu da üçüncü fark olarak öne çıkıyor. Bunların dışında iki versiyon arasında görünen bir fark yok.

Tesla V100

Volta mimarisinin en büyük ve en güçlü çekirdeği GV100, Tesla V100 hızlandırıcısına güç veriyor. 21 milyar transistör barındıran çekirdeğin zar alanı 815 milimetrekare. Boyutları büyümesi bir yana özellikle yapay zeka teknolojileri alanında önemli yeniliklerle geliyor.

GV100 çekirdeğinde 84 adet SM birimi bulunuyor. Bu SM birimlerinde 64 adet CUDA çekirdeği yer alıyor. Tamamen açık birimde 5376 adet FP32 CUDA çekirdeği, 2688 adet FP64 CUDA çekirdeği yer alıyor. 1370MHz taban hız 1455MHz seviyesine hız aşırtılabiliyor. Böylece FP32 işlem performansı 15 TFLOPS, FP16 işlem performansı ise 30 TFLOPS seviyesine çıkıyor. (PCIe için 1370MHz arttırılmış hız, 14 TFLOPS FP32 performansı, 28 TFLOPS FP16 performansı)

Yapay zekaya önem veren Nvidia, GV100 grafik birimini bu amaçla tasarlamış. Her SM biriminde 8 adet de Tensor makine öğrenme dili çekirdeği yer alıyor. Toplamda 672 Tensor çekirdeği ortaya çıkıyor. Grafik biriminin makine öğrenme dili tabanlı matriks aritmetiklerini çok daha akıcı bir şekilde hesaplayabildiği ifade ediliyor. Kartın yapay zeka performansı 112 DLOPs (Deep Learning Teraflops) ki şimdiye kadar bir yonganın sunduğu en yüksek performans durumunda.

SM biriminde de verimlilk odaklı optimizasyonlar yapılmış. Bir SM birimi artık 4 bloğa ayrılıyor. Her blokta 16 FP32 çekirdeği, 8FP64 çekirdeği, 16 INT32 çekirdeği, iki Tensor çekirdeği, yeni bir Seviye 0 komut önbelleği ve 64KB kayıt dosyası yer alıyor. Seviye 1 önbelleği ise daha yüksek performans ve düşük gecikme için genişletilmiş. Her SM için ise 96KB’a kadar paylaşılan bellek kullanılıyor.

 

PCIe tabanlı Tesla V100 hızlandırıcısı duyuruldu Tam Boyutta Gör

Bellek

Bellek tarafında geçen yıl olduğu gibi HBM2 bellek kullanılıyor. 16GB’a kadar HBM2 bellek ile 900GB/s bant genişliğine ulaşılıyor. Grafik birimi yine ilk olarak Tesla V100 adındaki yeni süper bilgisayar hızlandırıcısında kullanılacak. Tesla P100 hızlandırıcısında ise 720GB/s bant genişliği bulunuyordu. Erişilen hızlar gerçekten inanılmaz.

8 adet 512-bit bellek kontrolcüsü ile toplamda 4096-bit bellek veri yoluna ulaşılıyor. Her kontrolcüde 768KB Seviye 2 önbellek olmak üzere toplamda 6MB bellek yer alıyor. Toplamda grafik birimi 300W ısıl tasarım gücüne sahip. (PCIe için 250W)

Karşılaştırma

AMD yeni Vega tabanlı Radeon Instinct MI25 hızlandırıcısını tanıtırken, işlem performansı açısından Pascal tabanlı tüm grafik çekirdeklerinden daha iyi olduğunu dile getirmişti. Bu hakimiyet Tesla V100 ile son bulacak gibi görünüyor zira Vega mimarisi bir kaç puan geride kalmış durumda. Ayrıca Volta tabanlı ekran kartlarının Vega ekran kartlarını da geride bırakabileceği tahminini yapabiliriz. 

 
Bu haberi, mobil uygulamamızı kullanarak indirip,
istediğiniz zaman (çevrim dışı bile) okuyabilirsiniz:
DH Android Uygulamasını İndir DH iOS Uygulamasını İndir
Sorgu:

Editörün Seçtiği Sıcak Fırsatlar

Tavsiyelerimiz

Yeni Haber
şimdi
Geri Bildirim