Nvidia Tesla

Nvidia Tesla 2075

A Tesla egy erősen párhuzamos kialakítású processzor , amelyet stream processzornak is neveznek , az Nvidia cégtől . A GPU technológián alapuló processzor a házon belüli CUDA API és OpenCL segítségével címezhető. A termék közvetlenül versenyben állt a versenytárs AMD FireStream-jével vagy FirePro-jával .

Miután 2007 közepén bemutatták az első G80 GPU-alapú kártyákat, a Tesla kártyák egy évvel később a GT200 grafikus chipet követték, amelyet a Geforce 200 sorozat asztali grafikus kártyáihoz is használnak .

„Fermi” kódnéven az Nvidia 2009. szeptember 30-án bemutatta a következő generációs grafikus processzort házon belüli „GPU Technology Conference” -en, amely olyan termékekben is kapható, mint a Tesla, a Quadro kártyák és módosított formában (pl. A Double Precision berendezéssel) a Geforce 400 sorozatban használják . Az Nvidia 2010 második és harmadik negyedévére jelentette be a Fermi grafikus processzoron alapuló Tesla kártyákat a Szuperszámítógépes Kiállítás 09-en.

A legújabb illesztőprogramokkal az OpenGL, a CUDA és az OpenCL lehetőségei egyes esetekben jelentősen kibővültek.

technológia

Tesla

G80

A G80 grafikus processzor volt az Nvidia első processzora, amely az újonnan kifejlesztett egységes shader architektúrára épült . Miután a G80-at 2006 vége óta telepítették a Geforce 8800 GTX és GTS grafikus kártyákra, az Nvidia 2007 közepén mutatta be az első Tesla-modelleket. A G80-at elsősorban az A3 lépésben használják, mivel a Geforce 8800 Ultra készülékre telepítették.

GT200

A GT200 processzor volt a második chip, amelyet az Nvidia beépített a Teslaser sorozatba. A G80-zal ellentétben az Nvidia a kezdetektől fogva a Tesla modellek használatát tervezte (ezért az azonosítóban a T-t), és az IEEE-754R specifikációnak megfelelően több mint 30 további MADD egységen keresztül valósította meg a kettős pontosságú képességeket , amit a Geforce- Grafikus kártyákra nem lett volna szükség.

Fermi

A Fermikern 40 nm-es gyártási eljárással készül, és körülbelül hárommilliárd tranzisztorral rendelkezik . Az előddel , a GT200-zal ellentétben ez nagyrészt egy új fejlesztés, amely a G80 grafikus processzor egységes shader architektúráján alapul . Fermi van osztva 16 shader klaszterek, amelyekben minden csoportot, amelynek 32 stream processzor . Ez azt jelenti, hogy összesen 512 stream processzor létezik. A Fermi-Chip 16 „terhelés / tárolás” egységgel rendelkezik, valamint négy különálló „speciális funkció egységgel” rendelkezik a szinusz és a koszinusz számításához . A Fermikernen hat 64 bites memóriavezérlő is található a GDDR5 memóriához , ami 384 bites memória interfészt eredményez. Ez lehetővé teszi a memória kibővítését 1,5, 3 és 6 GB-ra. A memória vezérlő most már képes kezelni az ECC memóriát is, amelynek saját hibajavítása van.

Az Nvidia most már egyre nagyobb jelentőséget tulajdonít a GPU számítástechnikának, ezért sok építészeti változtatást hajtottak végre a Fermikernben a teljesítmény javítása érdekében ezen a területen. A Fermi az első olyan grafikus processzor, amely teljes mértékben támogatja a C ++ szoftvert, és teljes mértékben kompatibilis az IEEE-754-2008 szabványmal (korábban IEEE-754-1985). Ez utóbbi azért vált szükségessé, hogy a MAD-nál pontosabb FMA-t (Fused Multiply-Add) használhassuk a kettős pontosságú képességek javítására ( kettős pontossággal történő számítás ). Ez lehetővé teszi, hogy minden Fermikern shader klaszter 16 dupla pontosságú műveletet hajtson végre órajelenként. Ez azt jelenti, hogy a Fermi összesen 256 számítást tud végrehajtani ciklusonként kettős pontossággal, míg a GT200-on csak 30 volt lehetséges. A megosztott memória mellett a Fermi grafikus processzor rendelkezik egy L1 és L2 gyorsítótárral is a GPU számítási képességeinek javítása érdekében .

Kepler

GK104

2012. március 22-én az Nvidia bemutatta a Geforce GTX 680-at, a Geforce 600 sorozat első grafikus kártyáját, amellyel bemutatták az új Kepler architektúrát. A Geforce GTX 680 a GK104 grafikus processzorra épül, amely 3,54 milliárd tranzisztorból, valamint 1536 stream processzorból és 128 textúra egységből áll, amelyek nyolc árnyékoló fürtbe vannak rendezve. A GK104-GPU-t 28 nm-es gyártási folyamatban gyártják a TSMC-n, és a szerszámterülete 294 mm². A GK104-et eredetileg a teljesítményszektor grafikus chipjeként tervezték. a. a csökkentett „dupla pontosságú” teljesítmény alapján ismerhető fel. Miután az Nvidia elejtette a GK100 grafikus processzort a GK110 javára, a GK104-et is a csúcskategóriás szektor számára kellett használni, mivel a GK110 csak a Kepler frissítő generáció számára volt elérhető.

GK110

A GK110-GPU a Kepler-generáció legnagyobb és legösszetettebb grafikus processzora, 7,1 milliárd tranzisztorral, mintegy 561 mm²-en (533 mm² a gyártásoptimalizált B1 lépésben). 2880 shader és 240 textúra egységből áll, amelyek 15 SMX blokkon (shader fürtön) vannak elosztva. Ezek viszont öt grafikus feldolgozó fürtön oszlanak meg, ami azt jelenti, hogy a GK110 aránya 3: 1 (ellentétben a Kepler generáció többi grafikus processzorával, amelyek 2: 1 arányt használnak). A GK110 másik különlegessége az SMX-blokkonként további 64 külön ALU, amelyek nem az egypontos (FP32), hanem a kettős pontosságú műveletért (FP64) felelősek . A "Dinamikus párhuzamosság", a "Hyper-Q" és a "GPUDirect" funkciókat szintén a szakmai szektornak szánják, és csak a GK110-GPU-n érhetők el.

GK210

A Maxwell architektúra korlátai miatt a GK110 továbbfejlesztett változatát tervezték a Tesla sorozathoz, a GK210 grafikus processzorhoz.

Maxwell

GM200

A GM200 grafikus processzor a Geforce 900 sorozat csúcskategóriás chipjeként is funkcionál, és ebben a funkcióban felváltotta a Geforce 700 sorozat GK110 GPU-ját . A GM200 8 milliárd tranzisztort tartalmaz 601 mm²-es chipterületen, így ez a piac eddigi legnagyobb és legösszetettebb grafikus processzora. Műszaki szempontból a GM200 96 raszteres, 3072 shader és 192 textúra egységgel a GM204 50% -kal nagyobb változata. Ez szintén jelentősen eltér az elődeitől: a GF100, GF110 vagy GK110 GPU-k még mindig megvoltak fejlett kettős pontosságú képességekkel rendelkezik (FP64), és a Quadro és a Tesla professzionális sorozatban is használták . Ezért voltak a GK110 z-n. Például 64 külön ALU-t telepítettek minden SMX-blokkba , ami az 1/3-os DP sebességet eredményezte. Mivel ezek a külön ALU-k hiányoznak a GM200-ból (valószínűleg hely miatt törölték őket, mivel 600 mm²-nél nagyobb grafikus processzorok gyártása technikai és gazdasági okokból aligha lehetséges), csak DP-je 1/32 . Mivel a 3D alkalmazásokhoz nincs szükség dupla pontosságú műveletekre, ez a szempont nem játszott szerepet a játék szektorban, de a GM200-t alkalmatlanná tette a Quadro és a Tesla professzionális sorozat számára.

Ezért az Nvidia elfordult korábbi stratégiájától, miszerint mind a három sorozathoz csúcskategóriás / rajongói chipet fejlesztett, és csak a GM200-at használta a Tesla M40-hez. Ehelyett a Kepler GK110, a GK210 grafikus processzor továbbfejlesztett változatát tervezték a Tesla K80-hoz.

GM204

A GM204 grafikus processzor volt a Geforce 900 sorozat első GPU-ja, amely a "második generációs Maxwell architektúrát" használja. Az első Kepler generációhoz, a Geforce 600 sorozathoz hasonlóan az Nvidia is a csúcskategóriás chip (GM200) előtt küldi a piacra a teljesítmény chipet (GM204). Miután az Nvidia, csakúgy, mint az AMD, 20 nm-es gyártás nélkül végzett a TSMC-n , a GM204-et az eredeti tervekkel ellentétben továbbra is 28 nm-es gyártással fogják gyártani. 5,2 milliárd tranzisztort tartalmaz 398 mm² chipterületen. Az alapszerkezet megegyezik az első Maxwell generáció GM107 GPU-jával: Az árnyékoló fürtök (SMM) továbbra is tartalmaznak 128 árnyékoló és 8 textúra egységet, de az 1. szintű gyorsítótár és a textúrák 64 kBájtról 96 kBájtra módosultak -A gyorsítótár fürtönként 24 kBájtról 48 kByte-ra nőtt. A GM204 összesen 16 shader klaszterből áll, négy-négy fürt lóg egy raszteres motoron, ami azt jelenti, hogy a GM204 2048 stream processzorral, 128 textúra egységgel, 64 ROP-tal és 2 MB 2. szintű gyorsítótárral rendelkezik. Annak érdekében, hogy kompenzálja a 256 bites kicsi memóriainterfészt az ezen osztály többi GPU-jához képest, az Nvidia bevezette a "Harmadik generációs Delta színtömörítés" funkciót, amely egy sávszélesség-megtakarító, amely állítólag 25% -kal csökkenti a memória terhelését.

A Double Precision teljesítmény korlátozásai miatt a Single Precision 1/32 részéig a Kesler architektúrájú Tesla K kártyákat továbbra is magasabb teljesítményükkel kínálják.

Pascal

GP100

A Pascal chipeket GP100-nak hívják, és nagy számítási teljesítményüknek és hatékonyságuknak köszönhetően különösen alkalmasak nagy teljesítményű számítástechnikára és mély tanulásra. A Tesla P100 segítségével az Nvidia 2016 tavaszán mutatta be az első GP100 chipet tartalmazó számítási gyorsítót a GPC 2016-on. A Pascal középtávon a professzionális szektorban cseréli le a Kepler és a Maxwell grafikus chipeket. A GPU100 15 milliárd tranzisztorból áll, és legfeljebb 3840 shader magot tartalmaz. Az Nvidia a TSMC-n gyártja a GP100 GPU-t a 16 nm-es FinFET eljárással, amely lényegesen energiahatékonyabb, mint a korábbi 28 nm-es technológia. Ami a memóriát illeti, az Nvidia HBM 2-t (High Bandwidth Memory 2) használ - legalábbis a Tesla P100 esetében. A HBM 1-hez képest, amelyet jelenleg csak az AMD használ Fidzsi GPU-val rendelkező grafikus kártyákhoz, a HBM 2 nagyobb átviteli sebességet és több memóriát tesz lehetővé GPU-nként.

Az AMD fidzsi társaihoz hasonlóan a GP100 is egy interposeren (vagy "hordozón") ül, és összesen 4096 adatsoron keresztül csatlakozik a 16 GByte-os ECC-vel védett HBM-2 memóriához. A négy memóriaköteg nagyon közel helyezkedik el a GPU-hoz a jelutak csökkentése és következésképpen az átviteli sebesség maximalizálása érdekében. A Tesla P100 esetében 720 GB másodpercenként.

Volta

GV100

A Volta elsősorban a mesterséges intelligencia vagy a mély tanulás területén végzett számításokhoz igazodik. A "GV100" nevű GPU 21,1 milliárd tranzisztorból áll, és 5376 shader magot tartalmaz 815 mm² chipterületen. Az Nvidia a tajvani szerződéses gyártó TSMC-nél gyártja a GV100-GPU-t a 12 nanométeres FFN-folyamat során.

A Tesla V100-ban azonban az Nvidia csak a 84 shader fürtből 80-at aktivál a chip-hozam növelése érdekében. Ez azt jelenti, hogy az FP32-hez 5120 shader mag áll rendelkezésre. A GV100-GPU lehetővé teszi az egypontos számítások elvégzését akár 15 TFlop-tal (30 TFlop az FP16-hoz), a 2560 dupla precíziós egység elméletileg 7,5 FP64-TFlop-ot kezel. A PCIe kártyával a Volta valamivel alacsonyabb 14 vagy 7 TFlop elméleti számítási teljesítményt ér el az SXM2 variánshoz képest (a kissé alacsonyabb órajel-frekvencia miatt - 1470 MHz helyett 1370). Ezenkívül a Volta 640 mély tanulási speciális egységet tartalmaz. Ezen úgynevezett tenzormagok közül nyolc tenzormag található minden egyes streaming multiprocesszorban. Akár edzés közben, akár idegi hálózatok következtetése során akár 120 TFlop számítási teljesítményt is elérhet. Programozni azonban csak korlátozott mértékben lehet.

HBM-2 memóriát (High Bandwidth Memory 2) használunk a memóriához, amely eléri a 900 GB / s-ot a Tesla V100-on. Az előd Tesla P100-hoz hasonlóan a memória mérete továbbra is 16 GB. Elméletileg lehetséges a memória bővítése 32 GB-ra. A Tesla P100 Pascal chipjéhez képest a Volta L1 gyorsítótárának négyszer alacsonyabb késleltetési ideje van, és 14 terabájt / s körüli teljesítményt ér el.

Turing

TU104

A Tesla sorozat új Turing kártyája a PCIe 3.0 teljesítményhatára 75 watt, ezért ideális szerverek számára.

Processzorok

Mivel a legtöbb kártyának nincs kimeneti portja a GPU-val való számításra való összpontosítás miatt, itt a legfontosabb az OpenCL és a CUDA számítási interfész . Az OpenCL 2.0 Evaluation támogatás elérhető a Kepler, a Maxwell és a Pascal 378.66-os verziójával. Az OpenGL 4.6 elérhető a Fermi-től a 381 Linux és 387 Windows legfrissebb illesztőprogramjaival.

Forgács Termelés egységek felület
Folyamat
nm-ben
Transz-
avatkozás

milliókban
A -
terület
a mm²
ROP
részecske
funkciók
ROP-ok Egységes árnyékolók Árnyékoló
modell
Közvetlen
X
Nyissa meg a
GL-t
Nyissa meg a
CL-t
Cuda
CAPA-
képesség
Cuda
SDK
(max.)
hardver
Stream
processzorok
Árnyékoló -
fürt
egységek
Tesla G80 90 681 484 6. 24. 128 8. 4.0 10.0 3.3 1.1 1.0 6.5 PCIe
Tesla GT200 / b 65/55 1400 576/470 8. 32 240 10. 4.0 10.1 3.3 1.1 1.3 6.5 PCIe 2.0
Fermi GF100 40 3000 526 6. 48 512 16. 5.0 11.0 4.6 1.1 2.1 8.0 PCIe 2.0
Fermi GF110 40 3000 526 6. 48 512 16. 5.0 11.0 4.6 1.1 2.1 8.0 PCIe 2.0
Kepler GK104 28. 3540 294 4 32 1536 8. 5.0 11.0 4.6 1,2 (2,0) 3.0 10.0 PCIe 3.0
Kepler GK110 28. 7100 561 6. 48 2880 15-én 5.0 11.0 4.6 1,2 (2,0) 3.0 10.0 PCIe 3.0
Kepler GK210 28. kb. 7100 kb. 561 6. 48 2880 15-én 5.0 11.0 4.6 1,2 (2,0) 3.5 10.0 PCIe 3.0
Maxwell GM200 28. 8000 601 6. 96 3072 24. 5.0 12.0 4.6 1,2 (2,0) 5.2 10.0 PCIe 3.0
Maxwell GM204 28. 5,200 398 4 64. 2048 16. 5.0 12.1 4.6 1,2 (2,0) 5.2 10.0 PCIe 3.0
Maxwell GM206 28. 2,940 227 2 32 1024 8. 5.0 12.1 4.6 1,2 (2,0) 5.2 10.0 PCIe 3.0
Pascal GP100 16. 15,300 610 10. 96 3840 60 5.0 12.1+ 4.6 1,2 (2,0) 6.0 10.0 PCIe 3.0 , NVLink
Volta GV100 12. 21,100 815 128 5376 84. 5.0 12.1+ 4.6 1,2 (2,0) 7.0 10.0 PCIe 3.0 , NVLink
Turing TU104 12. 13,600 545 64. 2560 40 6.3 12.1+ 4.6 1,2 (2,0) 7.5 10.0 PCIe 3.0 , NVLink

Modelladatok

Modell név processzor Tárolás
típus Patak
Processzor
sors
Óra chip
Óraárnyékoló
Számítási teljesítmény GFLOPS-ban Méret
in MB
Tapintat
típus Tárolási
felület
Tárolási
átviteli
sebesség
Fél
prec.
(FP16)
Egyetlen
prec.
(MAD + MUL)
Egyetlen
prec.
(MAD vagy FMA)
Dupla
prec.
(FMA)
egységek MHz MHz MB MHz GB / s
Tesla C870 G80 128 600 1350 Nem? 519 Nem 1536 800 GDDR3 384 bit 77
Tesla D870 2 × G80 256 600 1350 Nem? 1037 Nem 3072 800 GDDR3 2 × 384 bit 2 × 77
Tesla S870 4 × G80 512 600 1350 Nem? 2074 Nem 6144 800 GDDR3 4 × 384 bit 4 × 77
Tesla C1060 GT200 240 602 1296 ? 933 622 78 4096 800 GDDR3 512 bit 102
Tesla S1070 4 × GT200 960 602 1296 ? 3732 2488 311 16,384 800 GDDR3 4 × 512 bit 4 × 102
4 × GT200b 1440 ? 4147 2765 345
Tesla C2050 Fermi GF100 448 575 1150 ? Nem 1030 515 3072 1500 GDDR5 384 bit 144
Tesla M2050 GF100 448 575 1150 ? Nem 1030 515 3072 1550 GDDR5 384 bit 148
Tesla C2070 GF100 448 575 1150 ? Nem 1030 515 6144 1500 GDDR5 384 bit 144
Tesla M2070 GF100 448 575 1150 ? Nem 1030 515 6144 1550 GDDR5 384 bit 150
Tesla S2050 4 × GF100 1792 575 1150 ? Nem 4120 2060 12,288 1500 GDDR5 4 × 384 bit 4 × 144
Tesla S2070 4 × GF100 1792 575 1150 ? Nem 4122 2061 24,576 1500 GDDR5 4 × 384 bit 4 × 144
Tesla M2090 Fermi GF110 512 650 1300 ? Nem 1331 666 6144 1850 GDDR5 384 bit 177
Tesla K10 2 × GK104 3072 745 ? Nem 4580 191 8192 2500 GDDR5 2 × 256 bit 2 × 160
Tesla K20 GK110 2496 705 ? Nem 3524 1175 5120 2600 GDDR5 320 bit 208
Tesla K20X GK110 2688 735 ? Nem 3935 1312 6144 2600 GDDR5 384 bit 250
Tesla K40 GK110B 2880 745 (erősítés: 810/875) ? Nem 4290 1430 12,288 3004 GDDR5 384 bit 288
Tesla K80 2 × GK210 5760 590 ? Nem 5591-8736 1864-2912 24,576 3004 GDDR5 2 × 384 bit 2 × 288
Tesla M4 GM206 1024 872 (Boost: 1072) ? Nem 1786-2195 56-69 4096 2750 GDDR5 128 bites 88
Tesla M40 GM200 3072 948 (erősítés: 1114) ? Nem 5825-6844 182-214 12288 3000 GDDR5 384 bit 288
Tesla M6 GM204 1536 930 (Boost 1180) ? Nem 2857 2857/32 8192 2750 GDDR5 256 bit 160
Tesla M60 2x GM204 4096 900 (Boost: 1180) ? x SP Nem 7373-9667 230-302 2 × 8192 2500 GDDR5 2 × 256 bit 2 × 160
Tesla P4 GP104 2560 810 (Boost: 1063) 2x SP Nem 5500 1/32 SP 8000 1500 (eff. 6000) GDDR5 256 bit 192
Tesla P40 GP102 3840 1303 (Boost: 1531) 2x SP Nem 12000 1/32 SP 24000 1251 (eff. 10008) GDDR5 X 384 bit 346
Tesla P100 "PCIe 12GB 250W" GP100 3584 1175 (Boost: 1300)? 2x SP Nem 8000-9300 4700 12288 700 HBM2 3072 bit 540
Tesla P100 "PCIe 16GB 250W" GP100 3584 1175 (Boost: 1300)? 2x SP Nem 8000-9300 4700 16384 700 HBM2 4096 bit 720
Tesla P100 "NVLink 300W" GP100 3584 1328 (Boost: 1480) 2x SP Nem 9519-10609 5300 16384 700 HBM2 4096 bit 720
Tesla V100 PCle 250 W GV100 5120 (Boost: 1370) 8x SP tenzor mód Nem 14000 7000 16384 876 (eff. 1752) HBM2 4096 bit 900
Tesla V100 SXM2 NVLink 300 W GV100 5120 (Boost: 1455) 8x SP tenzor mód Nem 15000 7500 16384 876 (eff. 1752) HBM2 4096 bit 900
Tesla T4 PCIe 70 W TU104 2560 1005 (Boost: 1515) 8x SP tenzor mód Nem 8100 1/32 SP 16384 1250 (eff. 10 000) GDDR6 256 bit 320

web Linkek

Commons : Nvidia Tesla sorozat  - képek, videók és hangfájlok gyűjteménye

Egyéni bizonyíték

  1. ATI Stream Technology - Commercial ( Memento 2010. február 19-től az Internet Archívumban )
  2. Tom hardver: Csökkent a GTX 480 DP sebessége ( az eredeti emléke 2010. július 2-tól az internetes archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. , 2010. április 6-i üzenet @ 1@ 2Sablon: Webachiv / IABot / www.tomshardware.de
  3. gólem: Nvidia nevek első előadás értékeket a Fermi , hírek november 16, 2009
  4. de.download.nvidia.com (PDF)
  5. de.download.nvidia.com (PDF)
  6. de.download.nvidia.com (PDF)
  7. Tesla K80 - kettős Kepler akár 8,7 TFLOPS-tal szuperszámítógépekhez. A ComputerBase, 2014. november 17 , 2015. augusztus 6 .
  8. B a b Indítási elemzés: nVidia GeForce GTX Titan X. 3DCenter.org, 2015. március 18., hozzáférés: 2015. június 10 .
  9. Indítási elemzés: nVidia GeForce GTX 970 és 980.3DCenter, 2014. szeptember 19., hozzáférés: 2015. február 3 .
  10. heise.de
  11. images.nvidia.com (PDF)
  12. heise online: Tesla V100: Az Nvidia átadja az első Volta számítási kártyákat a mélyen tanuló kutatóknak. heise online, hozzáférés: 2017. szeptember 12 .
  13. heise.de
  14. streamcomputing.eu
  15. developer.nvidia.com
  16. Whitepaper Kepler GK110 (PDF; 1,7 MB)
  17. Archivált másolat ( az eredeti emléke 2016. június 21-től az Internetes Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. (PDF; 2 MB) @ 1@ 2Sablon: Webachiv / IABot / international.download.nvidia.com
  18. images.nvidia.com (PDF)
  19. techpowerup.com
  20. anandtech.com
  21. techpowerup.com
  22. techpowerup.com
  23. Számítási szempontból meghatározott, elméleti maximális számítási teljesítmény, amelyet értelmes programkóddal soha nem lehet valósítani.
  24. TESLA M2090 DUAL-SLOT SZÁMÍTÁSI FOLYAMAT modul modul specifikáció (PDF; 348 kB)
  25. Termékáttekintés M2090 (PDF; 423 kB)
  26. TESLA K10 GPU ACCELERATOR alaplap specifikáció (PDF; 650 kB)
  27. NVIDIA® Tesla® Kepler GPU számítástechnikai gyorsítók (PDF; 296 kB)
  28. TESLA K10 K20 K20X GPU ACCELERATOR alaplap specifikáció (PDF; 193 kB)
  29. Hassan Mujtaba: NVIDIA Tesla K80 „GK210-DUO” grafikus kártya a professzionális piac felé - Több mint 2 TFlop dupla precíziós számítással rendelkezik. A WCCFtech.com, 2014. november 29 .
  30. techpowerup.com
  31. techpowerup.com
  32. techpowerup.com
  33. heise.de
  34. techpowerup.com
  35. heise.de
  36. Archivált másolat ( az eredeti emléke 2016. október 18-tól az Internet Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. @ 1@ 2Sablon: Webachiv / IABot / www.techpowerup.com
  37. B a b NVIDIA Tesla V100 | NVIDIA. NVIDIA Corporation, hozzáférés: 2017. szeptember 12. (amerikai angol).
  38. a b Adatlap NVIDIA V100 GPU ACCELERATOR. (PDF) NVIDIA Corporation, 2017. július, hozzáférés: 2017. szeptember 12 .
  39. xcelerit.com
  40. nvidia.com