Nvidia Tesla

Nvidia Tesla 2075

A Tesla egy erősen párhuzamos kialakítású processzor , amelyet stream processzornak is neveznek , az Nvidia cégtől . A GPU technológián alapuló processzor a házon belüli CUDA API és OpenCL segítségével címezhető. A termék közvetlenül versenyben állt a versenytárs AMD FireStream-jével vagy FirePro-jával .

Miután 2007 közepén bemutatták az első G80 GPU-alapú kártyákat, a Tesla kártyák egy évvel később a GT200 grafikus chipet követték, amelyet a Geforce 200 sorozat asztali grafikus kártyáihoz is használnak .

„Fermi” kódnéven az Nvidia 2009. szeptember 30-án bemutatta a következő generációs grafikus processzort házon belüli „GPU Technology Conference” -en, amely olyan termékekben is kapható, mint a Tesla, a Quadro kártyák és módosított formában (pl. A Double Precision berendezéssel) a Geforce 400 sorozatban használják . Az Nvidia 2010 második és harmadik negyedévére jelentette be a Fermi grafikus processzoron alapuló Tesla kártyákat a Szuperszámítógépes Kiállítás 09-en.

A legújabb illesztőprogramokkal az OpenGL, a CUDA és az OpenCL lehetőségei egyes esetekben jelentősen kibővültek.

technológia

Tesla

G80

A G80 grafikus processzor volt az Nvidia első processzora, amely az újonnan kifejlesztett egységes shader architektúrára épült . Miután a G80-at 2006 vége óta telepítették a Geforce 8800 GTX és GTS grafikus kártyákra, az Nvidia 2007 közepén mutatta be az első Tesla-modelleket. A G80-at elsősorban az A3 lépésben használják, mivel a Geforce 8800 Ultra készülékre telepítették.

GT200

A GT200 processzor volt a második chip, amelyet az Nvidia beépített a Teslaser sorozatba. A G80-zal ellentétben az Nvidia a kezdetektől fogva a Tesla modellek használatát tervezte (ezért az azonosítóban a T-t), és az IEEE-754R specifikációnak megfelelően több mint 30 további MADD egységen keresztül valósította meg a kettős pontosságú képességeket , amit a Geforce- Grafikus kártyákra nem lett volna szükség.

Fermi

A Fermikern 40 nm-es gyártási eljárással készül, és körülbelül hárommilliárd tranzisztorral rendelkezik . Az előddel , a GT200-zal ellentétben ez nagyrészt egy új fejlesztés, amely a G80 grafikus processzor egységes shader architektúráján alapul . Fermi van osztva 16 shader klaszterek, amelyekben minden csoportot, amelynek 32 stream processzor . Ez azt jelenti, hogy összesen 512 stream processzor létezik. A Fermi-Chip 16 „terhelés / tárolás” egységgel rendelkezik, valamint négy különálló „speciális funkció egységgel” rendelkezik a szinusz és a koszinusz számításához . A Fermikernen hat 64 bites memóriavezérlő is található a GDDR5 memóriához , ami 384 bites memória interfészt eredményez. Ez lehetővé teszi a memória kibővítését 1,5, 3 és 6 GB-ra. A memória vezérlő most már képes kezelni az ECC memóriát is, amelynek saját hibajavítása van.

Az Nvidia most már egyre nagyobb jelentőséget tulajdonít a GPU számítástechnikának, ezért sok építészeti változtatást hajtottak végre a Fermikernben a teljesítmény javítása érdekében ezen a területen. A Fermi az első olyan grafikus processzor, amely teljes mértékben támogatja a C ++ szoftvert, és teljes mértékben kompatibilis az IEEE-754-2008 szabványmal (korábban IEEE-754-1985). Ez utóbbi azért vált szükségessé, hogy a MAD-nál pontosabb FMA-t (Fused Multiply-Add) használhassuk a kettős pontosságú képességek javítására ( kettős pontossággal történő számítás ). Ez lehetővé teszi, hogy minden Fermikern shader klaszter 16 dupla pontosságú műveletet hajtson végre órajelenként. Ez azt jelenti, hogy a Fermi összesen 256 számítást tud végrehajtani ciklusonként kettős pontossággal, míg a GT200-on csak 30 volt lehetséges. A megosztott memória mellett a Fermi grafikus processzor rendelkezik egy L1 és L2 gyorsítótárral is a GPU számítási képességeinek javítása érdekében .

Kepler

GK104

2012. március 22-én az Nvidia bemutatta a Geforce GTX 680-at, a Geforce 600 sorozat első grafikus kártyáját, amellyel bemutatták az új Kepler architektúrát. A Geforce GTX 680 a GK104 grafikus processzorra épül, amely 3,54 milliárd tranzisztorból, valamint 1536 stream processzorból és 128 textúra egységből áll, amelyek nyolc árnyékoló fürtbe vannak rendezve. A GK104-GPU-t 28 nm-es gyártási folyamatban gyártják a TSMC-n, és a szerszámterülete 294 mm². A GK104-et eredetileg a teljesítményszektor grafikus chipjeként tervezték. a. a csökkentett „dupla pontosságú” teljesítmény alapján ismerhető fel. Miután az Nvidia elejtette a GK100 grafikus processzort a GK110 javára, a GK104-et is a csúcskategóriás szektor számára kellett használni, mivel a GK110 csak a Kepler frissítő generáció számára volt elérhető.

GK110

A GK110-GPU a Kepler-generáció legnagyobb és legösszetettebb grafikus processzora, 7,1 milliárd tranzisztorral, mintegy 561 mm²-en (533 mm² a gyártásoptimalizált B1 lépésben). 2880 shader és 240 textúra egységből áll, amelyek 15 SMX blokkon (shader fürtön) vannak elosztva. Ezek viszont öt grafikus feldolgozó fürtön oszlanak meg, ami azt jelenti, hogy a GK110 aránya 3: 1 (ellentétben a Kepler generáció többi grafikus processzorával, amelyek 2: 1 arányt használnak). A GK110 másik különlegessége az SMX-blokkonként további 64 külön ALU, amelyek nem az egypontos (FP32), hanem a kettős pontosságú műveletért (FP64) felelősek . A "Dinamikus párhuzamosság", a "Hyper-Q" és a "GPUDirect" funkciókat szintén a szakmai szektornak szánják, és csak a GK110-GPU-n érhetők el.

GK210

A Maxwell architektúra korlátai miatt a GK110 továbbfejlesztett változatát tervezték a Tesla sorozathoz, a GK210 grafikus processzorhoz.

Maxwell

GM200

A GM200 grafikus processzor a Geforce 900 sorozat csúcskategóriás chipjeként is funkcionál, és ebben a funkcióban felváltotta a Geforce 700 sorozat GK110 GPU-ját . A GM200 8 milliárd tranzisztort tartalmaz 601 mm²-es chipterületen, így ez a piac eddigi legnagyobb és legösszetettebb grafikus processzora. Műszaki szempontból a GM200 96 raszteres, 3072 shader és 192 textúra egységgel a GM204 50% -kal nagyobb változata. Ez szintén jelentősen eltér az elődeitől: a GF100, GF110 vagy GK110 GPU-k még mindig megvoltak fejlett kettős pontosságú képességekkel rendelkezik (FP64), és a Quadro és a Tesla professzionális sorozatban is használták . Ezért voltak a GK110 z-n. Például 64 külön ALU-t telepítettek minden SMX-blokkba , ami az 1/3-os DP sebességet eredményezte. Mivel ezek a külön ALU-k hiányoznak a GM200-ból (valószínűleg hely miatt törölték őket, mivel 600 mm²-nél nagyobb grafikus processzorok gyártása technikai és gazdasági okokból aligha lehetséges), csak DP-je 1/32 . Mivel a 3D alkalmazásokhoz nincs szükség dupla pontosságú műveletekre, ez a szempont nem játszott szerepet a játék szektorban, de a GM200-t alkalmatlanná tette a Quadro és a Tesla professzionális sorozat számára.

Ezért az Nvidia elfordult korábbi stratégiájától, miszerint mind a három sorozathoz csúcskategóriás / rajongói chipet fejlesztett, és csak a GM200-at használta a Tesla M40-hez. Ehelyett a Kepler GK110, a GK210 grafikus processzor továbbfejlesztett változatát tervezték a Tesla K80-hoz.

GM204

A GM204 grafikus processzor volt a Geforce 900 sorozat első GPU-ja, amely a "második generációs Maxwell architektúrát" használja. Az első Kepler generációhoz, a Geforce 600 sorozathoz hasonlóan az Nvidia is a csúcskategóriás chip (GM200) előtt küldi a piacra a teljesítmény chipet (GM204). Miután az Nvidia, csakúgy, mint az AMD, 20 nm-es gyártás nélkül végzett a TSMC-n , a GM204-et az eredeti tervekkel ellentétben továbbra is 28 nm-es gyártással fogják gyártani. 5,2 milliárd tranzisztort tartalmaz 398 mm² chipterületen. Az alapszerkezet megegyezik az első Maxwell generáció GM107 GPU-jával: Az árnyékoló fürtök (SMM) továbbra is tartalmaznak 128 árnyékoló és 8 textúra egységet, de az 1. szintű gyorsítótár és a textúrák 64 kBájtról 96 kBájtra módosultak -A gyorsítótár fürtönként 24 kBájtról 48 kByte-ra nőtt. A GM204 összesen 16 shader klaszterből áll, négy-négy fürt lóg egy raszteres motoron, ami azt jelenti, hogy a GM204 2048 stream processzorral, 128 textúra egységgel, 64 ROP-tal és 2 MB 2. szintű gyorsítótárral rendelkezik. Annak érdekében, hogy kompenzálja a 256 bites kicsi memóriainterfészt az ezen osztály többi GPU-jához képest, az Nvidia bevezette a "Harmadik generációs Delta színtömörítés" funkciót, amely egy sávszélesség-megtakarító, amely állítólag 25% -kal csökkenti a memória terhelését.

A Double Precision teljesítmény korlátozásai miatt a Single Precision 1/32 részéig a Kesler architektúrájú Tesla K kártyákat továbbra is magasabb teljesítményükkel kínálják.

Pascal

GP100

A Pascal chipeket GP100-nak hívják, és nagy számítási teljesítményüknek és hatékonyságuknak köszönhetően különösen alkalmasak nagy teljesítményű számítástechnikára és mély tanulásra. A Tesla P100 segítségével az Nvidia 2016 tavaszán mutatta be az első GP100 chipet tartalmazó számítási gyorsítót a GPC 2016-on. A Pascal középtávon a professzionális szektorban cseréli le a Kepler és a Maxwell grafikus chipeket. A GPU100 15 milliárd tranzisztorból áll, és legfeljebb 3840 shader magot tartalmaz. Az Nvidia a TSMC-n gyártja a GP100 GPU-t a 16 nm-es FinFET eljárással, amely lényegesen energiahatékonyabb, mint a korábbi 28 nm-es technológia. Ami a memóriát illeti, az Nvidia HBM 2-t (High Bandwidth Memory 2) használ - legalábbis a Tesla P100 esetében. A HBM 1-hez képest, amelyet jelenleg csak az AMD használ Fidzsi GPU-val rendelkező grafikus kártyákhoz, a HBM 2 nagyobb átviteli sebességet és több memóriát tesz lehetővé GPU-nként.

Az AMD fidzsi társaihoz hasonlóan a GP100 is egy interposeren (vagy "hordozón") ül, és összesen 4096 adatsoron keresztül csatlakozik a 16 GByte-os ECC-vel védett HBM-2 memóriához. A négy memóriaköteg nagyon közel helyezkedik el a GPU-hoz a jelutak csökkentése és következésképpen az átviteli sebesség maximalizálása érdekében. A Tesla P100 esetében 720 GB másodpercenként.

Volta

GV100

A Volta elsősorban a mesterséges intelligencia vagy a mély tanulás területén végzett számításokhoz igazodik. A "GV100" nevű GPU 21,1 milliárd tranzisztorból áll, és 5376 shader magot tartalmaz 815 mm² chipterületen. Az Nvidia a tajvani szerződéses gyártó TSMC-nél gyártja a GV100-GPU-t a 12 nanométeres FFN-folyamat során.

A Tesla V100-ban azonban az Nvidia csak a 84 shader fürtből 80-at aktivál a chip-hozam növelése érdekében. Ez azt jelenti, hogy az FP32-hez 5120 shader mag áll rendelkezésre. A GV100-GPU lehetővé teszi az egypontos számítások elvégzését akár 15 TFlop-tal (30 TFlop az FP16-hoz), a 2560 dupla precíziós egység elméletileg 7,5 FP64-TFlop-ot kezel. A PCIe kártyával a Volta valamivel alacsonyabb 14 vagy 7 TFlop elméleti számítási teljesítményt ér el az SXM2 variánshoz képest (a kissé alacsonyabb órajel-frekvencia miatt - 1470 MHz helyett 1370). Ezenkívül a Volta 640 mély tanulási speciális egységet tartalmaz. Ezen úgynevezett tenzormagok közül nyolc tenzormag található minden egyes streaming multiprocesszorban. Akár edzés közben, akár idegi hálózatok következtetése során akár 120 TFlop számítási teljesítményt is elérhet. Programozni azonban csak korlátozott mértékben lehet.

HBM-2 memóriát (High Bandwidth Memory 2) használunk a memóriához, amely eléri a 900 GB / s-ot a Tesla V100-on. Az előd Tesla P100-hoz hasonlóan a memória mérete továbbra is 16 GB. Elméletileg lehetséges a memória bővítése 32 GB-ra. A Tesla P100 Pascal chipjéhez képest a Volta L1 gyorsítótárának négyszer alacsonyabb késleltetési ideje van, és 14 terabájt / s körüli teljesítményt ér el.

Turing

TU104

A Tesla sorozat új Turing kártyája a PCIe 3.0 teljesítményhatára 75 watt, ezért ideális szerverek számára.

Processzorok

Mivel a legtöbb kártyának nincs kimeneti portja a GPU-val való számításra való összpontosítás miatt, itt a legfontosabb az OpenCL és a CUDA számítási interfész . Az OpenCL 2.0 Evaluation támogatás elérhető a Kepler, a Maxwell és a Pascal 378.66-os verziójával. Az OpenGL 4.6 elérhető a Fermi-től a 381 Linux és 387 Windows legfrissebb illesztőprogramjaival.

Forgács	Termelés			egységek				felület
	Folyamat nm-ben	Transz- avatkozás milliókban	A - terület a mm²	ROP részecske funkciók	ROP-ok	Egységes árnyékolók		Árnyékoló modell	Közvetlen X	Nyissa meg a GL-t	Nyissa meg a CL-t	Cuda CAPA- képesség	Cuda SDK (max.)	hardver
	Folyamat nm-ben	Transz- avatkozás milliókban	A - terület a mm²	ROP részecske funkciók	ROP-ok	Stream processzorok	Árnyékoló - fürt	Árnyékoló modell	Közvetlen X	Nyissa meg a GL-t	Nyissa meg a CL-t	Cuda CAPA- képesség	Cuda SDK (max.)	hardver
egységek
Tesla G80	90	681	484	6.	24.	128	8.	4.0	10.0	3.3	1.1	1.0	6.5	PCIe
Tesla GT200 / b	65/55	1400	576/470	8.	32	240	10.	4.0	10.1	3.3	1.1	1.3	6.5	PCIe 2.0
Fermi GF100	40	3000	526	6.	48	512	16.	5.0	11.0	4.6	1.1	2.1	8.0	PCIe 2.0
Fermi GF110	40	3000	526	6.	48	512	16.	5.0	11.0	4.6	1.1	2.1	8.0	PCIe 2.0
Kepler GK104	28.	3540	294	4	32	1536	8.	5.0	11.0	4.6	1,2 (2,0)	3.0	10.0	PCIe 3.0
Kepler GK110	28.	7100	561	6.	48	2880	15-én	5.0	11.0	4.6	1,2 (2,0)	3.0	10.0	PCIe 3.0
Kepler GK210	28.	kb. 7100	kb. 561	6.	48	2880	15-én	5.0	11.0	4.6	1,2 (2,0)	3.5	10.0	PCIe 3.0
Maxwell GM200	28.	8000	601	6.	96	3072	24.	5.0	12.0	4.6	1,2 (2,0)	5.2	10.0	PCIe 3.0
Maxwell GM204	28.	5,200	398	4	64.	2048	16.	5.0	12.1	4.6	1,2 (2,0)	5.2	10.0	PCIe 3.0
Maxwell GM206	28.	2,940	227	2	32	1024	8.	5.0	12.1	4.6	1,2 (2,0)	5.2	10.0	PCIe 3.0
Pascal GP100	16.	15,300	610	10.	96	3840	60	5.0	12.1+	4.6	1,2 (2,0)	6.0	10.0	PCIe 3.0 , NVLink
Volta GV100	12.	21,100	815		128	5376	84.	5.0	12.1+	4.6	1,2 (2,0)	7.0	10.0	PCIe 3.0 , NVLink
Turing TU104	12.	13,600	545		64.	2560	40	6.3	12.1+	4.6	1,2 (2,0)	7.5	10.0	PCIe 3.0 , NVLink

Modelladatok

Modell név	processzor								Tárolás
	típus	Patak Processzor sors	Óra chip	Óraárnyékoló	Számítási teljesítmény GFLOPS-ban				Méret in MB	Tapintat	típus	Tárolási felület	Tárolási átviteli sebesség
	típus	Patak Processzor sors	Óra chip	Óraárnyékoló	Fél prec. (FP16)	Egyetlen prec. (MAD + MUL)	Egyetlen prec. (MAD vagy FMA)	Dupla prec. (FMA)	Méret in MB	Tapintat	típus	Tárolási felület	Tárolási átviteli sebesség
egységek			MHz	MHz					MB	MHz			GB / s
Tesla C870	G80	128	600	1350	Nem?	519		Nem	1536	800	GDDR3	384 bit	77
Tesla D870	2 × G80	256	600	1350	Nem?	1037		Nem	3072	800	GDDR3	2 × 384 bit	2 × 77
Tesla S870	4 × G80	512	600	1350	Nem?	2074		Nem	6144	800	GDDR3	4 × 384 bit	4 × 77
Tesla C1060	GT200	240	602	1296	?	933	622	78	4096	800	GDDR3	512 bit	102
Tesla S1070	4 × GT200	960	602	1296	?	3732	2488	311	16,384	800	GDDR3	4 × 512 bit	4 × 102
Tesla S1070	4 × GT200b	960	602	1440	?	4147	2765	345	16,384	800	GDDR3	4 × 512 bit	4 × 102
Tesla C2050	Fermi GF100	448	575	1150	?	Nem	1030	515	3072	1500	GDDR5	384 bit	144
Tesla M2050	GF100	448	575	1150	?	Nem	1030	515	3072	1550	GDDR5	384 bit	148
Tesla C2070	GF100	448	575	1150	?	Nem	1030	515	6144	1500	GDDR5	384 bit	144
Tesla M2070	GF100	448	575	1150	?	Nem	1030	515	6144	1550	GDDR5	384 bit	150
Tesla S2050	4 × GF100	1792	575	1150	?	Nem	4120	2060	12,288	1500	GDDR5	4 × 384 bit	4 × 144
Tesla S2070	4 × GF100	1792	575	1150	?	Nem	4122	2061	24,576	1500	GDDR5	4 × 384 bit	4 × 144
Tesla M2090	Fermi GF110	512	650	1300	?	Nem	1331	666	6144	1850	GDDR5	384 bit	177
Tesla K10	2 × GK104	3072	745		?	Nem	4580	191	8192	2500	GDDR5	2 × 256 bit	2 × 160
Tesla K20	GK110	2496	705		?	Nem	3524	1175	5120	2600	GDDR5	320 bit	208
Tesla K20X	GK110	2688	735		?	Nem	3935	1312	6144	2600	GDDR5	384 bit	250
Tesla K40	GK110B	2880	745 (erősítés: 810/875)		?	Nem	4290	1430	12,288	3004	GDDR5	384 bit	288
Tesla K80	2 × GK210	5760	590		?	Nem	5591-8736	1864-2912	24,576	3004	GDDR5	2 × 384 bit	2 × 288
Tesla M4	GM206	1024	872 (Boost: 1072)		?	Nem	1786-2195	56-69	4096	2750	GDDR5	128 bites	88
Tesla M40	GM200	3072	948 (erősítés: 1114)		?	Nem	5825-6844	182-214	12288	3000	GDDR5	384 bit	288
Tesla M6	GM204	1536	930 (Boost 1180)		?	Nem	2857	2857/32	8192	2750	GDDR5	256 bit	160
Tesla M60	2x GM204	4096	900 (Boost: 1180)		? x SP	Nem	7373-9667	230-302	2 × 8192	2500	GDDR5	2 × 256 bit	2 × 160
Tesla P4	GP104	2560	810 (Boost: 1063)		2x SP	Nem	5500	1/32 SP	8000	1500 (eff. 6000)	GDDR5	256 bit	192
Tesla P40	GP102	3840	1303 (Boost: 1531)		2x SP	Nem	12000	1/32 SP	24000	1251 (eff. 10008)	GDDR5 X	384 bit	346
Tesla P100 "PCIe 12GB 250W"	GP100	3584	1175 (Boost: 1300)?		2x SP	Nem	8000-9300	4700	12288	700	HBM2	3072 bit	540
Tesla P100 "PCIe 16GB 250W"	GP100	3584	1175 (Boost: 1300)?		2x SP	Nem	8000-9300	4700	16384	700	HBM2	4096 bit	720
Tesla P100 "NVLink 300W"	GP100	3584	1328 (Boost: 1480)		2x SP	Nem	9519-10609	5300	16384	700	HBM2	4096 bit	720
Tesla V100 PCle 250 W	GV100	5120	(Boost: 1370)		8x SP tenzor mód	Nem	14000	7000	16384	876 (eff. 1752)	HBM2	4096 bit	900
Tesla V100 SXM2 NVLink 300 W	GV100	5120	(Boost: 1455)		8x SP tenzor mód	Nem	15000	7500	16384	876 (eff. 1752)	HBM2	4096 bit	900
Tesla T4 PCIe 70 W	TU104	2560	1005 (Boost: 1515)		8x SP tenzor mód	Nem	8100	1/32 SP	16384	1250 (eff. 10 000)	GDDR6	256 bit	320

web Linkek

Commons : Nvidia Tesla sorozat - képek, videók és hangfájlok gyűjteménye

nVidia Tesla a hivatalos nVidia honlapon
Fermi architektúra az Nvidia hivatalos honlapján
Whitepaper - nVidia Fermi Architecture (PDF; 869 kB; angol)

Egyéni bizonyíték

↑ ATI Stream Technology - Commercial ( Memento 2010. február 19-től az Internet Archívumban )
↑ Tom hardver: Csökkent a GTX 480 DP sebessége ( az eredeti emléke 2010. július 2-tól az internetes archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. , 2010. április 6-i üzenet @ 1@ 2
↑ gólem: Nvidia nevek első előadás értékeket a Fermi , hírek november 16, 2009
↑ de.download.nvidia.com (PDF)
↑ de.download.nvidia.com (PDF)
↑ de.download.nvidia.com (PDF)
↑ Tesla K80 - kettős Kepler akár 8,7 TFLOPS-tal szuperszámítógépekhez. A ComputerBase, 2014. november 17 , 2015. augusztus 6 .
B ^a^b Indítási elemzés: nVidia GeForce GTX Titan X. 3DCenter.org, 2015. március 18., hozzáférés: 2015. június 10 .
↑ Indítási elemzés: nVidia GeForce GTX 970 és 980.3DCenter, 2014. szeptember 19., hozzáférés: 2015. február 3 .
↑ heise.de
↑ images.nvidia.com (PDF)
↑ heise online: Tesla V100: Az Nvidia átadja az első Volta számítási kártyákat a mélyen tanuló kutatóknak. heise online, hozzáférés: 2017. szeptember 12 .
↑ heise.de
↑ streamcomputing.eu
↑ developer.nvidia.com
↑ Whitepaper Kepler GK110 (PDF; 1,7 MB)
↑ Archivált másolat ( az eredeti emléke 2016. június 21-től az Internetes Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. (PDF; 2 MB) @ 1@ 2
↑ images.nvidia.com (PDF)
↑ techpowerup.com
↑ anandtech.com
↑ techpowerup.com
↑ techpowerup.com
↑ Számítási szempontból meghatározott, elméleti maximális számítási teljesítmény, amelyet értelmes programkóddal soha nem lehet valósítani.
↑ TESLA M2090 DUAL-SLOT SZÁMÍTÁSI FOLYAMAT modul modul specifikáció (PDF; 348 kB)
↑ Termékáttekintés M2090 (PDF; 423 kB)
↑ TESLA K10 GPU ACCELERATOR alaplap specifikáció (PDF; 650 kB)
↑ NVIDIA® Tesla® Kepler GPU számítástechnikai gyorsítók (PDF; 296 kB)
↑ TESLA K10 K20 K20X GPU ACCELERATOR alaplap specifikáció (PDF; 193 kB)
↑ Hassan Mujtaba: NVIDIA Tesla K80 „GK210-DUO” grafikus kártya a professzionális piac felé - Több mint 2 TFlop dupla precíziós számítással rendelkezik. A WCCFtech.com, 2014. november 29 .
↑ techpowerup.com
↑ techpowerup.com
↑ techpowerup.com
↑ heise.de
↑ techpowerup.com
↑ heise.de
↑ Archivált másolat ( az eredeti emléke 2016. október 18-tól az Internet Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. @ 1@ 2
B ^a^b NVIDIA Tesla V100 | NVIDIA. NVIDIA Corporation, hozzáférés: 2017. szeptember 12. (amerikai angol).
↑ ^a^b Adatlap NVIDIA V100 GPU ACCELERATOR. (PDF) NVIDIA Corporation, 2017. július, hozzáférés: 2017. szeptember 12 .
↑ xcelerit.com
↑ nvidia.com

[1] ATI Stream Technology - Commercial ( Memento 2010. február 19-től az Internet Archívumban )

[2] Tom hardver: Csökkent a GTX 480 DP sebessége ( az eredeti emléke 2010. július 2-tól az internetes archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. , 2010. április 6-i üzenet @ 1@ 2

[3] ólem: Nvidia nevek első előadás értékeket a Fermi , hírek november 16, 2009

[4] .download.nvidia.com (PDF)

[5] .download.nvidia.com (PDF)

[6] .download.nvidia.com (PDF)

[7] Tesla K80 - kettős Kepler akár 8,7 TFLOPS-tal szuperszámítógépekhez. A ComputerBase, 2014. november 17 , 2015. augusztus 6 .

[3dc_2-8] B ^a^b Indítási elemzés: nVidia GeForce GTX Titan X. 3DCenter.org, 2015. március 18., hozzáférés: 2015. június 10 .

[3dcenter_1-9] Indítási elemzés: nVidia GeForce GTX 970 és 980.3DCenter, 2014. szeptember 19., hozzáférés: 2015. február 3 .

[10] se.de

[11] s.nvidia.com (PDF)

[12] se online: Tesla V100: Az Nvidia átadja az első Volta számítási kártyákat a mélyen tanuló kutatóknak. heise online, hozzáférés: 2017. szeptember 12 .

[13] se.de

[14] streamcomputing.eu

[15] veloper.nvidia.com

[16] Whitepaper Kepler GK110 (PDF; 1,7 MB)

[17] Archivált másolat ( az eredeti emléke 2016. június 21-től az Internetes Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. (PDF; 2 MB) @ 1@ 2

[18] s.nvidia.com (PDF)

[19] techpowerup.com

[20] tech.com

[21] techpowerup.com

[22] techpowerup.com

[23] Számítási szempontból meghatározott, elméleti maximális számítási teljesítmény, amelyet értelmes programkóddal soha nem lehet valósítani.

[24] TESLA M2090 DUAL-SLOT SZÁMÍTÁSI FOLYAMAT modul modul specifikáció (PDF; 348 kB)

[25] Termékáttekintés M2090 (PDF; 423 kB)

[26] TESLA K10 GPU ACCELERATOR alaplap specifikáció (PDF; 650 kB)

[27] NVIDIA® Tesla® Kepler GPU számítástechnikai gyorsítók (PDF; 296 kB)

[28] TESLA K10 K20 K20X GPU ACCELERATOR alaplap specifikáció (PDF; 193 kB)

[29] Hassan Mujtaba: NVIDIA Tesla K80 „GK210-DUO” grafikus kártya a professzionális piac felé - Több mint 2 TFlop dupla precíziós számítással rendelkezik. A WCCFtech.com, 2014. november 29 .

[30] techpowerup.com

[31] techpowerup.com

[32] techpowerup.com

[33] se.de

[34] techpowerup.com

[35] se.de

[36] Archivált másolat ( az eredeti emléke 2016. október 18-tól az Internet Archívumban ) Információ: Az archív linket automatikusan beillesztették, és még nem ellenőrizték. Kérjük, ellenőrizze az eredeti és az archív linket az utasításoknak megfelelően, majd távolítsa el ezt az értesítést. @ 1@ 2

[:0-37] B ^a^b NVIDIA Tesla V100 | NVIDIA. NVIDIA Corporation, hozzáférés: 2017. szeptember 12. (amerikai angol).

[:1-38] Adatlap NVIDIA V100 GPU ACCELERATOR. (PDF) NVIDIA Corporation, 2017. július, hozzáférés: 2017. szeptember 12 .

[39] xcelerit.com

[40] vidia.com

Languages