Lebegőpontos műveletek másodpercenként
Lebegőpontos számítási teljesítmény mértékegységei előtagokkal az SI szerint . | |
---|---|
kFLOPS | Kilo FLOPS = 10 3 FLOPS |
MFLOPS | Mega FLOPS = 10 6 FLOPS |
GFLOPS | Giga FLOPS = 10 9 FLOPS |
TFLOPS | Tera FLOPS = 10 12 FLOPS |
PFLOPS | Peta FLOPS = 10 15 FLOPS |
EFLOPS | Exa FLOPS = 10 18 FLOPS |
ZFLOPS | Zetta FLOPS = 10 21 FLOPS |
YFLOPS | Yotta FLOPS = 10 24 FLOPS |
Lebegőpontos művelet per másodperc (rövid papucsok ; angolul flop ) olyan intézkedés, a teljesítmény a számítógépek vagy a feldolgozók és a szám lebegőpontos műveletek ( kiegészítés vagy szorzásait ), hogy végre tud hajtani őket másodpercenként.
Gyakran az egyik az úgynevezett FLOP lebegőpontos művelet (angol fl oating pont op működés ) bekezdésében, amely alkalmanként a variáns FLOP / s tűnik azonban, mindkét változat azonos.
leírás
A több lebegőpontos művelet nem feltétlenül közvetlenül arányos az órajel a processzor , hiszen - attól függően, hogy a végrehajtás - lebegőpontos műveleteket igényelnek eltérő számú órajel ciklus . A vektorprocesszorok több ezer műveletet hajtanak végre minden ciklusban. A vektorprocesszorként működő grafikus kártyák egyetlen pontossággal (SP, 32Bit Float) 30 TeraFLOPS számítási teljesítményt érnek el 2020-ban, ami egyben motiváció a lebegőpontos számműveleteknek a grafikus processzorra ( GPGPU ) való kiszervezésére is . A szuperszámítógépek számítási teljesítménye nemcsak a felhasznált processzorok számától és teljesítményétől függ, hanem a számítási csomópontok hálózatának típusától és sebességétől is. Az alkalmazott szoftver is fontos szerepet játszhat.
A legtöbb esetben, akárcsak az IPS egységnél , a legjobb eset becslését vagy akár csak elméletileg lehetséges értéket adják meg.
számítás
Az egyes számítási csomópontok elméleti csúcsteljesítményét a következő értékek megszorzásával lehet kiszámítani:
- Óra frekvencia
- CPU foglalatok száma
- CPU magok foglalatonként
-
min(
Ciklusonként indítható parancsok,
Aritmetikai/
egységek száma Egy parancs késése)
- Adatszavak számítási regiszterben
- parancsonkénti numerikus műveletek
For
- 2,5 GHz
- 2 bázis
- 24 mag
- 2 indított parancs ciklusonként
- 8 adatszó számítási regiszterenként (256 bites regiszter egyszeres vagy 512 bites regiszter a kettős pontosság érdekében)
- 2 numerikus művelet parancsonként (FMA)
7,68 TFLOPS -t kapunk.
Számítógépes rendszerek számítási teljesítménye
A számítógép FLOPS -ját meghatározott programcsomagok határozzák meg ( benchmarkok , például LINPACK vagy Livermore benchmark ). A TOP500 ranglistán az 500 leggyorsabb számítógépes rendszer látható, a FLOPS -jukkal mérve a LINPACK benchmark segítségével. Vannak hasonló szolgáltatásokkal rendelkező számítógépes rendszerek, amelyek nem vesznek részt a rangsorban, így ez a lista nem teljes. Az első szabadon programozható számítógép, amelyet a gyakorlatban is használni lehetett, az elektromechanikus Zuse Z3 1941 -ből, másodpercenként alig 2 kiegészítést és így 2 FLOPS -ot tudott kezelni. Más műveletek azonban néha sokkal tovább tartottak.
Az 1980 -as Intel 8087 társprocesszor, 8088 -as fő processzorral 50 kFLOPS -ot kezelt. A 21. század elején a Pentium 4 processzorral rendelkező, három gigahertzes órajelű PC -vel rendelkező számítógép az IBM szerint hat GigaFLOPS körüli értéket ért el. Egy hagyományos grafikus kártya akár 30 TeraFLOPS -t is képes végrehajtani 2020 -ban.
A számítási teljesítmény és a villamosenergia -igény aránya javul, a teljes energiaellátás növekszik. Például az IBM BlueGene / L -hez , amely a TOP500 listán szerepelt 11/2005, mindössze 70 m² területre és 1770 kW villamos energiára volt szüksége a 280 Tera FLOPS körüli teljesítményhez , ami három év Earth Simulatorhoz képest. idősebb (35,86 TeraFLOPS). 3000 m² -rel és 6000 kW -val jelentős javulást jelent. Az elektromos teljesítmény az egyik fő oka annak, hogy a régebbi rendszereket már nem szuperszámítógépként üzemeltetik, és körülbelül ötévente telepítik az új generációs számítógépeket.
Egy másik példa: Németország leggyorsabb számítógépe 2005 júliusában, egy 57 millió eurós NEC 576 főprocesszorral a nagy teljesítményű számítógépes központban (HLRS), akár 12,7 TeraFLOPS-ot, és optimista volt, mint ötször gyorsabb, mint egy "normál" számítógép . Az üzemeltető a működési költségeket (az akvizíciót nem számítva) évente 1,3 millió euróra, a személyzeti költségekre pedig 1,5 millió euróra tette. A magas beszerzési költségek miatt egy ilyen erőteljes rendszert béreltek a teljes rendszerre, körülbelül 4000 eurós óradíjjal ( a Stuttgarti Egyetem tagjai azonban lényegesen alacsonyabb árat fizettek).
2006 márciusában Németország legújabb „leggyorsabb” számítógépét helyezték üzembe Jülichben , a JUBL -t (Jülich Blue Gene / L ). 45,6 TeraFLOPS -tal a világ hatodik leggyorsabb számítógépe volt, amely 15 000 "normál" modern PC számítási teljesítményét kínálta. A Jülich Kutatóközpont vezérigazgatója (2006. március) a számítási időigény alakulásának értékelése a további fejlesztések szempontjából érdekes: "A számítási idő iránti kereslet 1000 -szeresére nő a következő öt évben."
A Berkeley Open Infrastructure for Network Computing körülbelül 700 000 aktív számítógépe átlagosan körülbelül 12 Peta FLOPS teljesítményt ért el 2015 decemberében
A korrelátora az Atacama Large Millimeter / submillimeter Array (ALMA) végeztük 17 petaflop 2012 decemberében, míg a számítási teljesítmény a Widar correlator az Expanded Very Large Array (EVLA) van megadva 40 petaflop.
Különböző szuperszámítógép -kezelők jelenleg arra törekszenek, hogy betörjenek az Exaflops teljesítménykínálatába. Egyre több processzor halmozódik fel a fizikailag megvalósítható korlátok közé. A processzormagok számával nemcsak a számítási teljesítmény nő, hanem az energiafogyasztás és a hulladékhő, az adatcserére, az adathálózatokra, valamint az adattárolásra és archiválásra vonatkozó követelmények is. Az újabb rendszereket egyre inkább úgy tervezik, hogy további előnyöket termeljenek a keletkező hulladékhőből. Tehát így z. B. Az épületeket vagy az üvegházakat fűtik. Néha megfontolják, hogy a szuperszámítógépeket fel kell -e szerelni saját erőműveikkel.
LINPACK 1kx1k (DP) | Maximális teljesítmény (GFLOPS -ban) |
Átlagos teljesítmény (GFLOPS -ban) |
Hatékonyság (%-ban) |
---|---|---|---|
Cella , 1 SPU, 3,2 GHz | 1.83 | 1.45 | 79,23 |
Cella, 8 SPU, 3,2 GHz | 14,63 | 9.46 | 64,66 |
Pentium 4 , 3,2 GHz | 6.4 | 3.1 | 48,44 |
Pentium 4 + SSE3, 3,6 GHz | 14.4 | 7.2 | 50,00 |
Core i7 , 3,2 GHz, 4 mag | 51.2 | 33.0 ( HT engedélyezve) | 64.45 |
Core i7 , 3,47 GHz, 6 mag | 83.2 | ||
Core i7 2600k, Sandy Bridge , 3,4 GHz, 4 mag | 102,5 | 92.3 | 90,05 |
Itánium , 1,6 GHz | 6.4 | 5,95 | 92,97 |
Nvidia Tesla GP100 , 1,48 GHz | 10600 | ||
Nvidia Quadro P6000 | 19553 | 12901 | |
Xeon Skylake SP 6148 | 1536 | ||
AMD Ryzen 1800X, 8K / 16T, eddig nem optimalizált | 221 | ||
Intel Core i7-7700K , 4K / 8T | 241 | ||
Intel i7-5960X, 8K / 16T | 375 | ||
Intel Core i7 5820k, 6K / 12T, 3,3 GHz | 273.1 | 265 |
Lásd még
Egyéni bizonyíték
- ↑ Lebegőpontos műveletek másodpercenként (flop). In: Glossary entry at heise online ; 2010. november 8 -án
- ↑ Tesztelt Nvidia GeForce RTX 3080: Hozz erősítőt! In: heise.de , hozzáférés : 2020. szeptember 18
- ↑ Coprocessor.info - x87 információ, amit tudnia kell! 2011. szeptember 30., hozzáférés: 2019. augusztus 14 .
- ↑ Nagy teljesítményű számítási központ Stuttgarti Egyetem / Rendszerek
- ↑ Svábországban a számításokat rendkívül gyorsan végzik. In: Stern.de , 2005. július 22., hozzáférés 2014. január 17 -én.
- ↑ A nagy teljesítményű Stuttgart (HLRS) számítástechnikai központ használatáért fizetendő díjak ütemezése ( az eredeti emlékeztetője 2013. október 23-tól az Internet Archívumban ) Információ: Az archívum linkjét automatikusan beszúrták, és még nem tették közzé ellenőrizte. Kérjük, ellenőrizze az eredeti és az archív linket az utasítások szerint, majd távolítsa el ezt az értesítést. (PDF; 105 kB)
- ^ Berkeley Open Infrastructure for Network Computing. In: boinc.berkeley.edu
- ↑ Erőteljes szuperszámítógép az ALMA teleszkópjává teszi
- ↑ A világ legmagasabb szuperszámítógépe összehasonlítja a csillagászati adatokat. In: Heise online
- ↑ Országos Rádiócsillagászati Obszervatórium: Cross -Correlators & New Correlators - Az architektúra megvalósítása és megválasztása 27. o. (PDF; 9,4 MB)
- ↑ National Radio Astronomy Observatory: The Expanded Very Large Array Project - The 'WIDAR' Correlator 10. o. (PDF; 13,2 MB)
- ↑ IBM: Cell Broadband Engine Architecture és első megvalósítása
- ↑ tecchannel.de
- ↑ a b c Anon: Ryzen 1800X linpack eredmények. Itt: https://i.imgur.com/RDvvhN0.png . reddit.com, 2017. február 27., hozzáférés 2017. december 27 .