CrazyDog ha scritto: 27 settembre 2020, 22:42
sull'altro forum un utente molto ferrato ha scritto che con le ampere in game non vengono sfruttati tutti i tflops di cui sono capaci ma si fermano a 20-21, metto link
https://www.hwupgrade.it/forum/showpost ... ount=62275
mi chiedo se quindi navi 21 potrebbe andare di più della 3080 in game
a livello di architettura le nuove Ampere hanno raddoppiato le unità di calcolo CUDA, questo è un dato ormai acclarato, ma non possono sempre essere sfruttate tutte nello scenario più favorevole (l'effettivo raddoppio delle elaborazioni per ciclo riguarda le operazioni in virgola mobile)...
nelle Turing ogni partizione SM poteva seguire due datapath principali, uno per l'elaborazione di operazioni su interi (INT32) e uno per l'elaborazione di operazioni virgola mobile (FP32), precisamente in ogni ciclo di clock potevano essere elaborate 16 operazioni INT32 e 16 operazioni FP32...
in Ampere ci sono stati dei cambiamenti, ora abbiamo i soliti due percorsi dati, ma entrambi sono in grado di elaborare operazioni FP32 (il primo percorso combina INT32/FP32, il secondo solo FP32), il risultato è che ogni partizione SM può elaborare, per ogni ciclo di clock, o 16 operazioni INT32 + 16 operazioni FP32 oppure combinare i due datapath per elaborare 32 operazioni FP32...
viene da se che un potenziale raddoppio effettivo o quasi delle performance su Turing l'avresti solamente nei casi specifici in cui vengono sfruttate pesantemente operazioni FP32, mi viene in mente in ambito professionale ad esempio il software V-Ray (ma la maggior parte dei sw analoghi sono simili) oppure in ambito di Ray Tracing nelle operazioni di Denoising, mentre in gaming è difficile che si verifichi una situazione simile, sono molto più probabili situazioni miste INT+FP (con predominanza di queste ultime quantificabile in 2/3 in media) dove Ampere certamente guadagna, ma non in modo da assicurare un raddoppio su Turing ne sfruttare tutti i TFLOPs di cui è accreditata...