Re: Aspettando AMD VEGA
Inviato: 3 agosto 2017, 2:10
Ciao Mikael, benvenuto. Non ci ho capito quasi una mazza, ma questo tipi di interventi penso siano quelli che arricchiscano la cultura di noi appassionati (e spesso, fanno la differenza fra chi è appassionato e chi ci lavora) quindi ti ringrazio.mikael84 ha scritto:Ciao Nemesis, cerco di dare il mio contributo, magari può essere utile.
Le AMD hanno maggiore capacità di calcolo, se non vengono impiegate le LDS, e possono operare sino a 256st con soli 19 cicli di clock. Sono 4+4+4+4 + 3 di star, di un vettore all'altro.
Le rop's quando si attiva MSAA sono notevolmente più potenti. Pensa che in blendind 32 rop's AMD sono equivalenti a 128 rop's Nvidia, la quale svolge prevalente funzioni diverse, non MSAA, ma color buffer e color-ops, praticamente sono utili nel backfaceculling (ecco perchè gli unigine spingono fortissimo) I dati dello z-buffer sono utilizzati per calcolare la distanza degli oggetti dall'osservatore e, quindi, per le operazioni di rimozione dei poligoni nascosti.![]()
AMD ha un freno a mano, ovvero, non riesce a gestire tutti i thread in contemporanea, ha problemi con la LDS, ed ha una banda, seppur con HBM a tratti irrisoria.
Nvidia invece, non ha alcun freno, ha le unità funzionali e se ne occupa il DU2, di conseguenza esprime al massimo la virgola mobile (TF).
L'host interface legge i dati dalla CPU, mentre il gigathread pesca i dati dalle memorie. Una volta completato il processo, il giga thread invia tutti i dati ai vari warp.
Ogni warp divide i calcoli, tra unità FP e unità funzionali (LDS/sfu che ogni 4 cicli offre 4 pixel /rop's). Le SFU oltre ai pixel si occupano di operazioni trascendentali e calcoli algebrici.
Il warp è composto da 32 thread, all'intero (sino a Pascal) è presente un contatore che assegna il compito di lavoro.
Se esegui dx11, o open gl, utilizzi praticamente tutti i thread, utilizzando calcoli paralleli, il contatore del warp si incasina, perchè lo suddivide in pezzi da 4x4 o simili, conseguentemente, si ritrova ad elaborare calcoli complessi, ed altri, subordinati, dove il lavoro secondario, lascia vari thread in idle, o li memorizza in cache, il cui accesso è molto veloce.
Tutto ciò va programmato per bene, altrimenti vai solo a peggiorare e succede questo.
http://www.gamersnexus.net/game-bench/2 ... 11-vs-dx12" onclick="window.open(this.href);return false;
Le dx12 salvo varie programmazioni danno il meglio di se, in multi gpu, quando molti shader dormienti riescono a lavorare (se ben programmati).
Volta, finalmente non integra più il contatore thread, ma ogni thread è indipendente e può decidere a suo modo.
Vorrei approfondire e vorrei capire cosa hai scritto, ma prima avrei qualche domanda (rivolta a te e chiunque altro) per chiarire un paio di carte:
1)Cosa sono le LDS?
2)cosa intendi con 256 ST ? cosa accade nei 14 cicli di clock?
3)cosa sono, esattamente, le ROP's e cosa determina l'aumentare di queste?
4)questo problema del "freno a mano" pensi si possa risolvere?
5)cosa sono le unità funzionali e le DU2 di nvidia?
6)e i gigathread e i warp?
7)quali sono le operazioni trascendenti di cui parli? intendi funzioni matematiche non polinomiali?
8)puoi spiegare meglio il problema delle dx11 di cui parli? non è che forse intendevi DX12?
Ti ringrazio (te e chiunque avrà voglia di rispondere, per la disponibilità)
dopo l'intervento di mikael quasi mi sembra di inquinare il topicLordpkappa ha scritto:Riguardo a Rxvega penso vi sia meglio sul mercato, costasse un 100 euro meno rispetto a 1080 potrebbe avere un senso, ma la trovo poco elegante, GPU gigantesca.semplifichiamo un secondo il discorso, allora: se la RX andasse quanto una 1080, prezzo minore-uguale, con margini di miglioramento, pensi che sarebbe una cattiva scheda da avere? ovviamente ipotizzando di non dover cambiare alimentatore

che per il momento sia poco elegante mi trovi assolutamente d'accordo, non troverei parole migliori per descrivere (io l'avrei chiamata "architettura ignorante" LOL). Però dai, spezziamo una piccola lancia, oltre all'architettura ha: le HBM2 e l'HBCC, che poco eleganti non sono

tuttavia, ipotizzando prezzo (partiamo da 500€ ma quanto staranno le custom qui in Italia!? le 1080 stanno sui 600, ora, su amazon...) le performance mediamente uguali al D1 avresti fra i pro della RX il supporto al freesync, pieno supporto alle DX12 (le pascal, per dirti, non supportano l'AC) e dei possibili margini di miglioramento da qui in futuro. Di contro, ovviamente, i consumi e temperature allucinanti.