
L'architettura:
L'architettura della GPU Parhelia-512 rappresenta qualcosa di esclusivo nell'attuale panorama degli acceleratori 3D. Innanzitutto essa è a 512bit, un passo in avanti rispetto alle attuali GPU in commercio che hanno architettura a 256bit. L'interfaccia memoria scelta da Matrox per questa GPU è a 256bit, ovviamente di tipo DDR: in abbinamento a memorie con frequenza di lavoro di 550 Mhz, questa interfaccia garantisce una bandwidth complessiva superiore a 17,5 Gbytes al secondo. Le schede attualmente in commercio utilizzano architettura memoria a 128bit, in abbinamento a veloci memorie DDR con frequenze di lavoro che arrivano a 650 Mhz: con questi dati le schede GeForce 4 Ti4600 arrivano ad una bandwidth della memoria video di poco superiore a 10 Gbytes al secondo.
Il chip è composto da circa 80 milioni di transistor, un valore elevatissimo, con tecnologia a 0.15 micron; la frequenza di lavoro, per la versione Retail, è pari a 220 Mhz, un valore conservativo rispetto a quello di altri chip video in commercio (si pensi, ad esempio, alle schede GeForce 4 Ti) ma giustificato dalla notevole complessità dell'architettura Matrox.
[Fonte Hwupgrade.it]

Lo schema di funzionamento della GPU Parhelia-512 è estremamente complesso, come si nota chiaramente nell'immagine: l'engine grafico è composto da 4 pipeline di calcolo, ciascuna in grado di processare 4 texture per pixel per ogni ciclo di clock (Quad Texturing). Le unità di Pixel e Vertex Shaders sono altrettanto complesse: sono infatti presenti 4 unità Vertex Shaders, con 4 pixel pipes, e 5 Pixel shader stages per ogni pipeline.
[Fonte Hwupgrade.it]
Modelli disponibili:


Le memorie:

Il Chip:


- 0.15micron manufacturing technology;
- 80 million transistors;
- 200/220MHz chip clock-rate;
- 256bit DDR SDRAM memory controller;
- 500MHz (250MHz DDR) / 550MHz (275MHz DDR) graphics memory frequency;
- Up to 256MB of graphics memory;
- The support of PCI 2.2, AGP 2.0 and AGP 3.0 interfaces and AGP 1x, 2x, 4x protocols;
- The support of ACPI, PCI Bus Power Management 1.1;
3D features:
- Four pixel pipelines with four texturing units per pipeline;
- Rendering of up to four textures per pass;
- Texture blocks dynamic management;
- Bi-linear, tri-linear and anisotropic texture filtering;
- Anisotropic filtering with up to 16 samples (anisotropy level - up to 4);
- S3TC/DXTC texture compression;
- Volumetric textures;
- Projected textures and render-to-texture support;
- Flat, spherical and volumetric environment maps;
- Bump mapping via EMBM, Dot3 and Emboss techniques;
- Hardware support of DirectX 8.1 ver. 1.3 pixel shaders;
- Hardware support of DirectX 8.1 ver. 1.1 and DirectX 9 ver. 2.0 vertex shaders;
- 4-pipeline T&L and vertex shaders unit;
- Simultaneous processing of up to 16 vertexes;
- Depth-Adaptive tessellation;
- Support of Bezier splines, N-patches;
- Displacement maps;
- Bi-linear and tri-linear filtering of displacement maps (Vertex Texturing);
- Full-screen anti-aliasing by means of 4-subpixel (2x2) supersampling;
- Fragment Anti-aliasing with the quality of 16x (4x4) supersampling;
- Textures, vertexes, instructions and Z-buffer caching;
- The support of textures and the frame buffer with enhanced color precision: 10bit per channel (ARGB 2:10:10:10);
- Gaming in TripleHead mode (Surround Gaming);
2D features:
- Two built-in 400MHz RAMDACs with 10bit per channel color depth;
- Two external 165MHz TMDS transmitters with 10bit per channel color depth;
- Specialized RAMDAC for the TripleHead mode;
- Built-in TV-encoder with 10bit per channel color depth;
- Multi-display configuration support in DualHead, TripleHead, Clone, Zoom and DVDMax modes;
- Hardware support of Windows XP GDI and DirectDraw functions;
- 10bit per channel color depth in graphics modes;
- Hardware font anti-aliasing (Glyph Antialiasing);
- Video output in the 10bit per channel color modes;
- 8-bit alpha-channel overlays;
- Independent overlay gamma correction;
- Scalable video using bi-cubical interpolation and 4x4 filter with programmable coefficients;
- Adaptive per-pixel de-interlacing;
- Max. CRT resolution: 2048x1536;
- Max. DVI resolution: 2560x 2048;
- Max. DVI total resolution in the TripleHead mode: 3840x1024;
- Max. TV resolution: 1024x768;
16x Fragment Antialiasing (FAA-16x)
I migliori risultati con Anti Aliasing, in termini di superiore qualità d'immagine, si ottengono generalmente abilitando la modalità 4x, cioè con precisione di 4 subpixel; tale precisione ha, però, un considerevole impatto negativo sui frames al secondo generati, soprattutto quando si utilizzano risoluzioni video elevate. Per ovviare a questi limiti Matrox ha sviluppato una nuova tecnica, nota con la sigla di FAA-16x (16x Fragment Antialiasing).


Il punto di partenza è una considerazione molto semplice: quando si utilizzano tradizionali tecniche di anti aliasing tutti i pixel che compongono una scena vengono processati, con una notevole mole di operazioni svolte dalla GPU e la richiesta di una elevata bandwidth della memoria video. Non tutti i pixel devono però essere processati, in quanto solo una piccola parte di quelli che compongono una scena 3D (mediamente tra il 5 e il 10%) necessitano di un filtraggio correttivo. Matrox è partita da questo presupposto: il 16x Fragment Antialiasing, infatti, ricerca proprio i pixel frammentati, quelli cioè che devono essere processati con tecniche di antialiasing, e solo su questi effettua una tecnica di antialiasing, con precisione di 16 subpixel, quindi ad un livello ancor più dettagliato rispetto a quello disponibile con le attuali tecniche di antialiasing implementate nelle GPU in commercio.

Come opera all'atto pratico la GPU Matrox? I pixel che compongono i triangoli di vertice degli oggetti rappresentati in una scena 3D vengono ispezionati dalla GPU determinando se questi vengano o meno visualizzati, oppure se siano parzialmente visualizzati e quindi richiedano tecniche di antialiasing. Tutti i pixel frammentati, che quindi devono essere processati, vengono inviati in un apposito buffer, il fragment buffer, e in quest'ultimo memorizzati; quelli non frammentati vengono immediatamente scritti nel frame buffer. Nel fragment buffer viene mantenuta una lista di pixel da frammentare, composta per ogni pixel dall'insieme dei suoi sub-pixel e dalle informazioni sul colore di ogni vertice che va ad intersecare quel particolare pixel. L'unità di elaborazione FAA-16x verifica in continuazione il contenuto del fragment buffer, così da determinare quali pixel frammentati siano richiesti per la corretta rappresentazione di ogni frame che compone la scena. Se un pixel viene richiesto, l'unità FAA-16x lo processa e lo invia al frame buffer, dove verrà associato agli altri pixel che non richiedono frammentazione così da comporre il frame finale.
[Fonte Hwupgrade.it]
Nella figura qui sopra raffigurata questi sono, in dettaglio, i passaggi:
4a) particolare del corno del drago, che dev'essere processato con tecniche di antialiasing;
4b) l'unità di calcolo FAA-16x identifica i pixel non frammentati da quelli frammentati. I pixel non frammentati vengono scritti direttamente nel frame buffer;
4c) i pixel frammentati vengono individuati e scritti nel fragment buffer;
4d) i frammenti sono individuati ispezionando, con precisione a 16 subpixel, i vertici dei triangoli;
4e) i dati sui frammenti, nonchè le corrispondenti informazioni sui colori, vengono memorizzate nel fragment buffer;
4f) i dati frammentati vengono scritti nel frame buffer, se necessari per generare quello specifico frame che dev'essere visualizzato.
64-Super Sample Texture Filtering
La qualità delle scene 3D di un gioco è funzione di numerosi parametri; nel corso dell'ultimo anno la direzione intrapresa sia da nVidia che da ATI è quella di utilizzare la tecnologia implementata nei propri chip video non tanto per fornire frames al secondo più elevati, quanto per migliorare il realismo della scena 3D riprodotta. L'utilizzo massiccio di tecniche di filtraggio delle textures sempre più complesse mira proprio ad ottenere, quale obiettivo, un superiore realismo degli oggetti raffigurati.

Matrox ha integrato, nella GPU Parhelia-512, un'unità di texture filtering estremamente complessa, in grado di allocare dinamicamente sino a 64 textures samples per ciclo di clock, un valore doppio rispetto a quanto permesso con le attuali GPU in commercio. Questi samples possono essere allocati in modo dinamico all'interno della scena riprodotta, in modo tale che vengano filtrate solo le aree della scena che richiedono una superiore qualità (tipicamente le superfici in secondo piano); filtrando in modo dinamico la GPU deve effettuare un numero medio di operazioni inferiore, a tutto vantaggio dell'impatto prestazionale che il filtraggio genera.
Matrox dichiara che, con il chip Parhelia-512, è possibile riprodurre pixel dual-textured con filtro trilineare attivo con le medesime prestazioni ottenibili sempre con pixel dual-textured ma con filtro bilineare con le GPU attualmente in commercio; oppure, riprodurre pixel dual-textured con filtraggio anisotropico a 16 sample a prestazioni velocistiche comparabili a quelle di pixel dual-textured con filtraggio trilineare attivo, sempre rispetto alle GPU concorrenti attualmente in commercio.
Gli effetti pratici del 64-Super Sample Texture Filtering sono evidenti: sarà possibile, in teoria, utilizzare filtraggi delle textures sempre più complessi limitando il più possibile l'impatto sulle prestazioni velocistiche della GPU.
Benchmark:







Screenshot:
Differenze AA
Confronto
AA 4X GeForce4

AA 4X Parhelia
