Come creare GPU più potenti per soddisfare la domanda di prestazioni in costante crescita? I produttori di schede video e acceleratori se lo domandano di continuo e finora abbiamo visto due approcci per raggiungere tale obiettivo: creare GPU sempre più complesse, con tutti i problemi del caso, oppure mettere più GPU su un unico PCB.

L’ultima GPU di fascia alta di Nvidia a bordo della Tesla V100, nota con il nome GV100, occupa un’area di 815 mm2, conta 21,1 miliardi di transistor, ha 5376 CUDA core (di cui 5120 attivi) e 672 Tensor core (640 attivi su GV100). Il tutto realizzato con il processo produttivo a 12 nanometri FFN di TSMC.

Jen-Hsun Huang con una scheda dotata di GPU GV100 Volta

Durante la presentazione della scheda, il boss di Nvidia ha parlato di un vero e proprio miracolo d’ingegnerizzazione per realizzare un chip così grande e complesso, lasciando intendere che per il futuro sarà necessario battere altre strade per offrire le prestazioni richieste dal mercato e farlo in modo da contenere i costi di sviluppo e quelli produttivi.

Il sito Techreport ha pescato un interessante documento in cui Nvidia propone quello che è definito Multi-Chip Module GPU (MCM-GPU), ossia l’uso di diversi moduli GPU su un singolo package. L’idea è frutto di un gruppo di ricerca che mette insieme i ricercatori della Arizona State University, di Nvidia, della University of Texas di Austin e del Barcelona Supercomputing Center.

mcm gpu

Partendo proprio dalla difficoltà d’inserire un numero di transistor sempre maggiore in un singolo die, con problemi di rese e costi annessi, nel documento si analizzano le strade alternative. In passato sia Nvidia che AMD hanno inserito due GPU sullo stesso PCB, creando le cosiddette schede “dual-GPU”. I ricercatori ritengono però che quell’approccio abbia diversi problemi (e in effetti non ha mai pienamente convinto). Oltre a consumi e temperature, ci sono difficoltà a distribuire il carico di lavoro tra le GPU, in quanto è richiesto un grande sforzo da parte dei programmatori al fine di usare l’hardware in modo efficiente.

Leggi anche: Guida all’acquisto della scheda video

I ricercatori, invece, pensano che i tempi siano sempre più maturi per collocare diversi moduli GPU su un singolo package, sfruttando le ultime tecnologie messe a punto. Tali GPU sarebbero più piccole di quelle attuali, sia in termini di dimensioni che di transistor, quindi più semplici e meno costose da realizzare. Il loro numero e l’uso di un’interconnessione ad alta velocità, possibilmente in grado di offrire un bandwidth di diversi terabyte al secondo, permetterebbe però di ottenere prestazioni davvero elevate.

L’idea non è stata ancora messa in atto concretamente, ossia non ci sono prototipi da toccare con mano, ma è stata invece simulata. I ricercatori di Nvidia e degli atenei coinvolti hanno creato una soluzione MCM-GPU con un totale di 256 Streaming Multiprocessor (SM), ben di più degli 86 SM di GV100 o dei 60 SM di GP100. Il team ha poi messo a confronto questa soluzione con una ipotetica singola GPU con 128 SM, riscontrando un aumento prestazionale teorico del 45,5%.

mcm gpu2

Allo stesso tempo la simulazione ha permesso di vedere come la soluzione MCM-GPU offrisse prestazioni simili a una singola GPU monolitica con 256 SM, ritenuta irrealizzabile (almeno al momento). Nel documento si parla di una differenza prestazionale entro il 10%. Nvidia ha anche rilevato come la configurazione MCM-GPU fosse il 26,8% più veloce di una scheda multi-GPU con lo stesso numero di SM e bandwidth DRAM.

Questi numeri, poiché legati a una simulazione e basati su alcuni assunti e ottimizzazioni non testate, sono chiaramente da prendere come dati ipotetici e non un dogma. Sembrano però dipingere una strada percorribile, in quanto anche se forse non fanno gridare del tutto al miracolo, non bisogna dimenticare che il progetto nasce per far fronte a problematiche ben maggiori e importanti di qualche punto prestazionale in più o in meno.

È inoltre interessante vedere come il settore rincorra nuove idee. Tra l’altro sembra che Nvidia non sia l’unica a pensarci, anche in casa AMD starebbero lavorando a questa soluzione, forse da presentare già con Navi, il progetto successivo a Vega.


Tom’s Consiglia

In attesa delle schede video del futuro, la Gigabyte GTX 1060 WINDFORCE OC 3G è tra le schede più vendute su Amazon.

Articolo importato da Tom's Hardware

Puoi legge l'articolo dal sito di provenienza qui