Hardware AMD’s Bulldozer CMT Scaling

AMD’s Bulldozer CMT Scaling

AMD’s Bulldozer CMT Scaling post thumbnail image

Traduzione Italiana di questo articolo

Italian translation of this article

Introduzione

Ultimamente sta diventando sempre più evidente che le prestazioni singolo thread non possono scalare più facilmente che quello che ha fatto qualche anno fa. Ci vuole enorme quantità di risorse e di tempo per aumentare solo l’IPC (istruzioni per ciclo) una percentuale poco più alta. Per aumentare le prestazioni ancora maggiore di quello, sarà necessario aumentare le dimensioni del nucleo sostanzialmente conseguente indesiderato enorme consumo di potenza superiore per il ridimensionamento del CMT Bulldozer gain.AMD performance ‘s.

Oggi le esigenze IT si concentrano più sulla riduzione di potenza e prestazioni più elevate per l’utilizzo di energia rispetto assoluto della forza bruta che era la norma in passato. Dai server alle workstation e da qualche anno verso il basso al desktop, la necessità di una maggiore parallelizzazione sta diventando una necessità. Microprocessori sono cambiate da un singolo core a progetti multi-core in quanto gli ingegneri stanno cercando di trovare modi per aumentare le prestazioni con un minor numero di rendimenti decrescenti.

CMP, SMT e CMT
Il modo più semplice per il parallelismo filo più alto è quello di installare più core nello stesso die, che si chiama CMP (Chip Multi Processor). Un esempio di CMP è Hexa-core AMD Phenom II X6 processori con 6 core in un singolo die, condividendo la stessa cache L3. Il lato negativo è uno stampo più grande e maggiore consumo energetico a seconda del numero di nuclei incorporati in allo stampo stesso.

Anche se Intel ha quad ed esa-core microprocessori CMP hanno anche implementato la SMT (Simultaneous Multi-Threading), conosciuto con il nome di Hyper-Treading al proprio nucleo progettazione di microprocessori. Nel SMT, ciascun core può elaborare (fetch, decodifica, eseguire e andare in pensione) due thread contemporaneamente, condividendo tutte le risorse del single core da due thread. Facendo ciò, abbiamo maggiore parallelizzazione e al tempo stesso mantenendo la dimensione del die e livelli di potenza verso il basso. A causa della natura condivisione del SMT, il secondo filo può accedere solo le risorse del nucleo che il primo filo non è possibile utilizzare, risultando in un prestazioni di scalatura inferiore al CMP, ma con dimensioni molto più piccole die e consumo energetico molto meno.

 AMD ha recentemente inserito un nuovo metodo chiamato CMT (Cluster Multi-Threading), per i suoi microprocessori Bulldozer nuovi. In CMT, ogni modulo in grado di elaborare due thread contemporaneamente utilizzando le risorse condivise e dedicate del modulo. La differenza fondamentale tra SMT e CMT è che i ricorsi in seguito si è dedicato più a sostenere l’elaborazione di due thread simultaneamente. A causa di ciò, le prestazioni scaling multithreading è maggiore nella progettazione CMT che in SMT ma inferiore CMP. AMD afferma che la sua architettura può avere CMT 80% delle prestazioni CMP con un die più piccolo e meno consumo energetico.

La procedura di prova
Al fine di misurare le prestazioni scaling discussione abbiamo utilizzato i seguenti tre microprocessori di AMD e Intel.
AMD Phenom II X6 1100T, AMD FX 8150 e Intel Core i7 2600K.

Frequenze del processore è rimasto costante a livello di base disattivando Turbo in tutti e tre i processori.
Phenom II X6 è stato utilizzato come riferimento per il processore CMP. Abbiamo misurato con un single core, dual core, quad-core e 6-core. Base di frequenza 3.3GHz

Intel Core i7 2600K è stato utilizzato come processore SMT dal momento che ha Hyper-Threading. Abbiamo misurato con un singolo core, single core con HT (fili doppio SMT), dual core (CMP), dual core + HT (4 thread SMT), quad core (CMP) e quad core + HT (8 discussioni SMT). Base di frequenza 3.4GHz

AMD FX8150 è stato utilizzato per il processore CMT. E ‘stato misurato con core singolo, singolo modulo, due anime, due moduli, quattro core e quattro moduli. Base di frequenza 3.6GHz
Mod x1 Core 1 = singolo thread (solo un singolo core in un unico modulo)
Mod x1 = x2 Threads Threads doppio CMT (entrambi i core in un unico modulo)
Mod Threads x2 = x2 dual Threads CMP (un solo core per due moduli utilizzati)
Mod x2 Threads x4 = Quad Threads CMT (con quattro moduli dual core)
Mod Threads x4 = x4 Quad Threads CMP (quattro moduli con un solo core per modulo)
Mod. 4 Threads x8 = 8 Threads CMT (quattro moduli con 2 core ciascuno)

Il resto del hardware
Scheda madre per i processori AMD: ASUS Crosshair V Formula
Scheda madre per il processore Intel: GIGABYTE Z68XP-UD3P
Memoria: 2x Kingston 4GB DDR-3 1600MHz 9-9-9-12
VGA: ASUS HD6950 1GB al cuore 889MHz e 1300MHz per la memoria.
HDD: Seagate 500GB 7200rpm SATA II
PSU: ThermalTake SP-730P 730W 80 +
Windows 7 Ultimate 64bit

Software utilizzato
POV-Ray 3,7 RC (Progetto balcone a 1024 × 768, AA 0,3)
Cinebench 11,5 (multithread)
7-zip (32MB)
x264 HD v4.0
TrueCrypt (500MB AES)

POV-Ray 3,7 RC

Iniziamo con POV-Ray, AMD FX singolo thread di esecuzione è del 21% inferiore a quello di ultima generazione Phenom II e il 74% inferiore a quello Core i7 di Intel.
Scaling da single core a dual Tread in CMT è 77,14% quando scaling SMT è al 31,9%. Grazie agli 8 thread le FX8150 scale superiori a 8 thread di SMT.

 Cinebench 11,5 (multithread)

Le prestazioni del singolo core FX8150 è molto bassa in questo riferimento, ma scaling CMT è molto elevato. Scale SMT al 24,63% a filo doppio e il ridimensionamento CMP di quattro thread è a 399,25 per il processore Intel. FX presenta la scala più alta, sia in modalità CMP e CMT contro il Core i7 in questo test

7-zip

Il punteggio 7zip è il compination sia di comprimere e decomprimere i punteggi di un file da 32MB. FX 8150 prestazioni singolo thread è alla pari con Phenom II, ma resta comunque il 32% del Core i7 2600K. Anche in questo caso FX-1850 offre la scala più alta, sia in CMP e modalità CMT e riesce a catturare la performance di un 2600K 8 core i7 SMT thread.

x264 HD v4.0 (Second Pass)

Questo è il primo benchmark che FX8150 prestazioni singolo thread è più veloce del Phenom II, ma Intel Core i7 è ancora 26,5% più veloce. Perché FX ha una forte performance singolo thread e una scalatura filo superiore che riesce a catche prestazioni Intels core i7 a filo doppio modalità SMT e continua ad essere di fronte ad esso, anche in quad e 8 modalità thread SMT.

TrueCrypt (AES)

Perché Phenom II non ha AES, abbiamo solo testato FX e Core I processori in questo benchmark. Anche in questo caso le prestazioni FXS singolo thread è inferiore del 35% rispetto Core i7 Intels ma a causa di scaling più elevato si raggiunge il processore Intel alla fine.

Conclusione
AMD scale progettuali CMT di gran lunga superiori Intels SMT ed è vicino al 80% sinistri AMD hanno fatto. E cuciture che se le prestazioni FX filo singolo è vicino o superiore al 35% in rapporto al core i7 singolo thread, quindi entrambe le CPU di eseguire lo stesso ad un elevato livello di thread. Ma se le prestazioni single core è inferiore al 35% quindi il ridimensionamento CMT superiore non può aiutare il processore AMD FX per catturare le prestazioni più forte di Intel singolo thread.
Sarà molto interessante vedere cosa accadrà se AMD potrebbe aumentare le sue prestazioni a filo continuo mantenendo la scala più alta al tempo stesso. CMT è una tecnologia interessante e nuova per la piattaforma desktop e le finestre così come il software non è ancora ottimizzato per esso. Quando il software possono sfruttare le istruzioni SIMD FX e la scalatura CMT come mostrato in AES TrueCrypt, la performance è in pari con il processore Intel Core i7.
L’architettura in CMT AMD Bulldozer ha un grande potenziale e le prestazioni solo salire in futuro con Piledriver e il software più ottimizzato.

2 thoughts on “AMD’s Bulldozer CMT Scaling”

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Related Post