AMD Interlagos: l’architettura Bulldozer per il mondo server - Caratteristiche delle CPU

Indice articoli

 

Caratteristiche delle CPU

 

Le soluzioni server AMD sono flessibili, con la tecnologia Turbo core, Core select per selezionare da BIOS il numero di core visibili (per esempio per ridurre i costi di licenza software), svariate modalità di funzionamento di FLEX FP, partizionamento della Cache e nuove istruzioni HPC (FMA4 e XOP, esclusive di AMD, e AVX e di accelerazione crittografica, condivise con INTEL), TDP power CAP, per limitare la potenza dissipata dalle CPU con granularità di 1W, stato C6, per un minor consumo in IDLE, 6 classi di TDP per poter scegliere la CPU più adatta alle proprie esigenze, supporto per DIMM a basso e bassissimo voltaggio, supporto da 4 a 64 core per rack con stesso chipset (e quindi driver) per tutti i sistemi da 1 a 4 socket.

AMD_Interlagos_6

La tecnologia Turbo core si attiva sia con tutti i core attivi, nel qual caso consente un aumento da 300 a 500MHz a seconda dei modelli e con al massimo metà dei core attivi può arrivare fino a 1.2GHz (per il modello top di gamma a 16 core).

AMD_Interlagos_7

Come abbiamo visto nella presentazione dell’architettura Bulldozer, ogni modulo è dotato di una FPU condivisa, capace di eseguire istruzioni a 128 e 256 bit di due thread.

AMD_Interlagos_8

I set di istruzioni supportati dalla FPU sono:

  • x87, MMX, SSE1, SSE2, SSE3, che è il set di istruzioni FPU e intero legacy, sia scalare che SIMD, supportato sia da AMD che INTEL;
  • SSSE3, SSE4.1, SSE4.2, che è il set FPU e intero SIMD, supportato sia da AMD che INTEL, che consente di accelerare gli algoritmi video, biometrici e di elaborazione intensiva del testo;
  • AESNI, PCLMULQDQ, che è il set di istruzioni, comune sia ad AMD che INTEL, per accelerare gli algoritmi criptografici, ed in particolare quelli AES;
  • AVX, che è il nuovo set di istruzioni, condiviso sia da AMD che INTEL, con una nuova codifica estensibile, che consente di avere istruzioni FPU e intere SIMD sia a 128 che 256 bit, e che serve per accelerare le applicazioni di calcolo intensivo, come quelle HPC;
  • FMA4, set di istruzioni esclusivo di AMD, che consente di effettuare operazioni di moltiplicazione e accumulo a 4 vie in una sola istruzione, accelerando di molto gli algoritmi che li richiedono, come la moltiplicazione di matrice e molti calcoli scientifici;
  • XOP, set di istruzioni esclusivo di AMD, che contiene istruzioni per accelerare applicazioni multimediali, come sommatoria di vettori, estrazione di frazione e conversione per numeri FP a 16 bit, usati nelle schede video.

 

Questi ultimi insiemi di istruzioni sono stati progettati per aumentare la densità di calcolo per istruzione, per ridurre la necessità di copiare registri (solo FMA4) e per consentire la vettorizzazione automatica da parte dei compilatori.

Corsair