Interview exclusive : tout sur le supercalculateur GPU français
Bruno Cormier le 16 juin 2008 (34 760 lectures)
Qu'est-ce que tout cela donne en termes de puissance théorique de calcul ? Et en termes de coût total et de consommation ?
On est à peu près sur 4 téraflops simple précision par noeud Tesla, et 0,5 téraflop en double précision, selon les estimations fournies par NVIDIA. Ils ont par rapport à la génération précédente doublé le nombre de coeurs (processeurs de flux, NDLR), et donc c'est normal que les estimations de puissance doublent aussi. Donc au total on a 48 clusters Tesla à 4 téraflops, soit 192 téraflops, simple précision.
La partie « scalaire » de la machine, composée des 2136 processeurs de calcul Intel Nehalem EP, fait 103 téraflops théoriques en double précision. Il y a 534 serveurs, donc 1068 noeuds de calculs, donc 2136 processeurs, donc 8544 coeurs, chaque coeur est estimé à 3 GHz et capable de traiter 4 opérations par cycle, donc 8544 x (3 x 109) x 4 = 102528 x 109 flops, environ 103 téraflops en double précision.
On observe donc une perte de performance significative dès qu'un GPU passe en double précision, même s'il la gère nativement. La double précision est pourtant essentielle pour le calcul intensif.
Cette machine va donc tout de même être un gros monstre, on imagine qu'elle entrera dans le classement mondial des supercalculateurs les plus puissants ?
Oui, ce n'est pas une finalité, évidemment, on cherche surtout à répondre aux besoins des utilisateurs. Mais c'est vrai qu'on a accumulé quand même un certain retard, qu'il est important de rattraper notamment face à nos voisins anglais et allemands, qui sont quand même largement devant nous.
Actuellement en France, la communauté académique dispose de 20 téraflops de calcul, donc vous voyez que ce n'est pas grand chose. En début 2009, si on tient compte des acquisitions que GENCI aura faites, ainsi que celles du CNRS, on aura une puissance de feu proche de 500 téraflops. En fait, cette année, on aura fait l'acquisition du supercalculateur dont on parle pour le CCRT, et d'un autre de 147 téraflops auprès de SGI, pour le CINES (nous en parlions dans cette actualité, ce sera une machine CPU Intel Xeon uniquement, NDLR).
En moins d’un an, nous sommes arrivés à multiplier par un facteur 25 la capacité de calcul offerte à la communauté scientifique. Un effort assez conséquent, on n'est pas encore au niveau des Anglais ou des Allemands, mais le rattrapage est énorme. Cela permettra de donner aux scientifiques les moyens de réaliser leur recherche et d'éviter qu’ils soient obligés de partir à l'étranger pour effectuer leurs calculs ou que leur papier soient refusés lors de conférences parce que les systèmes simulés sont trop petits.
On est à peu près sur 4 téraflops simple précision par noeud Tesla, et 0,5 téraflop en double précision, selon les estimations fournies par NVIDIA. Ils ont par rapport à la génération précédente doublé le nombre de coeurs (processeurs de flux, NDLR), et donc c'est normal que les estimations de puissance doublent aussi. Donc au total on a 48 clusters Tesla à 4 téraflops, soit 192 téraflops, simple précision.
La partie « scalaire » de la machine, composée des 2136 processeurs de calcul Intel Nehalem EP, fait 103 téraflops théoriques en double précision. Il y a 534 serveurs, donc 1068 noeuds de calculs, donc 2136 processeurs, donc 8544 coeurs, chaque coeur est estimé à 3 GHz et capable de traiter 4 opérations par cycle, donc 8544 x (3 x 109) x 4 = 102528 x 109 flops, environ 103 téraflops en double précision.Pour le prix de la machine, on ne sait pas encore exactement combien coûtera chaque module, le prix total est encore un peu confidentiel. La consommation totale est en revanche de l'ordre de 600 kW environ.
On observe donc une perte de performance significative dès qu'un GPU passe en double précision, même s'il la gère nativement. La double précision est pourtant essentielle pour le calcul intensif.
Oui, la perte de performances est plutôt normale. La grande majorité des applications de calcul scientifique nécessitent de part leurs algorithmes et méthodes numériques l’usage de la double précision. D'autres se satisfont par contre très bien de la simple précision, comme chez les pétroliers en géophysique, où les scientifiques effectuent leurs calculs en simple précision. Eux peuvent donc dès maintenant utiliser les GPU actuels pour accélérer leurs recherches.
Cette machine va donc tout de même être un gros monstre, on imagine qu'elle entrera dans le classement mondial des supercalculateurs les plus puissants ?
Oui, ce n'est pas une finalité, évidemment, on cherche surtout à répondre aux besoins des utilisateurs. Mais c'est vrai qu'on a accumulé quand même un certain retard, qu'il est important de rattraper notamment face à nos voisins anglais et allemands, qui sont quand même largement devant nous.
Actuellement en France, la communauté académique dispose de 20 téraflops de calcul, donc vous voyez que ce n'est pas grand chose. En début 2009, si on tient compte des acquisitions que GENCI aura faites, ainsi que celles du CNRS, on aura une puissance de feu proche de 500 téraflops. En fait, cette année, on aura fait l'acquisition du supercalculateur dont on parle pour le CCRT, et d'un autre de 147 téraflops auprès de SGI, pour le CINES (nous en parlions dans cette actualité, ce sera une machine CPU Intel Xeon uniquement, NDLR).
En moins d’un an, nous sommes arrivés à multiplier par un facteur 25 la capacité de calcul offerte à la communauté scientifique. Un effort assez conséquent, on n'est pas encore au niveau des Anglais ou des Allemands, mais le rattrapage est énorme. Cela permettra de donner aux scientifiques les moyens de réaliser leur recherche et d'éviter qu’ils soient obligés de partir à l'étranger pour effectuer leurs calculs ou que leur papier soient refusés lors de conférences parce que les systèmes simulés sont trop petits.
Sommaire
- 1. GENCI au secours du retard de la France dans le calcul intensif
- 2. Le supercalculateur hybride CPU / GPU du CCRT en détails
- 3. Un supercalculateur très puissant, les chiffres





