Intel

Intel ‘Alder Lake’ 12th Gen Core, Thread Director, ‘Alchemist’ Discrete GPU Architecture Détails annoncés

Intel a organisé une présentation virtuelle de la Journée de l’architecture, révélant les détails de l’ingénierie derrière plusieurs produits à venir dans les espaces de consommation et de centre de données. Alors que les spécifications exactes des CPU et des GPU devront attendre leur lancement, nous avons maintenant une meilleure idée des blocs de construction qu’Intel utilise pour les assembler. Intel SVP et GM du groupe Accelerated Computing Systems and Graphics, Raja Koduri, a dirigé la présentation au cours de laquelle plusieurs ingénieurs seniors d’Intel sont apparus.

Le 12e La gamme de processeurs Gen Core, nommée « Alder Lake », devrait être lancée dans les prochains mois, à commencer par les modèles de bureau. Ce seront les premiers processeurs Intel grand public à proposer un mélange de cœurs hautes performances et basse consommation, ce qui est courant dans tous les SoC mobiles aujourd’hui. Cela fait suite au processeur expérimental ‘Lakefield’ qui n’a eu qu’une version limitée jusqu’à présent. Alder Lake utilisera une approche plus modulaire qu’auparavant, avec différentes combinaisons de blocs logiques pour différents segments de produits.

Intel utilisera les termes Performance core et Efficient core, souvent abrégés en P core et E core. Pour Alder Lake, les cœurs E sont basés sur l’architecture « Gracemont » tandis que les cœurs P utilisent la conception « Golden Cove ». Pour Gracemont, Intel a ciblé la taille du silicium physique et l’efficacité du débit, afin de cibler les performances multithread sur un grand nombre de cœurs individuels. Ces noyaux fonctionnent à basse tension et seront principalement utilisés par des procédés plus simples.

Les cœurs P basés sur Golden Cove sont conçus pour la vitesse et une faible latence. Intel appelle cela le cœur le plus performant qu’il ait jamais construit. La nouveauté de cette génération est la prise en charge des extensions matricielles avancées pour accélérer la formation et l’inférence en apprentissage en profondeur.

Trois filières différentes d’Alder Lake serviront différents segments de produits

Ensemble, cette génération de cœurs P et E dans l’architecture d’Alder Lake sera hautement évolutive, de 9 W à 125 W, ce qui couvre la plupart des catégories mobiles et de bureau d’aujourd’hui. Il sera fabriqué à l’aide du processus Intel 7 nouvellement annoncé, qui est un changement de marque du processus « Enhanced SuperFIN » 10 nm. Différentes implémentations intégreront différentes combinaisons de DDR5, PCIe Gen5, Thunderbolt 4 et Wi-Fi 6E.

L’implémentation de bureau utilisera un nouveau socket LGA1700 avec jusqu’à huit cœurs de performance (deux threads chacun), huit cœurs efficaces (à thread unique) et 30 Mo de mémoire cache de dernier niveau. Le GPU intégré aura jusqu’à 32 unités d’exécution pour la sortie d’affichage de base et les capacités graphiques. Il n’aura pas intégré Thunderbolt ou un bloc de traitement d’image, mais il prendra en charge 16 voies de PCIe Gen5 plus quatre autres voies de PCIe Gen4. Les contrôleurs de plate-forme correspondants pour les cartes mères auront jusqu’à 12 autres voies PCIe Gen4 et 16 PCIe Gen3.

Deux versions mobiles d’Alder Lake ont également été discutées : une puce plus classique avec six cœurs P et huit cœurs E, et une puce ultracompacte avec deux cœurs P et huit cœurs E. Les deux auront des GPU avec 96 unités d’exécution ainsi que des unités de traitement d’image et des contrôleurs Thunderbolt intégrés, et seront destinés aux appareils qui n’auront pas de GPU discrets.

Tous les processeurs d’Alder Lake sont composés de blocs logiques modulaires : les cœurs de processeur, le processeur graphique, le contrôleur de mémoire, les E/S, etc. Ils prendront en charge jusqu’à DDR5-4800, LPDDR5-5200, DDR4-3200 et LPDDR4X-4266 RAM, et il appartiendra aux fabricants de cartes mères et d’ordinateurs portables de décider lesquels implémenter. Les blocs modulaires de chaque CPU seront connectés via trois matrices : calcul, mémoire et E/S. Intel décrit 100 Go/s de bande passante de la structure de calcul par cœur P ou par cluster de quatre cœurs E, pour un total de 1 000 Go/s entre 10 de ces unités. Le cache de dernier niveau peut être ajusté dynamiquement entre inclusif et exclusif en fonction de la charge.

directeur de thread intel intel

Thread Director nécessite Windows 11 pour une utilisation optimale de tous les cœurs

Nous avons maintenant quelques informations sur la façon dont les charges de travail seront équilibrées entre les cœurs P et E. Intel annonce un nouveau planificateur matériel appelé Thread Director, qui sera complètement transparent pour le logiciel et fonctionnera avec le planificateur du système d’exploitation pour attribuer des threads à différents cœurs en fonction de l’urgence et des conditions en temps réel. Conçu pour évoluer sur les processeurs mobiles et de bureau, Thread Director sera capable de s’adapter aux conditions thermiques et d’alimentation et de migrer les threads d’un type de cœur à un autre, ainsi que de gérer le multi-threading sur les cœurs P, avec une « précision à la nanoseconde ».

Thread Director nécessite Windows 11, et Alder Lake fonctionnera donc de manière optimale sous ce prochain système d’exploitation, bien que Windows 10, Linux et d’autres systèmes d’exploitation fonctionneront également. Cela signifie que le planificateur du système d’exploitation comprend désormais quels types de threads nécessitent quels types de ressources et peut hiérarchiser la latence, l’économie d’énergie ou d’autres paramètres en fonction des conditions de fonctionnement.

Intel taquine son premier GPU de jeu haut de gamme depuis un certain temps maintenant, et augmente le battage médiatique avec l’annonce récente d’une nouvelle marque Intel Arc pour le matériel, les logiciels et les services GPU. Le produit de première génération porte le nom de code « Alchemist » et sera lancé au début de 2022. Il s’agit d’un niveau de la pile de produits de l’architecture Xe connue sous le nom de Xe-HPG, ou High Performance Gaming. Alchemist sera fabriqué par TSMC sur son nœud N6. Il prendra en charge le lancer de rayons matériel ainsi que les fonctionnalités de DirectX 12 Ultimate telles que l’ombrage de maillage et l’ombrage à taux variable.

intel xess alchimiste intel

XeSS utilisera l’IA pour mettre à niveau les images et améliorer les performances, un peu comme DLSS

Chaque cœur Xe-HPG de première génération aura 16 moteurs vectoriels et 16 moteurs matriciels ainsi que des caches, permettant des charges de travail GPU communes ainsi que l’accélération de l’IA. Quatre de ces cœurs, plus quatre unités de lancer de rayons et d’autres matériels de rendu, constituent une « tranche ». Chaque GPU Alchemist peut avoir jusqu’à huit tranches de ce type.

Maintenant, nous savons également qu’Intel va déployer sa propre version de l’upscaling de l’IA, appelée XeSS (Xe Super Sampling), pour prendre en charge le DLSS de Nvidia et le FSR d’AMD. XeSS est une méthode de mise à l’échelle basée sur l’IA qui combine les informations des images précédentes. Intel revendique des performances jusqu’à 2 fois supérieures en effectuant un rendu à des résolutions inférieures, puis en passant à la résolution cible. XeSS fonctionnera même sur les GPU intégrés Xe LP, et plusieurs développeurs de jeux sont à bord pour le prendre en charge.

Bien que nous n’ayons pas encore de spécifications GPU, Intel a déclaré avoir travaillé pour offrir des performances de «leadership» par watt. Nous sommes sûrs d’en savoir plus à l’approche du lancement.

Intel a également fait plusieurs annonces liées à ses activités de serveurs et de centres de données lors de la Journée de l’architecture, y compris une démonstration de la prochaine architecture Ponte Vecchio pour le Big Data qui sera la base du supercalculateur exascale Aurora. Les autres points forts ont été la plate-forme modulaire ‘Sapphire Rapids’ Xeon Scalable, la pile logicielle oneAPI et une catégorie de produits émergente – les unités de traitement d’infrastructure (IPU), conçues pour séparer les frais généraux d’infrastructure des données client et des exigences de traitement dans les centres de données centrés sur le cloud.