Zum Inhalt springen

Xeon Phi: Intels von Larrabee abgeleitete Karte im Supercomputer von TACC

    1651711743

    Wir stellen Intel Xeon Phi vor

    Intel hat Supercomputer im Visier, die bis 2020 eine Leistung der exaFLOP-Klasse erbringen können. Um dies ins rechte Licht zu rücken, haben wir uns Mitte der 1990er Jahre mit teraFLOPS-fähigen Systemen beschäftigt. Und die schnellsten Supercomputer von heute liegen in der Größenordnung von mehreren zehn PetaFLOPS. Das Erreichen von einem exaFLOPS erfordert eine 1000-fache Beschleunigung im Vergleich zu einer Maschine mit einem petaFLOPS. Das ist eine erstaunlich große Zahl.

    Um dorthin zu gelangen, sind zweifellos Beschleuniger erforderlich, wie Intel sie nennt. AMD und Nvidia geben sich damit zufrieden, ihren GPUs den plötzlichen Anstieg der Gleitkommaleistung zuzuschreiben, den die schnellsten Supercomputer von heute aufweisen. Aber alle Parteien sind sich einig, dass die Zukunft dieses Raums nicht ausschließlich Xeons oder Opterons gehört. Die meisten Analysten erwarten stattdessen eine Mischung aus Rechenressourcen von diesen großen CPUs bis hin zu kleineren, spezialisierteren Kernen.

    Um dem Vorsprung gerecht zu werden, den beide GPU-Anbieter bereits in diesem Bereich haben, und um der steigenden Nachfrage nach Rechenleistung gerecht zu werden, stellt Intel heute seinen Xeon Phi Coprocessor 5110P vor und kündigt die Xeon Phi Coprocessor 3100-Serie an, die es sein wird 2013 erschienen.

    Im Wesentlichen nimmt Xeon Phi 60 (zumindest in der angekündigten 5110P-SKU) x86-Kerne mit großen 512-Bit-Vektoreinheiten auf, betreibt sie mit mehr als 1 GHz und liefert mehr als 1 TeraFLOPS an Leistung mit doppelter Genauigkeit auf einem Dual-Slot PCI Express-Karte mit einer benutzerdefinierten Linux-Distribution. Derselbe Xeon Phi 5110P enthält 8 GB GDDR5-Speicher, obwohl Intel plant, die Karten der 3100-Serie mit 6 GB zu bewaffnen. Natürlich sind die Kerne nicht dafür ausgelegt, die allgemeinen Arbeitslasten zu bewältigen, die Sie mit einem Core der dritten Generation oder sogar einem Atom-Prozessor bewältigen würden. Vielmehr zeichnen sie sich durch parallelisierte Aufgaben aus, die in der Lage sind, diese vielen Kerne effektiver zu nutzen. 

    Warum brauchen Sie eine Beschleunigerkarte wie die Phi? Wettermodellierung, medizinische Bildgebung, Energieerkundung, Simulation, Finanzanalyse, Erstellung von Inhalten und Fertigung sind alles Bereiche, die derzeit Hardware von AMD und Nvidia für ihre Rechenleistung nutzen. Intel versucht einfach, dasselbe mit einem Produkt zu tun, das keine Codierung in CUDA oder OpenCL erfordert. Stattdessen können ISVs für Phi mit C, C++ und Fortran optimieren, mit spezifischen Ergänzungen zum Code, die den Beschleuniger aufnehmen und nutzen.

    Natürlich war es keine leichte Aufgabe, hierher zu gelangen, und viele Enthusiasten werden den Namen der Larrabee-Geschäftseinheit wiedererkennen, der bereits 2005 entstand. 2004 startete Intel ein mehrjähriges Projekt, nachdem er erkannt hatte, dass die Taktraten dies nicht konnten aufgrund von Material- (Prozess-) und Leistungsbeschränkungen unbegrenzt skalieren. Larrabee war jahrelang in der Entwicklung und versorgte uns im Laufe seiner Entwicklung mit einer Flut von sowohl vielversprechenden als auch peinlichen Schlagzeilen.

    Die Meilensteine ​​auf Intels Zeitplan stießen alle auf großes Interesse, da das Unternehmen ein Konzept vieler integrierter Kerne evangelisierte, das sich von dem unterschied, was seine Konkurrenz tat. Als bekannt wurde, dass Larrabee bestehende Grafikprozessoren von AMD und Nvidia unterbieten würde, stornierte Intel natürlich seinen Plan, eine eigene Grafikkarte einzuführen, und konzentrierte sich stattdessen auf die High-Performance-Computing-Fähigkeiten der Architektur. Wie wir sehen werden, sind Vorproduktionsbeispiele der Hardware bereits Teil des Top500-Projekts. 

    Als Teil der Markteinführung von Xeon Phi flog Intel Pressevertreter in das Texas Advanced Computing Center, um den Stampede-Supercomputer zu sehen, der Xeon Phi verwendet. Natürlich konnten wir während der Fahrt ein paar Fotos von einem der schnellsten Computersysteme der Welt einschmuggeln. Aber bevor wir Intels Herangehensweise an HPC verstehen können, müssen wir Larrabee verstehen. Machen wir also einen kleinen Schritt in die Vergangenheit.

    0 0 votes
    Rating post
    Abonnieren
    Benachrichtige mich bei
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x