Der Multiprozessor PS-2K und Visionen zum Einchip- Superprozessor

Gegenwärtig begrenzt die Durchsatzleistung der Speicher wesentlich die Effektivität von Multicore Rechnersystemen. In der Mikroarchitektur PS-2000M erhöht sich die Durchsatzleistung des Speichers V wesentlich, da sie proportional zu allen Hauptparametern ist , die die Parallelität und die Geschwindigkeit der Architektur bestimmen :

V = p*t*r*f,

wobei t - die Zahl der lokalen Banken des dynamischen Speichers М.j in t Verarbeitungseinheiten ist, p- die Zahl der Worte in der Zeile der Speicherbank M.j, r - die Bitlänge des Wortes, f- die interne Taktfrequenz des Speichers im Chip .

Die Durchsatzleistung des Speichers wächst wesentlich, sowohl dank der deutlichen Erhöhung der Zahl der gleichzeitig gelesenen Informations- Bit, als auch dank der Erhöhung der Taktfrequenz des Speichers. So beträgt für t=64, p=8, r=32, f=1000 Mhz die Durchsatzleistung 160 ТBit/s. Die Zugriffszeit zum dynamischen Speicher wird konstant dank der Adressierung nur der Zeilen der Speicherbank und ermöglicht eine synchrone Arbeitsweise.

Es ist leicht zu sehen, dass die funktionellen Möglichkeiten des programmtechnisch gesteuerten Speichers in der PS-2K - Architektur, das auf einem Chip sitzt, um ein Vielfaches die Möglichkeiten eines Buffer- Cache- Speichers übersteigen, welcher auf dem Chip des Mikroprozessors, auch bei Multicore - Prozessoren, sitzt.

Die Erweiterung durch Aneinanderreihung [Kaskadierung] des Multiprozessors PS-2000M wird gewährleistet durch die Möglichkeit der programmierten Konfigurierung der Ring- und der "öffentlichen" Kanäle, was übrigens auch die Möglichkeit bietet, auch einzelne Verarbeitungseinheiten abzuschalten und dadurch den Grad der Ausbeute der Chips zu erhöhen.

Die der Multiprozessor- Architektur PS-2000 zugrunde gelegten Architektur- Prinzipien sind heute besonders aktuell. Damals erlaubten sie bei einer für heutige Verhältnisse sehr geringen Taktfrequenz von 3 МHz von einer Struktur mit 64 parallel arbeitenden PE des PS-2000 eine Spitzenleistung von 200 МIPS (oder 50 МFLOPS ), was sich durch Multiplikation der Taktfrequenz mit der Zahl der parallelen PE ergibt. Dabei arbeitete der Verbund aus 64 langsamen (3 MHz) PE wie ein kompakter "superschneller" Prozessor mit einer Frequenz von 200 MHz. Es wäre hinzuzufügen, dass die nahe 100% betragende mittlere Auslastung aller PE unter realen Anwendungen eine mittlere Leistung ermöglichte, die nahe an der Spitzenleistung lag, was bei den wichtigsten Industrie-Aufgaben der Datenverarbeitung der Fall war.

Gegenwärtig könnte die Realisierung der Mikroarchitektur des PS-2000M in einem Chip mit einer Taktfrequenz von 2 GHz eine Leistung von mehr als 120 GIPS bringen, oder umgerechnet einen Prozessor mit einer Frequenz von 120 GHz.

Die Existenz einer großen Reserve an Gates die heute auf Mikroelektronik-Chips möglich ist, gibt die Möglichkeit, die Produktivität der Arithmetik- Befehle mit Gleitkommaformat deutlich zu erhöhen, was es erlaubt, die Produktivität eines einzelnen Chips mit 64 PE mit ca. 120 GFLOPS abzuschätzen.

Die Erweiterbarkeit [Kaskadierung] der Architektur hinsichtlich der Zahl der PE in der PS-2000 Architektur ist proportional dem Zuwachs von Gates auf dem Chip. Mit den angegebenen Annahmen kann die Leistung die Größe von ca. 1 TFLOPS bei 512 PE auf einem Chip erreichen.

Eine Bauelementebasis aus Multicor- Chips mit PS-2000 Architektur eröffnet die Möglichkeit der Schaffung von programmtechnisch rekonfigurierbaren Parallel- Pipeline- Systemen mit superhoher Leistung sowohl für speziellen Bedarf, als auch für allgemeine Anwendung. Mit derartigen Chips kann man eine Leistung von 1 PFLOPS in wenigen Schränken erreichen.

Der Einsatz von dynamischen Speichern ermöglicht den Energieverbrauch auf einem PS-2000M -Chip zu senken. Der Einsatz einer massiv- parallelen kaskadierbaren SIMD- Architektur für die Organisation der Rechenoperationen und eines verteilten Speichers ermöglicht es , durch Änderung der internen Taktfrequenz den Quotienten aus Rechnen- Leistung und Energieverbrauch zu regulieren, aber auch mittels eines Gleichgewichtes [ Balance] zwischen der Apparatur für Rechenoperationen und Speicher. Das macht die PS-2000M-Architektur leicht anpassbar bzgl. des Energieverbrauch und ermöglicht deren Einsatz in mobilen Geräten.

Zur Übersetzung

Vorwort der Autoren

Die Periode der „Eiszeit“ in der Architektur

Innovativer Durchbruch

Die Architektur des PS -2000

Das Befehls- (Instruktions-) System

Konfigurationsvarianten ( Erweiterbarkeit, Kaskadierung)

Technische Eigenschaften der Geräte des PS-2000

Rechnerkomplexe auf Basis von PS-2000

Besonderheiten der Programmierung

Anwendungsbereich des PS -2000