Pentium Pro, який підтримував ефективне об'єднання чотирьох процесорів на однієї системної платі, що дозволило забезпечити більш високу швидкість обробки даних в багатопоточних додатках, орієнтованих на серверні платформи і робочі станції.
Поява в 2002 році технології Hyper-Threading (HT) ознаменувало прихід багатопотокового паралелізму, тобто можливості виконувати різні потоки додатків одночасно на одноядерний процесор. Тестування продуктивності, проведене корпорацією Intel, показало, що на процесорах з технологією HT швидкість роботи деяких додатків зростає в середньому на 30%.
Нині, взявши курс на багатоядерні платформи, корпорація Intel стала лідером у процесі переходу на багатопотокові і паралельні обчислення на масових ПК, забезпечивши обробку даних на декількох обчислювальних ядрах один процесор.
Більшість додатків, вже сьогодні оптимізованих для паралельного виконання обчислювальних потоків, наприклад, програм, що підтримують технологію Hyper-Threading або призначених до виконання на робочих станціях або серверах з двухпроцессорной конфігурацією, при виконанні на багатоядерному процесорі демонструють прекрасну масштабованість продуктивності. До цієї категорії відносяться мультимедійні додатки, наукові програми та системи CAD/CAM [7,9].
Перший суперскалярної МП i960 був випущений фірмою Intel в 1987 році. Потім були розроблені МП SPARC (1987-1989 роки), MIPS (1988-1989 роки), МПi860 (1989 рік) і ряд інших суперскалярних МП, зокрема:
1. Процесор Pentium було вперше поставлено фірмою Intel в 1993 році як продовження сімейства МП 80x86. Мета його створення - отримання швидкодії RISC-МП і повна сумісність на рівні двійкових кодів з програмним забезпеченням, створеним для всіх МП 80x86. p> 2. Група фірм AIM (APPLE + IBM + MOTOROLA) спільно розробили сімейство МП POWER PC і випустили його перший зразок МП 661 в 1993 році. p> 3. Фірма DEC у 1992 році для створення потужних робочих станцій випустила МП 21064 з тактовою частотою 250 Мгц, а потім більш потужний МП - 21164. p> 4. У 1994 році фірма MIPS Computer, відома розробкою суперконвейерная МП, випустила перший суперскалярної МП MIPS R8000 (MIPS - Microprocessor Without Interlocked Pipeline Stages), а потім МП R10000. p> 5. У 1994 році фірма Sun Microsystem Inc. в продовження розвитку своєї серії SPARC (Scalable Processor Architecture) випустила потужний МП UltraSPARC. p> 6. У 1994-1995 роках фірмою Hewlett-Packard був випущений МП PA7200 з високими показниками швидкодії, передбачається до випуску МП РА8000. p> Всі зазначені МП є суперскалярное і тому характеризуються рядом загальних властивостей, зокрема:
1. Формування групи команд для завантаження конвеєрів виробляється динамічно в кожному такті. Для цього апаратно на етапі передвибірки і дешифрування проводиться аналіз залежності по даним суміжних команд. У конвеєри для паралельного виконання підбираються незалежні команди, при цьому допускається зміна порядку виконання команд. p> 2. Всі МП використовують динамічне прогнозування розгалужень на основі буфера історії переходів. Іноді використовується одночасне виконання альтернативних гілок. p> 3. Деякі МП будуються таким чином, що число фізичних регістрів перевищує число РОН, визначених архітектурно (РРС620, Mips R10000, P6). Це необхідно для реалізації альтернативних гілок при переходах і для усунення залежностей за даними, викликаних недоліком РОН. У процесі виконання команд необхідно виробляти перейменування фізичних регістрів, тобто вони виступають в якості віртуальних.
Більшість зазначених МП випускається в однокристальному виконанні, проте в цілях отримання більш високої швидкодії для МП PPC 620 використано 10 кристалів п'яти типів, а для МП R8000 - 4 кристали трьох типів.
Архітектура описаних вище суперскалярних МП набуває традиційний характер, тому робляться спроби освоїти нові архітектури. Однією з найбільш перспективних є розроблення МП РА9000, вироблена спільно фірмами Hewlett-Packard і Intel. Головна особливість РА9000 полягає в тому, що генерація набору команд для одного такту повністю переноситься в компілятор, що дозволяє досягти високого рівня оптимальності програми і значно розвантажити кристал від схем планування та упаковки. Тим самим відбувається перехід до VLIW (Very Long Instruction Word) архітектурі [8,10]. p> 4 VLIW-архітектура
У 1970 р. багато обчислювальні системи оснащувалися додатковими векторними сигнальними процесорами (VSP - Vector Signal Processor), що використовують VLIW-подібні довгі інструкції, прошиті в ПЗУ. Ці процесори застосовувалися для виконання швидкого перетворення Фур'є (ШПФ) і інших обчислювальних алгоритмів. p> Першими справжніми VLIW-комп'ютерами стали міні-суперкомп'ютери, випущені на початку 1980 року компанія MultiFlow, Culler і Cydrome, але вони не мали комерційного успіху. Планувальник обчислень і програмна конвеєризація були запропоновані Фішером і Рау (Cydrome). Сьогодні це...