и MPP, є число процесорів (n). Суворої кордону не існує, але зазвичай вважається, що при n gt;=128 - це вже МРР, а при n lt;=32 - ще ні.
Зовсім не обов'язково, щоб MPP-система мала розподілену оперативну пам'ять, при якій кожен процесорний вузол має свою локальну пам'ять. Так, наприклад, комп'ютери SPP1000/XA і SPP1200/XA [15] - приклад систем з масовим паралелізмом, пам'ять яких фізично розподілена між гиперузла, але логічно є спільною для всієї ЕОМ. Тим не менше, більшість MPP-комп'ютерів мають як логічно, так і фізично розподілену пам'ять.
У кожному разі MPP-системи належать до класу MIMD. Якщо говорити про MPP-компьютерах з розподіленої пам'яттю і абстрагуватися від організації вводу-виводу, ця архітектура природно розширенням кластерної на велика кількість вузлів. Тому для таких систем характерні всі переваги й недоліки кластерів. Причому у зв'язку з підвищеним числом процесорних вузлів як плюси, так і мінуси стають набагато вагоміша (процесорний вузол це блок ЕОМ, який може містити кілька процесорів, наприклад, як в комп'ютерах SNI/Pyramid RM1000, і сам по собі мати архітектуру SMP).
Завдяки масштабованості, саме MPP-системи є сьогодні лідерами за досягнутою продуктивності комп'ютера; найбільш яскравий приклад цьому - Intel Paragon. З іншого боку, проблеми розпаралелювання в MPP-системах проти кластерами, що містять трохи процесорів, стають ще важче розв'язуються. Крім того, прирощення продуктивності зі зростанням числа процесорів зазвичай взагалі досить швидко убуває. Легко наростити теоретичну продуктивність ЕОМ, але набагато важче знайти завдання, які зуміли б ефективно завантажити процесорні вузли.
Сьогодні не так вже багато додатків можуть ефективно виконуватися на Mpp-комп'ютері, крім цього є ще проблема переносимості програм між Mpp-системами, мають різну архітектуру. Започаткована в останні роки спроба стандартизації моделей обміну повідомленнями ще знімає всіх проблем. Ефективність розпаралелювання у часто залежить від деталей архітектури Mpp-системи, наприклад топології з'єднання процесорних вузлів.
Найефективнішою була б топологія, у якій будь-який вузол міг би безпосередньо зв'язатися з іншою вузлом. Однак у MPP-системах це технічно важко можна реалізувати. Зазвичай процесорні вузли в сучасних MPP комп'ютерах утворюють чи двумерную грати (наприклад, в SNI/Pyramid RM1000) або гіперкуб (як в суперкомп'ютерах nCube [18]).
синхронізації паралельно виконуються в вузлах процесів необхідний обмін повідомленнями, які мають доходити із будь вузла системи-якій іншій вузол, важливою характеристикою є діаметр системи с1 - максимальне відстань між вузлами. Стосується двомірної грати d ~ sqrt (n), в разі гиперкуба d ~ 1n (n). Таким чином, при збільшенні кількості вузлів архітектура гиперкуба є вигідною.
Час передачі від вузла до вузла залежить від стартової затримки і швидкості передачі. У будь-якому разі під час передачі процесорні вузли встигають провести багато команд, і це співвідношення швидкодії процесорних вузлів і передавальної системи, мабуть, зберігатиметься - прогрес в продуктивності процесорів набагато більше, ніж в пропускної спроможності каналів зв'язку. Тому інфраструктура каналів зв'язку є однієї з головних компонентів Mpp-комп'ютера.
Оцінки продуктивності суперЕОМ
Оскільки суперкомп'ютери традиційно використовувалися для виконання обчислень над числами, більшість сьогоднішніх оціночних характеристик продуктивності пов'язано саме з цими обчисленнями. Перш за все, до них відноситься пікова продуктивність, вимірювана в млн. Операцій з плаваючою точкою, які комп'ютер теоретично може виконати за 1 сек (MFLOPS). Пікова продуктивність - величина, практично не досяжна. Це пов'язано, зокрема, з проблемами заповнення функціональних конвеєрних пристроїв, що є типовим не тільки для векторних суперЕОМ, але і для комп'ютерів на базі мікропроцесорів RISC-архітектури. Особливо важливо це для Суперконвейерная архітектури мікропроцесорів, наприклад, DEC Alpha, для якої характерне застосування відносно довгих конвеєрів. Зрозуміло, що чим більше конвеєр, тим більше треба ініціалізації часу для того, щоб його заповнити. Такі конвеєри ефективні при роботі з довгими векторами. Тому для оцінки векторних суперЕОМ було введено таке поняття, як довжина полупроізводітельності - довжина вектора, при якій досягається половина пікової продуктивності [4].
Більш реальні оцінки продуктивності базуються на часах виконання різних тестів. Звичайно ж, самими хорошими тестами є реальні завдання користувача. Однак такі оцінки, по-перше, дуже специфічні, а, по-друге, часто взагалі недоступні або відсутні. Тому зазвичай застосовуються більш універсальні тести, однак традиційні методики оцінки продуктивності мікропроцесорів - SPEC- у світі с...