ованою структурою відносяться систолические і хвильові процесори, програмовані процесори, асоціативні процесори з SIMD-архітектурою та ін.
Основна трудність у використанні реконфігурованих структур полягає в підготовці настроювальної інформації для створення в ПЛІС схеми, реалізує заданий алгоритм.
Один з можливих варіантів побудови КС із застосуванням ПЛІС наведено в [4]. Суперкомп'ютер НС - 98ш містить керуючий комп'ютер і двухплатний програмно - реконфігурованих обчислювач, що містить 14 ПЛІС Virtex-II серії 6000 і 4 Virtex-II серії 4000. У сукупності обидві ці ПЛІС містять 98 млн. Вентилів.
Після включення живлення першого ПЛІС програмується за допомогою інформації, що надходить з постійного пам'яті, яке розміщене на платі. При цьому в ПЛІС формується порт шини PCI-X, через який керуючий комп'ютер, використовуючи середовище розробки програм Viva, програмує решта ПЛІС.
Беручи до уваги, що на ПЛІС можна реалізувати будь-яку схему, з'являється можливість створити однорідну обчислювальну середу з одного типу осередків, програмуючи зв'язки між комірками. Така середу має короткі зв'язки між сусідніми осередками, а реалізація взаємодії між віддаленими осередками здійснюється за принципом близкодействия через ланцюжок осередків, розташованих між ними. Все це призводить до незначних затримок сигналів усередині мікросхеми і, отже, забезпечує реальну можливість отримання високої швидкодії пристроїв, виконаних на ПЛІС. Тим не менш, схеми однорідної обчислювальної зРеди, призначені для реалізації арифметичних операцій над 64-розрядними операндами з плаваючою точкою, все ж поступаються за швидкодією пристроям обробки операндів з плаваючою точкою серійних мікропроцесорів з традиційною архітектурою.
Програмований мікропроцесор усуває цей недолік, зберігши переваги програмованої структури обчислювальних систем. Такий мікропроцесор будується на кристалі як осередок однорідної решітки. Осередок містить процесор і програмований комутатор, призначений для передачі і прийому даних між сусідніми осередками.
Процесор будується по конвеєрній схемі з дисципліною обслуговування FIFO і з можливістю використання проміжних результатів відразу після їх отримання на кожній стадії конвеєра, в тому числі, для передачі в інші осередки. Передбачаються також кеш-пам'ять даних і кеш-пам'ять команд.
Зв'язки між осередками і зв'язки між обробляючими пристроями в конвеєрі ідентичні і базуються на проміжних FIFO-чергах, передають дані по готовності приймача. При цьому процес обчислень визначається розміщенням даних у чергах.
Програмований комутатор осередку містить 2 інтерфейсних процесора: статичний і динамічний. Статичний інтерфейсний процесор управляє передачами слів даних по встановлюваним при компіляції програми маршрутами.
Динамічний інтерфейсний процесор служить для передач даних, виконання яких не можна передбачити під час компіляції (наприклад, промахи в кеш-пам'яті, переривання і т.д.). Він керує процедурою передачі пакетів слів, використовуючи метод комутації каналу на час передачі.
Осередки, що знаходяться на межі поля осередків, мають вільні канали, до яких підключаються контролери пам'яті, периферійних зовнішніх пристроїв. Переривання від контролерів передаються у вигляді спеціальних повідомлень, в яких вказується, яка осередок повинна обробляти це переривання.
В [6] розглядаються принципи побудови багатопроцесорної системи з програмованою архітектурою і структурно-процедурної організацією обчислень, що складається з уніфікованих базових модулів.
Структурно-процедурна організація обчислень являє собою детерміновану послідовність кадрів, кожен з яких можна розглядати як якийсь функціональний оператор. Виділено наступні типові процедури:
звернення до каналів розподіленої пам'яті - макрообращенія;
паралельного доступу - макрокоммутаціі;
типові конструкції структурної реалізації фрагментів завдань - макрооперації.
На відміну від ряду реконфігурованих обчислювачів, для яких потрібно безупинно завантажувати програмну і числову інформацію з host-машини, в обчислювач з програмованою архітектурою відразу завантажується ціла програма, що представляє собою послідовність викликів кадру. Після цього обчислювач функціонує автономно. Така організація обчислювального процесу дозволяє істотно підвищити ефективність обчислювача, а наявність безлічі каналів розподіленої пам'яті - підвищити швидкість обробки інформації.
Загальна структура реконфігурованих обчислювального комплексу, представлена ??в [6], містить реконфігурованих обчислювач, що складається з N базових модулів, і пристрою керування. При ...