ння поширюються і на проблему визначення за допомогою навчання способу поведінки; наприклад, участь в чаюванні Having A Cup Of Tea - це важлива дія високого рівня, але як ввести його в бібліотеку дій, яка спочатку містить набагато більш прості дії, такі як Raise Arm (Підняти руку) і Swallow (Зробити ковток)? Якщо ми не зрозуміємо специфіку таких проблем, то зіткнемося з стомлюючої завданням побудови великих баз повсякденних знань вручну.
.2 Архітектура об'єктів
Виникає резонне питання: «Які архітектури агентів повинні використовуватися в агентах?» Відповіддю є: «Все архітектури!» Вище було показано, що рефлексні реакції потрібні в тих ситуаціях, в яких суттєвим є фактор часу, а з іншого боку, міркування, засновані на знаннях, дозволяють агенту планувати наперед. Повноцінний агент повинен бути здатним виконувати і те й інше з використанням гібридної архітектури. Одним з важливих властивостей гібридних архітектур є те, що кордони між різними компонентами, що забезпечують прийняття рішень, не постійні. Наприклад, в процесі компіляції декларативна інформація, отримана на рівні формування міркувань, послідовно перетворюється у все більш ефективні подання, що дозволяє в кінцевому підсумку досягти рефлексного рівня, як показано на рис. 1.2. (В цьому полягає мета навчання на основі пояснення).
Рис. 1.2. Компіляція служить для перетворення результатів прийняття рішень на основі міркувань у більш ефективні рефлексивні механізми.
Точно таку ж структуру мають такі архітектури агентів, як Soar і Theo. Після вирішення кожного завдання за допомогою явного формування міркувань ці агенти зберігають узагальнену версію отриманого рішення для його використання в рефлексних компоненті. Менш вивченою проблемою є проблема здійснення процесу, зворотного зазначеному, - після зміни середовища рефлекси, засвоєні в результаті навчання, можуть виявитися більше не придатними, і агенту може знадобитися повернутися на рівень формування міркувань, для того щоб виробити нові способи поведінки.
Агентам можуть також знадобитися способи, що дозволяють управляти своїми власними процесами формування міркувань. Вони повинні бути здатними припинити роздуми, коли будуть потрібні дії, а також повинні вміло використовувати час, відведений на міркування, щоб виконати найбільш продуктивні обчислення. Наприклад, агент-водій таксі, який виявив попереду картину дорожньої пригоди, повинен вирішити за частку секунди, чи слід йому загальмувати або об'їхати те місце, де сталася пригода. Крім того, даний агент повинен також витратити лише частку секунди на роздуми про найбільш важливі в цій ситуації питаннях, наприклад, чи немає руху на смугах ліворуч і праворуч і чи немає безпосередньо позаду нього великої вантажівки, але не замислюватися над тим, що різкий маневр збільшить знос і стирання шин автомобіля або що йому давно потрібно було знайти чергового пасажира. Дослідження таких проблем здійснюється головним чином у рамках напрямку штучного інтелекту реального часу. У міру того як системи штучного інтелекту проникають у все більш складні проблемні області, всі вирішувані завдання стають завданнями реального часу, оскільки агенту ніколи більше не відводиться достатньо часу для точного рішення задачі прийняття рішень.
Очевидно, що стає нагальною потреба в методах, які дозволяють діяти в більш з...