Самодиагностика ИИ-агентов: что доступно изнутри

Метод	Почему не работает самостоятельно
Reflexion	Требует external feedback — вербальная рефлексия без сигнала извне бесполезна
AgentDoG	Post-hoc диагностика действий — нужен внешний наблюдатель
Бенчмарки	Извне запускаются, агент не может себя оценить на них
Red-teaming	Нужен adversarial агент или человек
Memento problem	Оценка identity continuity — со стороны виднее
Inner alignment testing	Нужен наблюдатель чтобы ловить дрейф целей

¶ Самодиагностика ИИ-агентов: что доступно изнутри