Recenti test su larga scala, tra cui un marketplace simulato da Microsoft e una competizione di red teaming, hanno evidenziato significative vulnerabilità di sicurezza e limitazioni funzionali nei principali agenti di intelligenza artificiale. Nonostante i progressi, gli attuali agenti di intelligenza artificiale hanno difficoltà a gestire processi decisionali complessi, a collaborare e sono soggetti a manipolazioni, il che indica che non sono ancora pronti per un'implementazione su larga scala nel mondo reale.

