McKinsey & Company har släppt en första rapport om väntade effektiviseringspotential och affärsmöjligheter med AI Agenter. Där får vi lära oss att agenter är mer en typ av ”copilots with initiative” som verkligen kan och vill agera.
T ex planera, execute, lära och förbättra sig. Det innebär även ett helt nytt ekosystem där virtual coworkers (digital labor enligt Salesforce) dyker upp tillsammans med Copilots, taskbots, domain specialists och mer i en typ av ”full multi-agent systems”.
Hela 4,4 biljoner dollar finns att hämta i ökat värde med AI Agenter enligt McKinsey & Company. För de som helt bygger om sina arbetssätt och sätt att jobba. AI agenter kallas även ”plug-in smart”, de fattar browsers, APIs, legacy systems — få mer standardiserade gränssnitt är okända för agenterna. Förtroende, trust är oerhört viktigt. Företag måste kunna lita på sina användare och teams med all typ av feedback loops, guardrails och företagsmässig etik inbakat.
Samtidigt visar en färsk studie från Carnegie Mellon University att AI-agenter inte riktigt ersätter mänskliga användare i skarpa jobbsituationer. Enbart var fjärde uppgift som forskarna på Carnegie Mellon University gav agenterna löstes. De skapade ett simulerat företag med olika interna system, chattverktyg och gave agenterna uppdrag hämtade från vardagliga uppgifter i IT-branschen (t ex utveckling, administration och ekonomi). AI-modeller från OpenAI, Google, Meta och Anthropic utvärderas paralellt. Claude 3.5 Sonnet klarade sig bäst, men då lösts färre än 25 procent av uppgifterna. Utmaningen var att förmågan att resonera, planera flera steg i följd eller kommunicera smidigt med ”kollegor” saknades. AI-forskaren Stephen Casper kallar AI-agenter ”löjligt överhajpade” den senaste tiden.