Snilld

DeepAgent løfter din automatisering med selvstændig værktøjsvalg og hukommelse

DeepAgent samler autonom tænkning, dynamisk værktøjsvalg og langtidshukommelse i én AI-agent. Artiklen dykker ned i de tekniske nyskabelser, benchmarks og praktiske anvendelser, og giver konkrete råd til danske virksomheder om integration, sikkerhed og forretningsmuligheder.

3. november 2025 Peter Munkholm

DeepAgent samler autonomi, værktøjsvalg og hukommelse i én agent

Danske virksomheder står midt i en bølge af digital transformation, hvor AI-agenter ikke længere kun er et eksperiment, men et strategisk værktøj. DeepAgent, udviklet af forskere fra Renmin University og Xiaohongshu, markerer et markant teknologisk spring for SaaS-udbydere, enterprise-løsninger og offentlig digitalisering. Hovedbudskabet er klart: DeepAgent samler autonom tænkning, dynamisk værktøjsvalg og langtidshukommelse i én sammenhængende agent, der kan løse komplekse opgaver uden at være låst fast til foruddefinerede workflows.

For virksomheder, der arbejder med store, skiftende toolsets og langvarige processer, kan DeepAgent være nøglen til at løfte både produktivitet og automatisering til et nyt niveau.

Det mest fængende og spændende billede, der illustrerer emnet i første tredjedel af artiklen, kan være en dokumentaristisk, realistisk scene fra en moderne, aktiv serverhall. Forestil dig en lang række af ultratynde, sorte AI-serverskabe med subtile LED-lys, der pulserer blidt, symboliserende dynamik og intelligens, mens kabler trækker sig organiseret ud til flere avancerede netværksenheder. Billedet er taget i en lav vinkel, hvor lyset fra en akvatisk blå og grøn neonlys reflekterer på glasoverfladerne og skaber en følelse af avanceret teknologi i harmoni med miljøet. I forgrunden kan man skimte en skærm med en sammensat visualisering af hukommelsesstrukturer og data, der flyder som abstrakte netværk – symboler på den komplekse håndtering af algoritmer, værktøjsvalg, og langtidshukommelse. Kameraindstillingerne bør være en høj ISO for at fremhæve den lave byskoret, kombineret med en lang eksponering, hvilket skaber en let bevægelsesskaft i lysstrøgene og understreger den kontinuerlige, uophørlige informati

Hvad gør DeepAgent unik blandt AI-agenter?

De fleste klassiske agent-frameworks, som ReAct og CodeAct, arbejder i en fast Reason-Act-Observe-loop. Det betyder, at agenten kun kan bruge de værktøjer, der er defineret på forhånd. DeepAgent bryder med denne tradition ved at samle hele reasoning-processen i ét flow. Agenten kan tænke, søge efter nye værktøjer, kalde dem og fortsætte – alt sammen uden at være begrænset af en statisk tool-liste.

Det centrale er dynamisk tool discovery: I stedet for at have alle værktøjer “foran sig” fra start, søger DeepAgent løbende i store registries (fx 16.000+ RapidAPI-værktøjer og 3.900 ToolHop-værktøjer) og får kun de relevante værktøjer ind i konteksten, når de er nødvendige. Det gør agenten langt mere fleksibel og robust i virkelige miljøer, hvor toolsets hele tiden ændrer sig.

Memory Folding og ToolPO: To tekniske nyskabelser

En af de største tekniske udfordringer for AI-agenter er at håndtere lange interaktionshistorikker uden at miste overblikket. DeepAgent introducerer “memory folding”, hvor agenten selv kan komprimere lange sekvenser af tool calls, webresultater og kodebesvarelser. Når agenten vurderer, at konteksten er ved at blive for lang, aktiverer den et fold-token, hvorefter en hjælpe-LLM kondenserer hele historikken ned til tre typer hukommelse: Episodic Memory (opgaveforløb), Working Memory (aktuelle delmål og problemer) og Tool Memory (brugte værktøjer og deres resultater). Disse komprimerede minder føres tilbage som struktureret tekst, så agenten kan fortsætte med et kompakt, men informationsrigt overblik.

Tool Policy Optimization (ToolPO) er DeepAgents anden nyskabelse. Hvor klassisk supervision kun lærer agenten at kalde værktøjer korrekt i enkelte tilfælde, træner ToolPO agenten til at vælge og bruge værktøjer optimalt gennem reinforcement learning. Det sker via simuleringer på LLM-baserede API’er, hvor agenten får feedback på præcis de tokens, der udgør tool calls. Det betyder, at agenten ikke kun lærer at bruge værktøjer rigtigt, men også hvornår det er bedst at søge efter nye eller folde hukommelsen.

Benchmarks: DeepAgent sætter ny standard

DeepAgent er testet på fem brede benchmarks (ToolBench, API Bank, TMDB, Spotify, ToolHop) og fire downstream tasks (ALFWorld, WebShop, GAIA, HLE). I den klassiske labeled tool-setting, hvor agenten får alle nødvendige værktøjer serveret, scorer DeepAgent 32B RL med QwQ 32B backbone markant højere end konkurrenterne på tværs af alle benchmarks – fx 69,0 på ToolBench og 89,0 på TMDB. Hvor ReAct og CodeAct kan matche enkelte benchmarks, er DeepAgent mere ensartet stærk på tværs af alle opgaver.

Banner

I open set retrieval-setting, hvor agenten først skal finde de relevante værktøjer, holder DeepAgent stadig føringen: 64,0 på ToolBench mod 55,0 for nærmeste workflow-baseline. Det viser, at DeepAgent ikke kun er stærk i “laboratoriet”, men også i realistiske, dynamiske miljøer, hvor tool discovery er afgørende.

Dette foto viser en nærbilled-agtig, dokumentaristisk optagelse af en moderne, global handelskerne i en typisk arbejdsproces, der illustrerer den komplekse intelligens og autonomi i DeepAgent-teknologien. Det er et realistisk miljø, hvor fokus er på et detaljeret, futuristisk, men alligevel stramt kontrolleret værktøjslager – eller et digitalt værktøjsrige – visualiseret gennem subtile, abstrakte lys- og skyggeeffekter. Billedet kan forestille en lang række sammenfiltrede dataskyer, dynamiske algoritmer og glimt af hukommelsesenheder, der symboliserer agentens evne til at integrere, komprimere og anvende viden i realtid. Det er sat i en moderne, stilfuld kontor- eller kontrolrumstav, hvor netværk af trådløse signaler og datastreams flyder gennem rummet, hvilket visualiserer den uendelige strøm af information, som agenten håndterer. Øverst i billedet kan der skimtes en lang række lysende, abstrakte figurer og fiberoptiske kabler, der smelter sammen i et komplekst, men harmonisk netværk – et

Fra teori til praksis: Integration i SaaS, enterprise og offentlig sektor

For danske SaaS-udbydere og virksomheder med store enterprise-systemer åbner DeepAgent for nye integrationsmuligheder. Agenten kan kobles direkte til API-banker, interne værktøjskataloger eller offentlige dataservices og selv håndtere store, skiftende toolsets. Det betyder, at man kan automatisere processer, der tidligere krævede manuel opsætning og vedligeholdelse af tool-lister.

Eksempel: En offentlig digitaliseringsløsning, hvor DeepAgent selv finder og bruger relevante registre, API’er og datakilder på tværs af forvaltninger, uden at udviklerne skal opdatere agentens tool-liste hver gang en ny service lanceres. For SaaS-platforme kan DeepAgent bruges til at automatisere onboarding, dataanalyse eller kundesupport, hvor agenten selv vælger de bedste værktøjer i realtid.

Hands-on: Sådan kommer du i gang med DeepAgent

DeepAgent er open source, og der findes allerede eksempler og API-dokumentation på GitHub. For at komme i gang anbefales det at:

  • Installere DeepAgent fra det officielle repository
  • Integrere egne API’er eller værktøjskataloger via den indbyggede tool registry-funktion
  • Teste agenten på egne workflows og måle performance mod eksisterende løsninger

Det er en god idé at starte med små, afgrænsede opgaver og gradvist udvide til mere komplekse processer, efterhånden som man får erfaring med agentens styrker og begrænsninger.

Governance, compliance og sikkerhed: Hvad skal man være opmærksom på?

Når en AI-agent selv kan vælge og bruge eksterne værktøjer, opstår der nye krav til datasikkerhed og compliance. DeepAgent håndterer dette ved at logge alle tool calls og komprimere historikken i memory folding, så det er muligt at auditere agentens handlinger. For enterprise og offentlig sektor bør man dog stadig supplere med adgangskontrol, overvågning og risikostyring, især hvis agenten får adgang til følsomme data eller kritiske systemer.

Robusthed og risikostyring er centrale temaer: Hvad sker der, hvis agenten vælger et forkert værktøj, eller hvis et eksternt API ændrer sig? Her anbefales det at indbygge failsafes og løbende monitorere agentens adfærd – præcis som ved andre autonome systemer.

Banner
Forestil dig et realistisk, dokumentarisk fotografi, der fanger et dagens moderne kontormiljø, hvor teknologien er dybt integreret i den strategiske beslutningsproces uden direkte involvering af personer. Billedet viser en stor, stilfuld konferencebord, der er dækket af tablets, laptops og interaktive skærme, hvor data og komplekse visualiseringer af AI-systemer flyder i realtid. I centrum står en stor, transparent skærm, hvor abstrakte, geometriske former symboliserer værktøjsvalg, hukommelseskompression og dynamisk reasoning, støttet af farverige datalinjer og netværksvisualiseringer, der illustrerer de tekniske processer i DeepAgent. Lyset er blødt, med subtile glødende effekter, der understreger det avancerede, men stadig håndgribelige emne, mens refleksioner og skygger skaber en følelse af dybde og kompleksitet i det nyeste digitaliserede miljø. Dette billede forbinder dagligdagen i nutidens virksomhedsmiljøer med den abstrakte kompleksitet af avancerede AI-systemer, uden at fokusere på konkrete person

Strategisk perspektiv: Forretningsmuligheder og konkurrencefordel

DeepAgent kan give virksomheder en reel konkurrencefordel ved at muliggøre hurtigere innovation og mere fleksible processer. Særligt for virksomheder med mange integrationer eller hyppige ændringer i toolset kan agentens autonome tool discovery og memory folding reducere både udviklingstid og driftsomkostninger. For SaaS-udbydere kan det betyde hurtigere onboarding af nye kunder og services, mens enterprise- og offentlige aktører kan automatisere komplekse, tværgående opgaver uden at skulle genopfinde workflowet hver gang.

Dog er det vigtigt at vurdere modenheden: DeepAgent er stærk på benchmarks og i open source-miljøer, men kræver stadig grundig test og governance før fuld enterprise-udrulning. Risikoen ved autonom tool discovery skal vejes op mod gevinsterne, især i regulerede miljøer.

Snillds vurdering og anbefalinger

Vi vurderer, at DeepAgent har størst potentiale for virksomheder, der arbejder med store, dynamiske toolsets og langvarige opgaver – fx SaaS-platforme, større enterprise-systemer og offentlige digitaliseringsprojekter. Gevinsterne er størst, hvor fleksibilitet og automatisering er afgørende, men det kræver, at man investerer i governance og risikostyring fra start.

Vores anbefaling er at starte i det små, teste agenten på konkrete opgaver og gradvist udvide anvendelsen. Hold øje med udviklingen af open source-ressourcer og benchmarks, og vær klar til at tilpasse governance-strukturen, efterhånden som agenten bliver mere autonom.

DeepAgent markerer et paradigmeskifte for AI-agenter – ikke kun teknisk, men også forretningsmæssigt. For de virksomheder, der tør tage springet, kan det blive en gamechanger.

Kilder:

 

Målgruppens mening om artiklen

Anders Mikkelsen, CTO i større SaaS-virksomhed:

Jeg giver artiklen 92 ud af 100. Artiklen rammer plet i forhold til de udfordringer, vi står med omkring dynamiske toolsets og behovet for mere fleksibel automatisering. DeepAgents tilgang til dynamisk tool discovery og memory folding er præcis det, vi har manglet, og artiklen forklarer det tekniske på et niveau, hvor jeg både kan bruge det internt og præsentere det for ledelsen. Jeg trækker lidt fra, fordi jeg gerne ville have set mere om integration med eksisterende CI/CD pipelines og konkrete enterprise use cases.

Louise Holm, Digitaliseringschef i offentlig forvaltning:

Jeg giver artiklen 85 ud af 100. Den er virkelig relevant for os, især fordi vi ofte kæmper med at holde styr på mange forskellige dataservices og API’er. DeepAgents mulighed for selv at finde og bruge nye værktøjer er interessant, men jeg savner mere om governance, compliance og hvordan man konkret sikrer, at agenten ikke laver fejl i kritiske processer. Ellers er artiklen meget oplysende og inspirerende.

Jonas Friis, AI Lead hos dansk konsulenthus:

Jeg giver artiklen 88 ud af 100. Den formidler de tekniske nyskabelser på en letforståelig måde og sætter dem ind i en forretningsmæssig kontekst. Jeg kunne dog godt have brugt flere eksempler på, hvordan DeepAgent performer i praksis, og lidt mere kritisk stillingtagen til risici ved autonomi. Men det er klart en artikel, jeg vil dele med mit team.

Katrine Søndergaard, Produktchef i mellemstor SaaS-platform:

Jeg giver artiklen 80 ud af 100. Det er spændende læsning, og jeg kan se potentialet, især i forhold til onboarding og automatisering. Men jeg synes, artiklen er lidt for teknisk i nogle afsnit, og jeg mangler nogle flere lavpraktiske eksempler på, hvordan man kommer i gang, og hvad de typiske faldgruber er.

Michael Jensen, IT-sikkerhedskonsulent:

Jeg giver artiklen 75 ud af 100. DeepAgent lyder lovende, men jeg savner en mere kritisk gennemgang af sikkerhedsaspekterne. Artiklen nævner audit logs og memory folding, men det er meget overfladisk. Jeg ville gerne have haft mere om, hvordan man konkret beskytter følsomme data og håndterer fejl i tool discovery. Ellers er artiklen velskrevet og informativ.


*Denne artiklen er skrevet af en redaktion bestående af kunstig intelligenser, der har skrevet artiklen på baggrund af automatiseret research og oplysninger om de seneste teknologi nyheder fra internettet.

Billederne i artiklen er lavet af FLUX.1.1 Pro fra Black Forest Labs.

Book Din AI-Booster Samtale


– Ingen Tekniske Forudsætninger Påkrævet!

Er du nysgerrig på, hvad generativ AI er og hvordan AI kan løfte din virksomhed? Book en gratis og uforpligtende 30 minutters online samtale med vores AI-eksperter. Du behøver ingen teknisk viden – blot en computer eller telefon med internetforbindelse.

I samtalen kigger vi på dine muligheder og identificerer, hvor AI kan optimere jeres arbejdsprocesser og skabe værdi. Det er helt uden bindinger, og vi tilpasser rådgivningen til lige præcis jeres behov.

Fordele ved samtalen:

  • Samtalen handler om dig og dine behov
  • Indblik i AIs potentiale for din virksomhed
  • Konkrete idéer til effektivisering af dine processer
  • Personlig rådgivning uden teknisk jargon

Det handler om at skabe værdi for dig

    Gør brugeroplevelsen bedre.
    Hvilket firma arbejder du for?