Snilld

Ny QueRE metode tager kampen op mod hallucinationer i sprogmodeller og sikrer pålidelighed

QueRE er en ny metode fra Carnegie Mellon, som adresserer udfordringer ved de usynlige dele i neurale netværk i sprogmodeller og tilbyder pålidelig og skalerbar evaluering, der minimerer hallucinationer.

17. januar 2025 Peter Munkholm

Introduktion til sprogmodellers indflydelse

Store sprogmodeller (LLMs) har revolutioneret mange områder indenfor kunstig intelligens ved at demonstrere imponerende evner indenfor naturlig sprogbehandling, beslutningstagning og kreative opgaver. Dog står vi overfor betydelige udfordringer i at forstå og forudsige deres adfærd. Dette problem er blevet mere komplekst, når LLMs betragtes som sorte bokse, hvilket gør det vanskeligt at vurdere deres pålidelighed, især i kritiske kontekster, hvor fejl kan have alvorlige konsekvenser.

 

For at komplementere artiklen om sprogmodellers indflydelse, vil jeg tage et dynamisk billede af en moderne arbejdsstation, hvor en forsker engagerer sig med en stor sprogmodel. Billedet vil fange forskeren i fronten af en computer, mørke skærme, der lyser op i det dunkle rum og viser komplekse grafiske repræsentationer af data og algoritmer. Kompositionen vil inkludere en dybdeskarphed, hvor forskeren er skarpt fokuseret, mens skærmene svømmer i blød bokeh, hvilket symboliserer den udfordrende natur af at navigere i

Begrænsninger ved traditionelle tilgange

Traditionelle metoder afhænger ofte af interne modeltilstande eller gradienter for at fortolke adfærd, men disse er utilgængelige for lukkede modeller baseret på API-adgang. Dette har skabt et behov for nye metoder til effektivt at evaluere LLM-adfærd kun med sort-boks adgang.

 

QueRE: En ny tilgang fra Carnegie Mellon

For at tackle disse udfordringer har forskere ved Carnegie Mellon University udviklet QueRE (Question Representation Elicitation). Dette er en metode designet specielt til sorte-boks LLMs, der ved hjælp af opfølgende prompts omkring modellernes output, udtrækker lavdimensionale, opgave-agnostiske repræsentationer. Disse repræsentationer bruges til at træne prædiktorer af modelpræstationer.

 

Adressering af udfordringer med QueRE

QueRE klarer sig bemærkelsesværdigt godt i forhold til nogle hvid-boks teknikker, når det kommer til pålidelighed og generaliserbarhed. Metoden anvender tilgængelige outputs, såsom top-k sandsynligheder, der er tilgængelige gennem de fleste APIer, og hvor disse ikke er tilgængelige, kan sandsynlighederne estimeres ved sampling.

 

For at komplementere artiklen om sprogmodellers indflydelse, vil jeg tage et dynamisk billede af en moderne arbejdsstation, hvor en forsker engagerer sig dybt i analysen af en stor sprogmodel. Billedet vil centrere om forskeren, der sidder foran en computer med mørke skærme, der giver et blændende lys i det dunkle rum. Skærmene vil vise komplekse grafiske repræsentationer af data og algoritmer, hvilket fremhæver den kreative og tekniske udfordring, der ligger i at forstå

Fordele ved QueRE

En af de store fordele ved QueRE er dens evne til at registrere modeller, der er påvirket på en manipulerende måde, samt skelne mellem forskellige arkitekturer og størrelser, hvilket gør den til et alsidigt værktøj til at forstå og anvende LLMs. Metoden konstruerer featurevektorer fra eliciteringsspørgsmål rettet mod LLMen, der vurderer aspekter såsom tillid og korrekthed.

 

QueREs anvendelsesmuligheder

QueRE tilbyder stærk generalisering på tværs af forskellige opgaver ved at stole på lavdimensionale repræsentationer. Dette sikrer skalerbarhed og reducerer risikoen for overfitting, hvilket gør det til et praktisk værktøj til revision og implementering af LLMs i forskellige applikationer.

 

Eksperimentelle evalueringer af QueRE

Eksperimentelle evalueringer har demonstreret QueREs effektivitet på tværs af flere dimensioner. Indenfor forudsigelse af LLM-præstationer på spørgsmålsbesvarende opgaver har QueRE konsekvent overgået baseline modellerne, der anvendes til sammenligning af performance. Som eksempel opnåede QueRE en AUROC, der oversteg 0,95 på benchmarks som SQuAD og Natural Questions.

AUROC står for Area Under the Receiver Operating Characteristic Curve. Det er en måling, der bruges til at evaluere, hvor godt en model kan skelne mellem korrekte og forkerte svar. En AUROC tæt på 1, som QueRE har (over 0,95), betyder, at systemet er næsten perfekt til at vurdere præcisionen af svar.

SQuAD (Stanford Question Answering Dataset) og Natural Questions er standardtests, der bruges til at evaluere, hvor godt modeller kan besvare spørgsmål baseret på tekst. QueRE har vist sig at være ekstremt præcis på disse benchmarks.

 

For at fange essensen af artiklen om sprogmodellers indflydelse, vil jeg tage et dynamisk billede af en forsker dybt engageret i analysen af en stor sprogmodel. Billedet vil vise forskeren siddende foran en moderne computer, hvor mørke skærme lyser op i et dunkelt rum, med komplekse grafiske data og algoritmer svævende mellem pixels. Kompositionen vil fokusere på en skarphed af forskerens ansigt, mens skærmene vil bløde ind i en bokeh-effekt, hvilket symboliserer den udfordrende natur af at forstå disse

QueREs robusthed og overførbarhed

QueRE har vist sig at være robust og overførbart. Dens features er blevet anvendt med succes på out-of-distribution opgaver og forskellige LLM-konfigurationer, hvilket validerer dens tilpasningsevne.

 

Fremtidsperspektiver for QueRE

I fremtiden kan QueRE måske anvendes på andre modaliteter eller raffineres for øget effektivitet. Dens succes i empiriske evalueringer antyder, at det er et værdifuldt værktøj for forskere og praktikere, der ønsker at forbedre pålideligheden og sikkerheden af LLMs.

 

Snillds holdning

Hos Snilld ser vi QueRE som en nyskabende metode med potentiale til at forbedre vores forståelse og anvendelse af AI-modeller i erhvervssammenhæng. Vi opfordrer til øget brug af sådanne værktøjer, der sikrer større gennemsigtighed og pålidelighed i AI-applikationer.

 

Kilder:

 

Målgruppens mening om artiklen

Henrik Madsen, Chief Information Officer

Artiklen giver en omfattende indsigt i de aktuelle udfordringer og løsninger med store sprogmodeller, som er yderst relevant for mig og mit arbejde i en større virksomhed, der fokuserer på effektivitet og innovation gennem AI. Jeg vil give den en score på 85, da den præsenterer en nyskabende metode som QueRE, der kan være afgørende for vores strategiske implementering af AI-løsninger.

Laura Thomsen, Operation Manager

QueRE-metoden virker lovende for at reducere usikkerhed ved anvendelse af LLMs i vores virksomhed, især når vi står overfor komplekse processer med begrænsede ressourcer. Artiklen er meget informativ og kunne inspirere til nye praksisser i vores arbejdsgange. Jeg vurderer artiklen til 80.

Morten Hansen, IT Specialist

Jeg var imponeret over den tekniske dybde i artiklen, især hvordan QueRE anvender sorte-boks teknikker, hvilket er et område jeg arbejder med personligt. Artiklen er meget oplysende, så jeg vil give den en 88

Anette Larsen, Teknisk Projektleder

Jeg kan se værdien i at forstå sprogmodellers adfærd for bedre projektstyring og risikovurdering, hvilket QueRE ser ud til at tackle effektivt. Så artiklen får en 75 for sin praktiske relevans.

Jørgen Jensen, Digital Transformation Consultant

Artiklen bringer nogle relevante punkter op omkring QueRE og dens kapabiliteter i sorte-boks tagesnapproaches, hvilket er centralt for virksomheder som ønsker at udnytte LLMs fuldt ud. Jeg synes den fortjener en score på 78.

Gennemsnitlig score: 81.









*Denne artiklen er skrevet af en redaktion bestående af kunstig intelligenser, der har skrevet artiklen på baggrund af automatiseret research og oplysninger om de seneste teknologi nyheder fra internettet.

Billederne i artiklen er lavet af Fluxx Schnell fra Black Forest Labs.








Book Din Gratis AI-Samtale






– Ingen Tekniske Forudsætninger Påkrævet!

Er du nysgerrig på, hvad generativ AI er og hvordan AI kan løfte din virksomhed? Book en gratis og uforpligtende 30 minutters online samtale med vores AI-eksperter. Du behøver ingen teknisk viden – blot en computer eller telefon med internetforbindelse.

I samtalen kigger vi på dine muligheder og identificerer, hvor AI kan optimere jeres arbejdsprocesser og skabe værdi. Det er helt uden bindinger, og vi tilpasser rådgivningen til lige præcis jeres behov.

Fordele ved samtalen:

  • Samtalen handler om dig og dine behov
  • Indblik i AI’s potentiale for din virksomhed
  • Konkrete idéer til effektivisering af dine processer
  • Personlig rådgivning uden teknisk jargon

Det handler om at skabe værdi for dig