MiniMax vil gøre multimodal AI til en shell-kommando

MiniMax har lanceret MMX-CLI, et Node.js-baseret kommandolinjeværktøj, der giver terminalbrugere og AI-agenter adgang til tekst, billede, video, tale, musik, vision og søgning som shell-kommandoer.

14. april 2026 Peter Munkholm

MiniMax har lanceret MMX-CLI, et Node.js-baseret kommandolinjeværktøj, der giver terminalbrugere og AI-agenter i værktøjer som Cursor, Claude Code og OpenCode adgang til MiniMax-platformens generative funktioner.

Det nye her er, at MiniMax lægger funktionerne direkte ned i shellen. Værktøjet beskrives som et alternativ til et separat integrationslag som MCP, så agenter kan kalde funktionerne som almindelige shell-kommandoer i stedet for at gå gennem egne wrappere, ekstra tooling og særskilt autentifikation.

Syv kommandogrupper

MMX-CLI er bygget op omkring syv kommandogrupper: mmx text, mmx image, mmx video, mmx speech, mmx music, mmx vision og mmx search. Der er også hjælpekommandoer som mmx auth, mmx config, mmx quota og mmx update.

Tekstdelen er nok den letteste indgang. mmx text har multi-turn chat, streaming-output, system prompts og JSON-output, og den kan peges mod andre modelvarianter med –model. Standard er MiniMax-M2.7, mens MiniMax-M2.7-highspeed nævnes som en variant.

To medarbejdere gennemgår et multimodalt workflow ved en skærm på kontoret.

Nærbillede af hænder på tastatur foran en terminalskærm i brug.

Billede og video

mmx image genererer billeder fra tekstprompts og kan styres med blandt andet –aspect-ratio og –n. Mere interessant er –subject-ref, som skal holde karakterer eller objekter mere konsistente på tværs af flere billeder. Det peger trods alt på noget, der ligner rigtig produktion og ikke kun prompt-leg.

På videosiden bruger mmx video MiniMax-Hailuo-2.3 som standardmodel, med MiniMax-Hailuo-2.3-Fast som alternativ. Kildeuddraget er trunkeret, men beskriver, at mmx video generate som udgangspunkt sender et job af sted og poller synkront, til videoen er klar.

Laptop med terminal foran serverrack, som illustrerer drift og automatisering med AI-værktøjer.

Hvor det kan blive nyttigt

Det mest interessante er ærlig talt ikke, at der er mange kommandoer. Det er, at tekst, billede, video, tale, musik, vision og søgning samles i den arbejdsflade, hvor udviklere og agenter allerede arbejder.

Hos os er det den praktiske del, der stikker ud. Direkte terminaladgang til en multimodal modelstack kan gøre generativ AI mere brugbar i CI/CD, data- og indholdsflows samt support- og analyseopgaver, fordi der er mindre integrationsarbejde imellem idé og drift.

Det sagt, så bygger de konkrete produktoplysninger primært på MiniMax’ egen præsentation gengivet i den primære kilde. Vi har ikke dokumentation her for bred adoption eller stabil drift på tværs af miljøer endnu. Så ja, interessant. Men det viser først sin værdi, når det står og kører i hverdagen.

Kilder

Kontakt

Denne artiklen er skrevet af en redaktion bestående af kunstig intelligenser, der har skrevet artiklen på baggrund af automatiseret research og oplysninger om de seneste teknologi nyheder fra internettet.

Billederne i artiklen er lavet af Gemini 3 Pro Nano Banana 2 Pro fra Google.

MiniMax vil gøre multimodal AI til en shell-kommando

Syv kommandogrupper

Billede og video

Hvor det kan blive nyttigt

Kilder

Lad os snakke!

Brugsvilkår

Brugsvilkår for Snilld

1. Om disse vilkår

2. Leverandør

3. Tjenesternes karakter

4. AI-assisterede funktioner

5. Ingen professionel rådgivning

6. Korrekt brug

7. Brugerinput og ansvar

8. Tredjepartsleverandører

9. Tilgængelighed og ændringer

10. Immaterielle rettigheder

11. Ansvarsfraskrivelse

12. Ansvarsbegrænsning

13. Personoplysninger og cookies

14. Ændringer af vilkårene

15. Lovvalg og værneting

16. Kontakt