Snilld

MiniMax vil gøre multimodal AI til en shell-kommando

MiniMax har lanceret MMX-CLI, et Node.js-baseret kommandolinjeværktøj, der giver terminalbrugere og AI-agenter adgang til tekst, billede, video, tale, musik, vision og søgning som shell-kommandoer.

14. april 2026 Peter Munkholm

MiniMax har lanceret MMX-CLI, et Node.js-baseret kommandolinjeværktøj, der giver terminalbrugere og AI-agenter i værktøjer som Cursor, Claude Code og OpenCode adgang til MiniMax-platformens generative funktioner.

Det nye her er, at MiniMax lægger funktionerne direkte ned i shellen. Værktøjet beskrives som et alternativ til et separat integrationslag som MCP, så agenter kan kalde funktionerne som almindelige shell-kommandoer i stedet for at gå gennem egne wrappere, ekstra tooling og særskilt autentifikation.

Banner

Syv kommandogrupper

MMX-CLI er bygget op omkring syv kommandogrupper: mmx text, mmx image, mmx video, mmx speech, mmx music, mmx vision og mmx search. Der er også hjælpekommandoer som mmx auth, mmx config, mmx quota og mmx update.

Tekstdelen er nok den letteste indgang. mmx text har multi-turn chat, streaming-output, system prompts og JSON-output, og den kan peges mod andre modelvarianter med –model. Standard er MiniMax-M2.7, mens MiniMax-M2.7-highspeed nævnes som en variant.

To medarbejdere gennemgår et multimodalt workflow ved en skærm på kontoret.
Nærbillede af hænder på tastatur foran en terminalskærm i brug.

Billede og video

mmx image genererer billeder fra tekstprompts og kan styres med blandt andet –aspect-ratio og –n. Mere interessant er –subject-ref, som skal holde karakterer eller objekter mere konsistente på tværs af flere billeder. Det peger trods alt på noget, der ligner rigtig produktion og ikke kun prompt-leg.

Banner

På videosiden bruger mmx video MiniMax-Hailuo-2.3 som standardmodel, med MiniMax-Hailuo-2.3-Fast som alternativ. Kildeuddraget er trunkeret, men beskriver, at mmx video generate som udgangspunkt sender et job af sted og poller synkront, til videoen er klar.

Laptop med terminal foran serverrack, som illustrerer drift og automatisering med AI-værktøjer.

Hvor det kan blive nyttigt

Det mest interessante er ærlig talt ikke, at der er mange kommandoer. Det er, at tekst, billede, video, tale, musik, vision og søgning samles i den arbejdsflade, hvor udviklere og agenter allerede arbejder.

Hos os er det den praktiske del, der stikker ud. Direkte terminaladgang til en multimodal modelstack kan gøre generativ AI mere brugbar i CI/CD, data- og indholdsflows samt support- og analyseopgaver, fordi der er mindre integrationsarbejde imellem idé og drift.

Det sagt, så bygger de konkrete produktoplysninger primært på MiniMax’ egen præsentation gengivet i den primære kilde. Vi har ikke dokumentation her for bred adoption eller stabil drift på tværs af miljøer endnu. Så ja, interessant. Men det viser først sin værdi, når det står og kører i hverdagen.

Kilder

    Gør brugeroplevelsen bedre.
    Hvilket firma arbejder du for?