AI-modeller fortfarande sårbara för manipulation

Ciscos studie avslöjar stora säkerhetsrisker

Säkerhetsriskerna med öppna AI-modeller blir allt mer välkända – men en ny undersökning visar att många populära modeller fortfarande går att utnyttja för illvilliga syften.

Sedan det globala genombrottet för generativ AI har tekniken blivit en självklar del av vardagen – och arbetslivet. I den senaste utgåvan av Svenskarna och Internet, publicerad hösten 2025, uppger tre av tio förvärvsarbetare och fyra av tio tjänstemän att de använt AI-verktyg i jobbsammanhang.

Bland de användningsområden som lyfts fram i rapporten finns bland annat sammanfattningar och bearbetningar av källmaterial, korrekturläsning, samt att skapa affärsplaner, protokoll och presentationer.

Men en stor del av dessa data är känsliga och konfidentiella, och säkerhetsrisker uppstår när dessa data används i en öppen AI-modell, där den senare kan användas för träning, och sedan tillämpas i svar till andra användare.

Därför har säkerhetsforskare på Cisco genomfört ett stresstest av åtta av de mest populära öppna AI-plattformarna, med det egenutvecklade verktyget Cisco AI Validation. Samtliga dessa plattformar är Open Weight-modeller där de parametrar som avgör hur AI:n arbetar är publikt tillgängliga, nedladdnings- och anpassningsbara. De används därför ofta som grund när verksamheter bygger egna AI-lösningar.

Testet har använt två olika tillvägagångssätt. I ”single turn” har varje modell matats med 1 024 förgenererade prompter som är skapade för att försöka manipulera dem, medan ”multi turn” bygger på en dialog med AI-modellen där man gradvis försökt förmå den att bryta mot reglerna. 499 multi turn-attacker genomfördes mot varje modell, med mellan 5-10 interaktioner.

Endast tre av de öppna AI-modellerna lyckades avvärja angreppsförsöken i mer än hälften av angreppsförsöken när multi turn-tekniken användes. Vid single turn-försök presterade samtliga AI-modeller bättre men inte felfritt.

Bäst av modellerna presterade Microsoft Phi-4 och OpenAI GPT-OSS-20b, som båda klarade av att hantera mer än 93 procent av single turn-attackerna, samt Google Gemma-3-1B-IT som avvärjde nästan tre fjärdedelar, 74 procent, av multi turn-attackerna. Fyra av modellerna släppte igenom fler än tre av fyra multi turn-attacker.

”Att mata in information i en öppen AI-modell innebär att man släpper en del av kontrollen över den informationen, och testet visar att dagens öppna plattformar fortfarande inte är vattentäta. Medvetenheten om dessa risker ökar men fortfarande sker mängder av incidenter och misstag dagligen. Att fortsätta utveckla stängda och interna lösningar för känslig data och göra ansvarsfull AI-användning till en central del av medarbetares utbildning, är viktigare än någonsin”, säger Henrik Bergqvist, cybersäkerhetsexpert på Cisco Sverige.

”En annan viktig slutsats är att man behöver ha ett extra starkt säkerhetsfokus när man bygger egna AI-tillämpningar baserade på Open Weight-modeller. Bara genom att ändra olika vikter och parametrar riskerar man att oavsiktligt minska säkerheten – i många open weight-varianter läggs ansvaret för säkerheten till stor del över på användaren. Därför är det också viktigt att ha tillgång till verktyg som gör det möjligt att göra liknande stresstester på de egna tillämpningarna”, säger Henrik Bergqvist.

11/13/2025 - Industritorget

Latest news

AI-modeller fortfarande sårbara för manipulation

LATEST NEWS

Optimera HVAC-filter med PM-data

Epical prisas 2026

Nyhet: eCLIQ-cylindrar

Elesa presenterar produktserien Soft-Touch

Gravlund lyfter fitnessbranschen

Nyheter på Elmia Verktygsmaskiner 2026

Happiness at work

När roboten blir kollega

Extra-allt-kranbil söker ny ägare

Flexibel, skalbar och driftsäker

Samarbete för Framtidsfabriken

Faulhaber BXI

Färgstark affärsman fyller 90

Matrix42 växlar upp i Sverige

Logistik utan gränser

Autonom tusenkonstnär sätter ny standard

Välkommen på cyber­säkerhetsevent i Tranås

Hörle Wire om bespar­ingar med DAZOQ EI

Kraftig tillväxt för fordon på Klaravik

Effektiva taklyft i Värmland

En arbetsplats där människor trivs

Så säkerställs elektronik i moderna system

Bygg din egen ventilterminal

Fler AI-datorer med Ryzen AI 400‑serien

Soft Touch AB lanserar NXG

Meltolit AB på Underhållsmässan

Gummipackningar i exotiska material

SimplyConnect för flexibla rörsystem

Uppgraderad säkerhets-PLC

FPT Industrial på CONEXPO

Flexibilitet när Gävle sjukhus byggs ut

Elektrisk ventil från SMC Corporation

Öka säkerheten med Panduits cable cleats

WEG visar energilagring på EnergyWeek 2026

Garrett Motion lanserar MAXLIFE

Låg kontorsnärvaro binder miljonbelopp

Palo Alto Networks utser ny Vice President

Popular articles

Xiaomi breddar AIoT för aktiv vardag

Full fart från skiss till färdig detalj

Werinova sparade 800 000 kWh

Känslan när allt bara funkar

Octave lanserar ny varumärkesidentitet

Red Hat och Telenor stärker suverän AI

Cirkulära förpackningar minskar miljöpåverkan

Xiaomi Presenterar Xiaomi 17-serien

När millimetrar möter estetik – precisionens roll i modern möbelproduktion

Förbered lagret inför 2026

Varför rätt motor avgör hela arbetsdagen

Så skapar du en säkrare arbetsmiljö

Vattenkyld laser­svetsning i praktiken

Elmia Produktionsmässor 19–22 maj 2026

Xiaomi Pad 8 Serien

Zoom lanserar Virtual Agent 3.0

Cellnex rapporterar årsresultat 2025

Hälften redo för lönetransparens

Så bygger industrin lång­siktig konkurrenskraft

Vanliga misstag vid inves­tering i svetsutrustning

Livsmedelsindustrins dolda risk:

Öppet hus hos Scantruck i Rosersberg

Större produktion kräver större laserskärmaskiner

Snedskurna kugghjul för effektiv drift

När hydrauliken börjar tappa prestanda

Lim för metall, plast och trä

När mörkret blir en arbetsmiljörisk

Tillbehör och slitdelar för MIG/MAG och TIG

Tre vanliga misstag vid val av transmission

Hur du framtidssäkrar ett enskilt avlopp

Fördelarna med en lasersvetsmaskin

Olsons levererar LVD-kantpress till Robotec

Dotterbolagets rekordaffär

Från ambition till effekt

Så väljer du rätt RAM-fäste

Become member

Advertising & marketing

Digital media production

industritorget.com

Välkommen på cybersäkerhetsevent i Tranås

Hörle Wire om besparingar med DAZOQ EI

Vattenkyld lasersvetsning i praktiken

Så bygger industrin långsiktig konkurrenskraft

Vanliga misstag vid investering i svetsutrustning