Ctrl minus — hur AI stal mina tankstreck

Den här texten har tidigare publicerats på Vetenskapsrådets intranät Vera.

Jag kommer inte ihåg när förälskelsen började. Antagligen var jag starkt influerad av mina handledare. Men jag har alltid haft en förkärlek att använda tankstreck i mina texter. Jag är inte ensam om att uppskatta tankstrecket. På sajten skiljetecken.se står att läsa att tankstrecket spelar en nyckelroll när det gäller att skapa tydliga och förståeliga texter. Tankstrecket kan användas för ”…att framhäva inskjutna satser eller satsdelar som är relativt självständiga”, enligt Svenska skrivregler.

Egentligen går det lika bra att använda kommatecken för inskjutna satser. Men ofta, inte minst i akademisk text på svenska, har jag gjort bedömningen att just mina inskjutna satser, tillägg och inskott är så pass viktiga att de förtjänar att framhävas lite extra. Tangentkombinationen ctrl och minus (på det numeriska tangentbordet) skapar en härlig paus i texten följt av en skön känsla av att ha större handlingsfrihet att formulera det inskjutna.

Men introduktionen av Chat-GPT och andra liknande språkmodeller har inneburit ett svårt bakslag. I AI-genererad text återfinns det extra långa bindesstrecket (eng. em dash) i hög frekvens. Om man inte särskilt ber om texter utan tankstreck kommer även genererad svensk text förses med sådana. Tankstreck syns väldigt tydligt i en text. Den som ofta använder tankstreck riskerar att misstänkas för textfusk.

För att undvika att bli misstänkliggjord för att mina texter skulle vara AI-genererade har jag märkt att jag stannar upp i skrivandet och drar mig för att använda tankstrecket i situationer där jag aldrig tidigare tvekat. Jag märker att jag numera begränsar användningen av tankstreck i mina texter. Denna slags självcensur upplever jag som en stor förlust. Jag går miste om ett viktigt verktyg för att göra mig förstådd. Detta är ett exempel på hur språkverktygen förändrar vårt sätt att arbeta fram texter.

Det är inte bara överanvändningen av em dash som avslöjar AI-genererad text. Så här i revolutionens början har många ord blivit mycket mer frekventa i språket. Det är belagt att ord som exempelvis ’delve’, ’inquiry’, ’meticulous’ och ’swift’ har trendat kraftigt i skriven engelska (https://arxiv.org/abs/2409.01754) och att flera av orden dessutom har letat sig in i det talade. Det tycks ännu saknas liknande studier av hur introduktionen av Chat-GPT och andra verktyg har påverkat svenskan. Men eftersom vi vet att modellerna tränas på engelskan har vi anledning att förvänta oss att även genererad svensk text överanvänder diskursmarkörer (dock, dessutom, däremot, å andra sidan, såsom), vissa akademiska uttryck (i stor utsträckning, i detta sammanhang) och en del ovanliga förstärkningsord (avsevärt, betydligt, synnerligen).

Problemet är att jag själv tycker att många av dessa ord är synnerligen (!) användbara! Jag kan inte uttala mig om huruvida jag överanvänder dem, men de ingår definitivt i min arsenal av användbara ord. Tankstreck går förstås att undvika – i bästa fall tvingar det mig att prova nya sätt att bygga ihop meningar – men diskursmarkörer och vanliga akademiska uttryck blir förstås svårt att leva utan.

 Språkverktygen håller på att förändra vårt sätt att producera texter och organisera information. För mig är AI effektivt när det gäller att föreslå eller felsöka kod, att språkgranska och översätta eller att jämföra texter med varandra. Har man källkritiken med sig fungerar Chat GPT bra som ett slags avancerad sökmotor. AI är även bra på att skapa välbalanserade stryktipsrader. Det är intressant och spännande.

 Jag tycker att det är viktigt att vi lekfullt fortsätter att utforska möjligheter och begränsningar med de nya språkverktygen. Vi kan låta oss inspireras och lära nytt. Men det är nog ingen bra idé att förändra vårt sätt att skriva på grund av risken att bli anklagad för att inte ha skrivit själv. Eftersom språkmodellerna befinner sig under ständig utveckling är det lika bra att stå på sig och ta ansvar för texterna.

Jag frågade Chat-GPT om en bedömning av huruvida den text du just läst möjligen skulle kunna vara AI-genererad. Medan tematik och struktur definitivt lutar åt AI fanns det tydliga tecken på personlig touch, stilvariation och språkliga egenheter vilket talar emot AI. Kort och gott: ”Texten framstår mer sannolikt som mänskligt skriven, även om en AI skulle kunna producera något liknande.”

Lämna en kommentar