Vidensartikler

Kan Google detektere dine AI tekster?

Kan Google se om dit content er skrevet af ChatGPT? Læs her om hvordan du kan sikre dig dit AI content opnår den højeste SEO-værdi med fine-tuning...


Introduktion til AI tekster.

Tekst genereret med AI er i stigende grad brugt af webshops til at øge online tilstedeværelse, drive organisik traffik (Specielt fra Google) og spare effektiv tid på tekstproduktion. Derfor har vi blandt andet set brugen af ChatGPT ekslpodere og efterspørgslen af videre integration af GPT-3 ind i CMS og webshopssystemer, ser vi værende eksponentielt stigende. Men... som AI tekst generering er blevet populært og let tilgængeligt har Google selvføglelig også været nødt til at tage stilling til AI content og hvordan det skal rangeres i deres søgemaskine. Trods alt, er der intet som forhindrer nogen i at generer hundredevis af artikler med ChatGPT, som muligvis indeholder misinformation. En af deres seneste udmelding kom fra højtstående medarbejder Danny Sullivan: 

Danny Sullivan's We haven't said AI content is bad

Hvordan kan AI skrive tekster? 

AI-sprogmodeller, som GPT3 - den ChatGPT er bygget på - er trænet på gigantiske datasæt fra forskellige offentlige databaser. GPT3 er fx. trænet på wikipedia, reddit, nyhedssider som CNN & Bloomberg og meget andet. Det er her, fra datasættet,  sprogmodeller baserer deres viden på.  

Men det mest imponerende ved de førende sprogmodeller idag, er deres evne til at formulerer sig. Baseret på dens datasæt giver modellen mulighed for at lære de mønstre og strukturer, der er til stede i det menneskelige sprog og at forstå, hvordan ord og sætninger er forbundet i sammenhængende tekst.

Når modellen skal generere en tekst eller en artikel, starter den med en seed-tekst eller et emne, som brugeren har givet som input. Modellen bruger derefter sin træning til at forudsige, hvilke ord og sætninger der ville følge naturligt i den kontekst.

Modellen bruger en teknik, der kaldes autoregressiv generering, som betyder, at den genererer ét ord eller sætning ad gangen baseret på tidligere ord og sætninger. For eksempel kan modellen, når den genererer en artikel om fugle, begynde med at producere et startafsnit om fugle, som giver en overordnet introduktion. Derefter kan modellen fortsætte med at producere afsnit om forskellige typer af fugle, deres livsstil og deres levesteder, og så videre. 

Intelligent Text Generation in Businesses

Hvordan detektere man AI tekster?

Ligesom måden AI kan skrive tekst - ved genskabelse af mønstre og strukturer - så kan tekststykker på samme måde også kategoriseres som AI skabte hvis de følger specifikke mønstre. Hvilket er hvorfor, der også findes detektionsalgoritmer der ville kunne genkende nogle AI skabte tekster. Men... som AI genereret tekster bliver bedre og bedre, bliver det selvfølgelig sværre og sværre.

Idag er det dog et hav af modsvar af detektionsværktøjer til den stigende popularitet, af AI skabte tekster. Et eksempel oppe i tiden er GPTZero, som blev udviklet i Januar 2023. En app udviklet af Edward Tian, en studerende fra Princeton Universitet, til at identificere tekster skrevet af ChatGPT. Primært som et svar mod studerendes brug af ChatGPT i skoleopgaver. 

GPTZero anvender "perplexity" og "burstiness" til at bestemme, om tekst er genereret med hjælp fra ChatGPT. Perpexity, (forvirring) er hvor tilfældig teksten er i en sætning, og om måden en sætning er konstrueret på, er usædvanlig eller overraskende for appen. Burstiness (eksplosivitet) sammenligner disse sætninger med hinanden og bestemmer deres ensartethed. Dette er nyttigt, fordi menneskeskabt tekst har mere "burstiness", da vi har en tendens til at skrive med mere sætningsvariation.

Tilfældigheden af ord og ensartethed af sætnigner kan derfor, efter sigende, afmaskererer AI skabte tekststykker. Det skal selvfølgelig testes.

Tekststykket ("GPTZero anvender "perplexity" og "burstiness") var skrevet med ChatGPT. Beklager meget, men uden at overraske nogen, er vi her hos Straact specielt glade for AI værktøjer - Practice what you preach! Men for at afslutte eskperimentet så kan GPTZero IKKE detektere vores tekst som AI skrevet. 1-0 til ChatGPT!

 

 

Hvad siger Google til AI tekster?

Der er ingen tvivl om at Google bruger et hav af teknikker og værktøjer til at filtrere og klassificerere indhold. Historisk set har Google for eksempel brugt NDD (near-duplicate detection) algoritmer, til at analysere hvor mange gentagelser indgik i et stykke tekst. Noget som de intoducerede i 2007, og stadig bruger idag til at spotte duplicate content. Men  Google er dog ikke just altid specielt informative om hvilke værktøjer de bruger, hvilket er hvorfor SEO-specialister oftest må gå ud fra de overordnede tanker og udmeldinger Google kommer med. 

I løbet af 2022 har Google være tvunget til at skulle tage stilling til AI genereret content eftersom det er blevet så let tilgængeligt via GPT3 og ChatGPT. Som nævnt, er de kommet frem til at så længe content er lavet til mennesker, og ikke blot for at rangere højt seo-mæssigt, er Google ligeglade med hvor det kommer fra. Menneske eller maskine.

Dette giver de også udtryk for i deres spampolitik hvor de specifikt skriver AI content "without regard for quality or user experience" anses som spam. Google er derfor ikke imod AI content, men opfordrer til at der altid skal menneskeøjne på til gennemlæsning og tilpasning, samtidig med at indholdet skal være skabt til dine hjemmesidebesøgende. 

Kan Google detektere AI content idag? 

Der er ingen tvivl om at Google ville kunne udvikle algorimter der kunne detektere direkte copy-paste content, fra udbredte standardiserede ChatGPT, Jasper osv. Alt andet vil være naivt at tro. De er trodsalt en af de mest ressourcestærke virksomheder, globalt set, og har lønningerne samt innovationsniveau til at holde på de klogeste hoveder indenfor AI. 

Dermed sagt, er der intet der tyder på at Google, ligenu, har implementeret detektionsalgoritmer til fx. ChatGPT i endnu. Vi ser ihvertfald ofte successhistorier med højtrangeret sider der er lavet udelukkende med AI. Men store udviklingsprojekter, som udrulningen af en sådan detektionsalgoritme, ville tage måneder at planlægge, koordinere, bygge, teste og revidere for at sikre, at alt går efter planen.

Store opdateringer udrulles ofte i bidder for at lære, hvordan de påvirker en stor mængde mennesker, enten positivt eller negativt. Der er oftest et mønster i Google-opdateringer, hvor kun en meget lille procentdel af websider,  bliver påvirket i høj grad (positivt eller negativt) af Googles ændringer, nogle ser en mærkbar effekt, og de fleste ser lille til ingen effekt. Opdateringer rulles ud i grupper og forbedres over tid.

Med tiden, er der dog ingen tvivl om at Google vil kunne filtrere efter hvad der er direkte copy-paste content som tydeligt ikke er skrevet med mennesket i fokus. Men, der er intet der tyder på dette er sket endnu. 

Hvordan kan du sikre at dit AI content  holder sig indenfor Googles retningslinjer?

Ingen af os kan se spå hvad frmetiden bringer. Så det første tip, vil selvfølgelig være at holde dig opdateret på Googles opdateringer og specielt deres guidelines omkring spam-content. For nuværende, betyder det at du altid bør kigge AI content igennem før, det udgives. Samtidig skal du selvfølgelgi også skrive content TIL dine seere og ikke kun ud fra højt rangerede keywords.

Jeg ville ikke anbefale at bruge disse detektionsværktøjer som findes derude - såsom GPTZero eller GLTR. Det giver selvføgelig en fin indikation om hvorvidt et stykke tekst er AI produceret eller ej. Men det er værktøjer designet til at detektere hvorvidt skoleopgaver er skrevet med AI. De ville ikke være i nærheden af noget så avanceret, som hvad Google ville kunne udvikle. Så lad vær med at regne med sådanne værktøjer som sandheden. 

Der findes dog løsnigner hvor man kan udnytte det smarte i automatisk genereret content uden at skulle bekymrer sig om Googles fremtidige opdateringer om spam-content. Nemlig fine-tunede modeller. 

Fine-tuning betyder at du træner en AI model på et nyt datasæt til at løse specifikke opgaver. Som kun at skrive FAQ'er, produktbeskrivelser, meta-beskrivelser eller andet. Her er det muligt at træne på eget data - så hvis du er en webshop med en masse gode produkttekster - har du mulighed for at træne en AI model på lige netop de tekster.

Men hvorfor bruge kræfter på det? 

Jo, hvis vi kigger på Googles guidelines/opfordringer om at skrive content af kvalitet der er skrevet TIL dine hjemmesidebesøgende, så giver det god mening. Som virksomhed, har du en helt specifik viden om hvordan du bedst tiltalter din målgruppe i dit content. I en fine-tuned model, kan dette føres med over, samme sprogbrug, struktur, fagtermer og alt det der er vigtigt for nuværende samt potentielle kunder at høre.  BUM.. Så har du en AI model, der skriver "til dine hjemmesidebesøgende". 

Det næste spørgsmål bliver så om det stadig er content af kvalitet. For som nævnt, er det alfa-omega i Googles guidelines. Hvis man tager udgangspunkt i GPT3, så er der intet der tyder på kvaliteten bliver forringet af at fine-tune en model på eget data. Tværtimod. 

Flere studier peger på at i jo større grad AI modeller er specialiseret til at løse en specifik opgave, jo bedre performer den - i kvaliteten af dens output.

Dette er eksempelvis illsutrereret godt, i følgende test hvor GPT3 er trænet til at løse regnestykker på udskolingsniveau. Her stiger performance betydeligt, ved den fine-tunede model. Se nedenstående. 

For at tage bedst mulig hånd om Googles guidelines, i dit AI content, er det derfor i stigende grad anbefalet at lave sine egne fine-tunede løsninger - på eget data. Så er man sikker på at content bliver skrevet med kunden i fokus og kvaliteten er den ypperste.

Konklusion - Kan Google detektere dine AI tekster?

Google kommer uden tvivl til at udvikle værktøjer til at identificere og nedrangere 100% AI genereret, upersonligt indhold, som ikke har brugeren i fokus. Det kommer til at være langt mere komplekst og avanceret end de detektionsværktøjer du kan finde online nu. Dog, er Google ikke imod AI genereret content, så længe det har brugeren/mennesket i fokus. Så, der er ingen grund til at trædde på bremsen og lade sig fuldstændig afskræffe fra at udnytte potentialet AI content bringer.  

Hvis du er en virksomhed/webshop som gerne vil effektiviserer den process der ligger i at skrive tekst til din forretning, er der ingen tvivl om at AI ville kunne være et klædeligt supplement. Specielt custom (fine-tunede) modeller, som er trænet på eget data. 

Så spiller du dig ihvertfald bedst ind i Googles univers og de retnignslinjer de opfordrer hjemmesider til at arbejde efter.

 

Udforsk mulighederne 🚀

Få en uforpligtende sparringssession om hvorvidt en custom AI model passer til jeres forretning. 

 

Similar posts