Pang! För typ två år sedan gick startskottet för AI-racet. Open AI var först ut med att ta framtiden till nuet, genom att paketera den artificiella intelligensen till en assistent för ett modernt mänskligt liv. Någon som kan svara på frågor, skriva tal, planera möten och sätta veckans matsedel. Sedan dess har Microsoft och Google och en rad mycket mindre aktörer slipat på sina ChatGPT-rivaler. Men vilken AI-bot är egentligen bäst?
WSJ bestämde sig för att gå till botten med den frågan och har testar fem AI-bottar för att komma fram till svaret: Open AI:s ChatGPT, Anthropics Claude, Microsofts Copilot, Googles Gemini och Perplexity, doldisbolaget i sammanhanget som grundades 2022 av tidigare Meta- och Open AI-ingenjörer.
Innan vi får reda på svaret – och vad chatbottarna klarar och inte klarar av – så kan det passa att slänga in en brasklapp. Det gör även WSJ. Det går snabbt i AI-racet så testresultatet ger en ögonblicksbild över läget nu. Open AI släppte till exempel en uppdatering av ChatGPT under testets gång, vilket påverkade resultatet.
Så till testet. WSJ testade chatbottarna på åtta områden, allt från hälsoråd och matlagning till hur det bra de är på jobbuppgifter, kreativt skrivande, nyhetskoll och kodning.
En insikt som WSJ kom fram till under testets gång är att det var överraskande få ”hallucinationer” från AI-bottarna, överraskande få uppenbara snedsteg. Alla bottar hade liksom sina styrkor och svagheter.
Den ännu större överraskningen är vinnaren av hela testet. ChatGPT, som lett hela AI-racet, kom inte ut som den solklara vinnaren. Istället var det Perplexity som skrällde och knep guldmedaljen.
ChatGPT var däremot bäst på en rad områden som hälsa, matlagning och snabbhet. Botten var samtidigt sämst i klassen på kreativt skrivande.
Perplexity var vassast på att summera, hålla koll på nyheter och att koda.
Jumboplatsen fick Microsofts Copilot. Googles Gemini och Antropics Claude kom på tredje respektive fjärde plats.
Vill du vara först med det senaste? Ladda ner Breakits app här och aktivera pushar – då missar du aldrig en viktig nyhet.