ChatGPT går från chatbot till AI-assistent

För två veckor sedan publicerade Microsoft-backade OpenAI en bloggpost där de presenterade en mängd uppdateringar av hajpade ChatGPT. Den tidigare “chatboten” lanseras nu istället som en assistent som inte bara kan förstå och skapa text, utan som också kan se, höra, tala och hjälpa dig generera bilder med nya DALL-E 3. ChatGPT får också ytterligare en efterlängtad uppdatering - tillgång till internet. Här sammanfattar vi några av höjdpunkterna från OpenAIs senaste våg av lanseringar.
‍‍‍

1. ChatGPT kan se, höra och tala

ChatGPT utrustas nu med bild- och ljudfunktioner som gör att du inte längre är begränsad till att interagera med ChatGPT genom text. Med ljudfunktionerna kan du som användare ge ChatGPT instruktioner genom att prata till den och få svar i ljudform. Du har även möjligheten att välja mellan fem olika röster för din assistent.

Exempelvis kommer du kunna be ChatGPT berätta om de senaste trenderna på elbilsmarknaden medan du promenerar till jobbet, eller få hjälp med att läsa en godnattsaga för ditt barn när fantasin tryter. Funktionerna bygger bland annat på OpenAIs röstigenkänningssystem - Whisper - som lanserades i september 2022.

ChatGPT förses även med bildförståelse, vilket innebär att du kommer kunna använda bilder som input. Exempelvis kommer du kunna ta en bild på din kyl och skafferi, ge bilderna till ChatGPT, och få ut ett recept utifrån dina ingredienser. Bildfunktionerna kommer även vara användbara i arbetslivet där ChatGPT skulle kunna hjälpa dig att analysera en bild med komplexa grafer.

ChatGPTs nya ljud- och bildfunktioner rullas ut till användare successivt. Ljudfunktionerna finns redan tillgängliga för ChatGPT Plus och Enterprise-användare för iOS och Android. Även bildfunktionerna kommer att lanseras för ChatGPT Plus och Enterprise-användare på alla plattformar.

‍

2. Åtkomst till internet (igen)

OpenAI gick även ut med att ChatGPT får åtkomst till internet via Bing, igen. “We are so back” skriver OpenAIs VD, Sam Altman på plattformen X, f.d. Twitter, när nyheten lanserades. För ChatGPT Plus och Enterprise-användare lanserades browsing-funktionen redan i våras, men funktionen drogs tillbaka eftersom den kunde användas för att kringgå betalväggar.

Att ChatGPT nu har tillgång till internet gör att användaren kan få hjälp med alltifrån att sammanfatta aktuella nyheter till att hitta det bästa erbjudandet på en Apple Watch. Användaren kan även se källan som ChatGPT hämtat informationen från - ytterligare en efterlängtad funktion.

Enligt OpenAI kommer samtliga användare att få tillgång till browsing-funktionen inom kort, men just nu är funktionen enbart tillgänglig för ChatGPT Plus och Enterprise-användare. För att få tillgång till browsing-funktionen väljer du “Browse with Bing” under “GPT-4” i chattfönstret i ChatGPT.
‍

‍

3. DALL-E 3 💜 ChatGPT

OpenAIs text-till-bild-verktyg, DALL-E 2, får en uppdatering och blir DALL-E 3. Första versionen av DALL-E lanserades i januari 2021, och version 2 släpptes i september 2022. Ett år senare släpps nu alltså DALL-E 3, som ska vara avsevärt mycket bättre än sin föregångare på att förstå kontext, nyanser och detaljer, vilket ska göra det lättare att skapa bilder som motsvarar din textinput (s.k. prompt). DALL-E 3 är också bättre än sin föregångare på att generera text i bilder (se exempel nedan).

DALL-E 3 ska också utrustas med fler säkerhetsbegränsningar för att förhindra användare från att generera olämpliga eller hatiska bilder. Dessutom ska DALL-E 3 inte heller kunna skapa bilder av offentliga personer baserat på deras namn, eller skapa bilder som imiterar levande konstnärer, till skillnad DALL-E 2 som kan generera bilder “in the style of Banksy” eller annan valfri konstnär.

DALL-E 3 ska dessutom integreras mot ChatGPT. Användaren ska kunna ta hjälp av ChatGPT för att skriva den perfekta prompten till DALL-E 3, ChatGPT blir alltså din nya “prompting partner” för att du ska slippa lära dig s.k. Prompt Engineering. Om bilden du genererat inte blir som du tänkt kan du även justera bilden genom textinput, tack vare ChatGPT.

Den nya versionen av DALL-E är redan tillgänglig i Bing för Bing Chat- och Bing Image Creator-användare. Den kommer också att bli tillgänglig för ChatGPT Plus och Enterprise-användare i oktober.

‍

En av bilderna som OpenAI publicerade i samband med lanseringen av DALL-E 3

‍

Från chatbot till assistent‍

De nya uppdateringarna till ChatGPT gör att du som användare kan interagera med den på allt fler sätt, en utveckling som gör det tydligt att ChatGPT tar ett stort kliv bort från att vara en chatbot, mot att bli en multifacetterad assistent. Med de nya ljudfunktionerna har ChatGPT dessutom, på mindre än ett år, blivit en seriös utmanare till Siri, Alexa och Google Assistant - en utveckling som få såg komma.

Vad ska då du som professionell användare av ChatGPT, och beslutsfattare i en organisation, ta med dig från OpenAIs lanseringsrace? Förutom att ChatGPT breddar sina applikationsområden och kan effektivisera ditt dagliga arbete på individnivå på allt fler sätt, så öppnar de nya funktionerna dörrarna för förändringar på organisationsnivå.

Kanske har ditt företag utmaningar som kräver en lösning som både bygger på text-, ljud- och bildförståelse? För att automatisera ert kundsupportflöde kanske ni behöver ett system som både kan förstå text, men som också kan titta på och analysera bilder. I så fall kan det vara värt att se över hur ChatGPT med dess nya funktioner kan användas i er verksamhet. ‍

‍

Fler nyheter att vänta

Följ Violet på LinkedIn för att hålla dig uppdaterad om nyheter inom AI.
‍

Uppdaterade ChatGPT ger dig helt nya möjligheter

1. ChatGPT kan se, höra och tala

2. Åtkomst till internet (igen)

3. DALL-E 3 💜 ChatGPT

Från chatbot till assistent‍

Fler nyheter att vänta

Om Violet AI