torsdag 18. april 2024

Hvorfor har kundeservicen blitt så dårlig?

Det fremstår som et paradoks at til tross for fremskritt innen kunstig intelligens (AI), opplever mange en forverring i kundeservice.

I takt med utviklingen innen kunstig intelligens (AI) og generativ AI (GenAI) opplever vi et paradoks innenfor kundeservice og forretningsdrift. Mens disse teknologiene betraktelig øker effektivitet og produktivitet, avdekker de samtidig utfordringer ved å bevare menneskelige kontaktpunkter og sikre kundetilfredshet. Hvorfor opplever vi at kundeservicen har forverret seg med AI?

AI og GenAI har utvilsomt forbedret effektiviteten, noe som muliggjør at bedrifter kan oppnå mer med færre ressurser. Likevel har overgangen til automatiserte verktøy, som chatbots, ofte medført en reduksjon av den personlige servicen og dermed kvaliteten på kundeservice. Denne nedgangen kan delvis forklares med teknologiens begrensninger, kundenes forventninger, dårligere kvalitet, og økende kompleksitet i tilbudte produkter og tjenester.

Erik Brynjolfsson, professor ved Stanford, påpeker viktigheten av å investere i opplæring av ansatte fremfor å redusere antallet, for å maksimere fordelene med AI i kundeservice. Hans forskning viser at kundene og de ansatte blir mer fornøyde når de ansatte får støtte av teknologien. Dette fremhever behovet for en balanse mellom teknologisk innovasjon og menneskelig dyktighet og empati.

Til tross for at automatiserte tjenester blir stadig mer avanserte, klarer de ikke å innfri de voksende og komplekse forventningene til kundene. Dette gapet kan lede til kundemisnøye og sterke kundereaksjoner på sosiale medier. For å løse disse utfordringene, er det viktig å kombinere AI-teknologi med dypere kundeinnsikt og menneskelig tilstedeværelse. Dette innebærer integrering av AI-systemer med teknikker som naturlig språkforståelse og maskinlæring for å forbedre forståelsen og forutsigelsen av kundenes behov.

Man trenger ikke være rakettforsker for å skjønne viktigheten av kompetente service-medarbeidere, spesielt når noe går galt. Mens automatiserte systemer effektivt kan avlaste enkle oppgaver, er menneskelig tilstedeværelse avgjørende for å løse mer komplekse utfordringer. Med en aldrende befolkning, styrkes dette poenget.

For å finne ut av de økende utfordringene innen kundeservice, må man forene teknologi og menneskelig innsikt. Dette starter med utvikling og implementering av teknologiske løsninger med kunden i fokus, slik at man kan forutse og forebygge utfordringer ved de ulike kontaktpunktene i bedriftens organisasjon. Gjennom analyser av hvordan kundene opplever de ulike kontaktpunktene, kan bedrifter fjerne mye og mange av årsakene til at kundene har behov for å kontakte kundeservice.

Samtidig er det viktig å investere i ansattes utvikling, med fokus på ferdigheter som empatisk kommunikasjon og problemløsning med støtte av teknologien. Dette forbedrer kundeservicen og skaper et arbeidsmiljø der ansatte føler seg verdsatt.

Til slutt, for å løfte kapasiteten og kvaliteten i kundeservicen, må bedrifter se på teknologi og menneskelig service som deler av et samlet system. Å utvikle varer og tjenester av høy kvalitet, som i seg selv minimerer behovet for kundeservice, kan ofte være den beste strategien.


søndag 14. april 2024

Defining and implementing the Chief AI Officer Role


As artificial intelligence (AI) becomes increasingly integral to business success, the need for a dedicated executive to oversee both strategic and operational aspects of AI implementation has become evident. 

This has led to the emergence of the Chief AI Officer (CAIO), a role rapidly gaining prominence in forward-thinking companies, says The Financial Times.

The CAIO's mandate extends beyond technology management to include developing and executing the organization's AI strategy in alignment with its broader business objectives. Responsibilities include identifying high-impact use cases, prioritizing AI initiatives, and devising a roadmap for AI adoption and scalability. 

Importantly, the CAIO is also responsible for establishing robust AI governance frameworks. This entails addressing crucial issues such as data privacy, to protect customer information; algorithmic bias, to ensure fairness; and AI safety, to prevent unintended consequences of AI deployment.

Beyond strategy and governance, the CAIO is expected to drive AI-powered innovation. They must explore new products, services, and business models that leverage AI to provide a competitive edge in the market.

Equally crucial is the CAIO's role in building and leading a talented team of AI experts, including data scientists, machine learning engineers, and AI ethicists. Cultivating the right capabilities is essential for successfully implementing and scaling AI initiatives.

The CAIO's effectiveness hinges on collaboration with other C-suite members. For instance, working with the CIO ensures AI systems integrate smoothly with existing IT infrastructure, while alignment with the CFO is necessary for securing funds for AI initiatives. Collaboration with the Chief Human Resources Officer (CHRO) is vital for addressing workforce implications of AI, such as reskilling, and working with the CMO enables leveraging AI for deeper customer insights and marketing strategies.

The CAIO's engagement with the CHRO is crucial, as they must address the workforce-related implications of AI, such as reskilling employees and managing the human-AI interaction.

Furthermore, the CAIO must collaborate with the Chief Marketing Officer (CMO) to leverage AI for enhanced customer insights, personalized experiences, and targeted marketing strategies.

The CAIO's focus varies by industry. In a manufacturing setting, the CAIO may focus more on using AI for process optimization, predictive maintenance, quality control, and supply chain management. Conversely, in a service-based organization, the CAIO is likely to prioritize enhancing the customer experience, streamlining operational efficiency, and leveraging AI-driven predictive analytics. Regardless, a deep understanding of the business and its challenges is crucial for leveraging AI strategically.

As businesses increasingly leverage the transformative power of AI, the CAIO emerges as a pivotal figure. By strategically defining and implementing this role, organizations can unlock AI's full potential to drive innovation, operational efficiency, and a competitive edge.


torsdag 11. april 2024

Hvorfor sosiale medier er en søppelplass.

Publisert som debattinnlegg i DN 12 april 24.

Det Elon Musk sa om plattformen X i samtalen med Nicoali Tangen 9 april, fikk DN kommentator Terje Erikstad til å kalle ikke-redaktørstyrte sosiale medier for en søppelplass. Bedre kan det ikke sies.

I sitt forsøk på å reformere Twitter, nå X, som et fritt taleforum, sa Elon Musk til Nicolai Tangen at han etterstreber en åpen ideutvekslingsplattform. Dessverre gjør han det motsatt. 

Musk har for eksempel fjernet tiltak for å redusere hatprat, redusert overvåking av falske konti, tatt tilbake utestengte ekstremister, suspendert journalister, og saksøkt nonprofit-organisasjoner for å dempe kritikk. Alt under ytringsfrihetens navn.


For å gi DN kommentator Erikstad sin «søppel-kommentar» 10. april en bakgrunn, kan vi vende oss til de "Fire mørke lovene for online engasjement", utviklet av professor Jay Van Bavel ved New York University, og som Max Fisher detaljert illustrerer i boken "The Chaos Machine".

De mørke lovene, som er dypt forankret i menneskets psykologi og hvordan algoritmene er optimalisert i sosiale medier, har fire elementer. For det første bidrar menneskers tendens til å fokusere på negative nyheter til en strøm av sensasjonelle overskrifter og alarmerende innhold som forvrenger vår virkelighetsoppfatning og skaper et pessimistisk verdenssyn. For det andre er algoritmer på sosiale medier optimalisert for å forsterke polariserende innhold. Dette skaper engasjement og et miljø der ekstreme meninger trives, og de mer moderate stemmene ofte drukner. For det tredje forsterker plattformene tribalistiske tendenser ved å spre feilinformasjon og føre til radikalisering, noe som øker den sosiale splittelsen. Til slutt vil innhold som vekker sterke følelser og moralistisk språkbruk bli spredt viralt, noe som kan brukes både til å mobilisere til positive endringer og til manipulasjon og polarisering.

Disse prinsippene er de sosiale medienes mørke sider. Mens samfunn, ifølge Max Fisher, lider, har verken Meta, X, eller YouTube vist vilje eller sympati for dette. For å bekjempe de negative effektene og fremme et mer konstruktivt digitalt landskap, må vi gå utover algoritmejusteringer. Det kreves en kollektiv innsats for å øke bevisstheten om disse underliggende mekanismene, fremme kritisk tenkning, og utvikle plattformer som tar ansvar for å fremme et sunt og inkluderende digitalt samfunn. Nå er det fritt frem.

Lovgivere, eiere, plattformdesignere, og brukere må alle ta ansvar i denne transformasjonen. Ved å innføre reguleringer som fremmer transparens rundt algoritmer, kan lovgivere bidra til å dempe spredningen av skadelig innhold. 

Plattformdesignere må prioritere etikk like høyt som engasjement, mens brukere må praktisere kritisk tenkning og støtte ansvarlige plattformer. Sosiale medier har potensialet til å være en kraft for det gode, men for å realisere dette potensialet må vi alle være bevisste på de mørke skyggene. At X mister annonsører og brukere, tyder på at mange opplever X som en søppelplass.


Er Boble en plagiering av Stratos?

Aftenposten rapporterer i to oppslag 11 april og 19 april om en kollisjon mellom Nidar og Freia over sistnevntes relanserte produkt Boble. Saken handler ikke om sjokoladelikhet, men om emballasjen er en plagiering av Stratos. Har Nidar et poeng? Jeg mener ikke det. En direkte observasjon og sammenligning av de to emballasjene kan gi et svar.

Ser man på emballasjen til Nidars "Stratos" og Freias re-lanserte "Boble", er det flere designelementer som kan analyseres for å vurdere Nidars påstand om plagiering/kopiering. Det skal sies at Boble anno 2012 var mer distinkt forskjellig (gulere) enn Boble 2024 i forhold til Stratos 2024. En blåfarge lik Stratos har kommet til. Men er omfanget dominerende?

Når det gjelder fargebruk bruker "Stratos" en blå bakgrunnsfarge med røde og hvite aksenter, noe som gir en sterk og distinkt visuell identitet. "Boble" bruker en gul bakgrunn med forskjellige farger som aksenter. Til tross for en lik blåfarge er det (fremdeles) en fargekontrast mellom de to produktene som indikerer distinkte merkevarer.

Skrifttypen på "Stratos" er fett og fremtredende, mens "Boble" har en leken og avrundet typografi. Dette antyder at hvert merke forsøker å formidle en annen merkepersonlighet.

"Stratos" viser en blå ku og bobler, som henger sammen med sjokoladens tekstur. "Boble" inkluderer et bilde av sjokoladen foran et solfylt landskap bakgrunn. Boblene i sjokoladen fremheves, men pakningsdesignet inkluderer også andre elementer som sol og landskap.

Begge produkter viser den boblete teksturen som er karakteristisk for sjokoladen, noe som er viktig for kundens forståelse av produktet.

"Stratos" og "Boble" bruker sentrert produktnavn og et underliggende bilde av sjokoladen, som ikke er uvanlig i sjokoladeindustrien. Plasseringen av merkenavn, størrelsen, og bruk av farge rundt tekst og produktbilder, gir en viss likhet i strukturen, selv om fargevalgene er ulike.

Mens de begge fremhever sjokoladens boblete natur, bruker de ulike tilnærminger for å formidle sine unike merkeidentiteter. Forskjellene i fargebruk, typografi og ekstra grafiske elementer som landskapet i "Boble," sammen med ku-ikonet på "Stratos," gir et visst nivå av differensiering.

I vurderingen av emballasjene til "Stratos" og "Boble" finnes det designlikheter som kan forventes gitt at de er i samme produktkategori og skal kommunisere lignende produkter. Men de visuelle forskjellene i fargevalg, typografi og tilleggsbilder tilsier at hvert merke har opprettholdt en ulik merkeidentitet. Selv om det er en overflate likhet, hovedsakelig fordi begge produktene har bobler som en sentral del av sin visuelle kommunikasjon, synes de å formidle forskjellige merkepersonligheter gjennom deres emballasjedesign. Derfor mener jeg at Nidar har en dårlig sak.



LLMs Will Change Jobs, Not Just Tasks.


Credits: Calum Heath

There is no doubt that the rise of Artificial Intelligence (AI) tools is poised to have a profound impact on the job market. A recent New York Times article, "The Worst Part of Wall Street Career May Be Coming to an End," argues that AI is set to replace a significant portion of entry-level white-collar work on Wall Street. This signifies a shift beyond just automating specific tasks; AI has the potential to fundamentally change the types of jobs available.

This aligns with the concept of Large Language Models (LLMs) impacting entire jobs, not just individual tasks within them. Ethan Mollick, a prolific writer, an expert on LLMs, and a professor at the Wharton School, University of Pennsylvania, explains in his book «Co-intelligence. Living and working with AI» that there are three types of tasks:

  • "Just me tasks" are tasks that only I can do and where the LLM can directly assist or replace the human's work, such as writing and composing.
  • "Delegated tasks" are tasks where a human needs to check the LLM’s output and make the final call like editing a text.
  • "Automated tasks" are tasks where the LLM can do a better job at finding facts, summarizing information, coding, or handling routine communications.

This raises an interesting question: How do we build expertise in a world where LLMs are increasingly capable of handling a wide range of tasks? Mollick argues that expertise is a function of several factors, including basic knowledge, active working memory, the ability to connect historical dots, deliberate practice, and having a mentor who can provide feedback.

The emergence of LLMs as potential "mentors" available at all times rather than by appointment, is an intriguing prospect. However, it is crucial to remember that LLMs are ultimately prediction machines, guessing the next word based on context. Consequently, several tasks still require human judgment for important decisions and to avoid potential inaccuracies or plain errors. The implication is that expert input will be in high demand.

As AI continues to advance, the impact on jobs and the job market will be significant. Rather than fearing the rise of LLMs, we should explore how to best harness their capabilities while maintaining the essential role of human expertise and decision-making. By understanding the different types of tasks and the factors that contribute to building expertise, we can adapt and thrive in this rapidly evolving landscape.


onsdag 10. april 2024

Elon Musk: en visjonær gründer?


Elon Musk har snakket med Nicolai Tangen på Tangens podcast "In Good Company" 9 april og formidlet gjennom Musks egen teknologiplattform X. Til tross for tekniske utfordringer, prøvde jeg å danne meg et inntrykk av Musk, hans tanker og visjoner. Hvordan kan vi beskrive en slik personlighet og hva kan vi lære, om noe, av han og hans tenking? Her er mine «five-cent» oppsummeringer.

Konklusjon:

Jeg anser Elon Musk, med alle hans feil, som en visjonær leder med et klart, ambisiøst og tidvis kontroversielt perspektiv på fremtiden for teknologi, samfunn og menneskelig sivilisasjon. Hans syn dekker et bredt spekter, fra kunstig intelligens og kolonisering av Mars til elektriske kjøretøy og sosiale medieplattformer. 

Visjon og futurisme

Musks ambisjoner om kunstig intelligens og Mars-kolonisering er godt dokumentert og representerer hans grensesprengende visjon. Hans selskaper, Tesla og SpaceX, har tatt betydelige skritt mot disse målene. For eksempel har Tesla ledet an i overgangen til elektriske kjøretøy, mens SpaceX har lansert bemannede romfartøyer til Den internasjonale romstasjonen (ISS) og utviklet Starship for fremtidige Mars-misjoner.

Lederskapsstil

Musks lederskapsstil er preget av en høy toleranse for risiko, en utrettelig søken etter innovasjon, og en unik tilnærming til feil. Det har vært rapportert om Musks krevende lederskapsstil, som noen ganger kan virke kontroversiell. Arbeidsmiljøet i hans selskaper er ofte beskrevet som intens, med høye forventninger til ansatte. Musk selv har åpent diskutert sin arbeidsmoral og kravene han stiller, noe som har vært både kritisert og beundret.

Etiske og samfunnsmessige hensyn

Musk har vært en talsmann for regulering av AI, men hans ledelse av X (tidligere Twitter) har vært under intens offentlig og mediegranskning, spesielt knyttet til håndtering av innhold og brukerengasjement. Det er viktig å skille mellom hans personlige visjoner for teknologiens etikk og de faktiske resultatene av hans selskapers politikk og praksis.

Innovasjon og motstandskraft

Musks karriere er et testament til hans motstandskraft og innovasjonskraft. Suksessen med SpaceX etter flere tidlige feilskjær, og Teslas innvirkning på bilindustrien, underbygger hans evne til å omgjøre visjonære ideer til realitet, til tross for betydelige hindringer.

Personlige Innsikter

Musks interesse for strategiske videospill avslører hans pasjon for kompleks strategisk tenking og forståelsen av teknologi og sivilisasjonens samspill. Men hans ulike utspill, kommentarer, og handlinger vitner ofte om manglende konsekvensforståelse.

Konklusjon: Genial Visjonær eller Galskap?

Å kategorisere Elon Musk enten som en "genial visjonær" eller som "gal" er en forenkling av en svært sammensatt figur. Hans ambisiøse prosjekter og tilnærminger har utvilsomt vært polariserende, men også transformative for industrier og samfunn.


tirsdag 9. april 2024

Frontfagsmodellen må moderniseres

Frontfagsforhandlingene mellom NHO Norsk Industri og LO Fellesforbundet har i nesten 60 år tjent oss godt som et rammeverk for bærekraftig lønnsvekst i Norge. I en artikkel fra Idunn, skriver man om bakgrunnen for det som ble kalt Hovedkursteorien.

"I det såkalte Arntsen-utvalgets innstilling (NOU 1999:14, s. 7) heter det:

For å sikre at den samlede lønnsutviklingen i økonomien blir tilpasset hensynet til konkurranseutsatt sektor, er det et sentralt element i Aukrust-modellen at konkurranseutsatt sektor slutter lønnsavtaler først og at lønnsveksten i de skjermede delene av økonomien tilpasses dette. Dette har vært mønsteret ved de fleste lønnsoppgjørene i Norge de siste 30 årene."

I dag vil mange si at den tradisjonelle inndelingen mellom en skjermet sektor (tjenester) og konkurranseutsatt sektor (industri) er utdatert. Den digitale tjenesteøkonomiens størrelse (nesten 80% av fastlands Norges BNP) og unike trekk (født globale) understreker behovet for en mer fleksibel og fremtidsrettet lønnsdannelsesmodell. Men noe skjer.

Årets frontoppgjør på +5,2 prosent lønnsøkning har allerede nå utløst krav fra blant annet lærere og sykepleiere (skjermet sektor) om lønnskrav utover 5,2 prosent. Det er interessant å legge merke til at det som ble det maksimalt ansvarlige for konkurranseutsatt sektor, er minimums nivået for ansatte i skjermet sektor. Da har vi en situasjon hvor halen vifter hunden.

Når en voksende andel digitale tjenestyrende virksomheter konkurrere globalt, må Hovedkursteorien og forhandlingspraksisen følge etter. I dag er en vesentlig del av konkurranseutsatt sektor nektet plass ved forhandlingsbordet. Å si at Gelato, Cognite, Veritas, eller Autostore lever et skjermet norsk konkurranseliv, faller på sin egen urimelighet.

En reform av frontfagsmodellen er derfor påkrevet. En oppdatert modell bør ikke bare gjenspeile den økende viktigheten og konkurransen i den digitale tjenestesektoren, men også ta hensyn til de eksterne økonomiske forholdene som påvirker norsk eksport industri hvor aktørene i liten grad kan påvirke prisen eller etterspørselen og hvor lønnsomheten i liten grad skyldes egen produktivitetsvekst. Mye tyder på at vi i dag ikke måler produktivitet riktig.

Dersom vi utvikler og innpasser nye målemetoder av produktivitet og verdiskaping, tilpasset en digital tjenesteøkonomis særegenheter, kan en oppdatert Hovekursteori sikre en mer bærekraftig og rettferdig lønnsvekst - slik vi alle ønsker.

På samme måte som vi fikk på plass en mer bærekraftig pensjonsreform må vi få på plass en reform av frontfagsmodellen. Reformen vil kreve et tett samarbeid mellom alle parter i arbeidslivet for å utforme en ny Hovedkursteori som er sterk nok til å håndtere dagens globale og digitale utfordringer. Som kjent er det ingenting som er så praktisk som en god oppdatert teori


Sbanken-opprør i DNB - igjen!


 
DNB står midt i et selvpåført kundeopprør. Voksende sinne blant Sbankens-kunder signaliserer dype problemer med bankens kundesyn, forretningspraksis, og et fallende omdømme.

DNB befinner seg midt i et nytt kundeopprør, en situasjon som direkte springer ut fra bankens egne valg og handlinger. Kunder av Sbanken, som en gang ble forsikret om en lysere fremtid under DNBs vinger – med løfter om beskyttelse og et ønske om å lære av Sbankens suksesser – gir nå uttrykk for sin dype frustrasjon åpent. Forsterket av sosiale medier, viser kundenes misnøye betydelige mangler ved DNBs tilnærming til kundeservice, innovasjon, og deres overordnede forretningsstrategi. Bankens omdømme har kommet under angrep.

Etter overtakelsen av Sbanken, har kundene møtt en forverring av tjenestetilbudet som strekker seg fra fjerning av Apple Pay og nedleggelse av nettbank, til økte kostnader for indeksfond, problemer med VPS-overføringer til andre banker, og nylig, utestengelse fra egne konti ved etablering av en ny mobilapp. Disse problemene, sammen med Røeggen-saken som et dystert minne, understreker en vedvarende problematikk hos DNB.

Data fra Norsk kundebarometer (BI) og Norsk innovasjonsindeks (NHH) peker mot en bank som har mistet grepet om sine kunders behov og tillit. DNBs vedvarende bunnplassering i sin bransje, avslører en mangel på innovasjon og kundetilfredshet, noe som reiser spørsmål ved bankens evne eller vilje til å innse og rette opp i sitt kulturproblem.

Den mislykkede integrasjonen av Sbanken, tidligere kjent for sin kundeorientering, innovative tilnærminger og brukervennlige IT-løsninger – faktorer som bidro til at banken jevnlig toppet listene i Norsk kundebarometer og Norsk innovasjonsindeks – har utløst et nytt opprør blant kunder som en gang var tilfredse. Denne økende misnøyen, tydelig gjenspeilet i media og på sosiale medier, bør tjene som et umiskjennelig "code red"-signal for DNBs ledelse. I sum indikerer dette en dyp kundekrise som krever øyeblikkelig oppmerksomhet og handling.

Dette handler ikke om små justeringer eller kosmetiske endringer som en bedre chatbot i kundeservice, AI-rådgiver ved investeringer, eller appfunksjonalitet. Dette krever en gjennomgang av hvordan DNB opererer, kommuniserer og innoverer. Med andre ord en gjennomgang av kulturen som grunnlag for hvordan de skaper, leverer og fanger verdier på. Banken må gjenoppdage sin kjernevirksomhet: å tjene kundene sine. Dette krever en kulturforandring fra toppen og ned. Historien viser at det er nok av saker å lære av. I etterpåklokskapens klarsyn kan man spørre, hva kunne vi gjort annerledes før, under, og etter kundeopprørene?

Til Sbanken-kundene sier jeg: Det er på tide å stemme med føttene og ta pengene til en annen bank. I en verden hvor alternativene er mange og bytte av bank er enklere enn noen gang, bør ikke lojalitet være en ensidig forpliktelse. Hvis en bank ikke kan møte dine behov, verdsette din forretning, eller ikke behandler deg med den respekten du fortjener, er det på tide å finne et nytt finansielt hjem.

DNB kan velge å lytte og lære eller de kan fortsette som før. Dersom historien kan si noe om fremtiden, viser dessverre data fra Norsk kundebarometer og Norsk innovasjonsindeks over tid, ingen endring i DNBs prestasjoner. En grunn kan være at størrelsen gjør at de ikke bryr seg og fordi de vet at for få kunder skifter bank. Da gir konklusjonene seg selv: det på tide å handle.


Språkmodeller kan snart ressonere. Bør vi juble?



Vi er ett skritt nærmere Generell Kunstig Intelligens (GKI). Ifølge Financial Times er OpenAI og Meta bare dager unna å slippe nye versjoner av sine store språkmodeller (LLM) som kan resonnere og planlegge.

Store Språkmodeller (LLM) som GPT-5 og Llama 3 får medieoppmerksomhet for deres gjennombrudd for resoneringsferdigheter. Dette er et vesentlig bidrag til utvikling, men betyr det at bekymringer rundt AI-skjevheter og etikk tilhører fortiden? La oss analysere.

OpenAI og Metas nylige gjennombrudd antyder at LLM nå kan håndtere "vanskelige problemer." Dette refererer til deres evne til å prosessere informasjon og komme til logiske konklusjoner, noe som etterligner menneskelig resonnement til en viss grad. Dette er en stor sak fordi dagens LLM utmerker seg på spesifikke oppgaver, men sliter med bredere forståelse og bruk av logikk.

Men det er en hake: selv-resonerende LLM arver skjevheter fra dataene de er trent på. Hvis dataene inneholder samfunnsmessige fordommer, vil AI reflektere disse skjevhetene i sine resonnementer. Forestill deg en LLM trent på hovedsakelig nyhetsartikler – den kan videreføre stereotypier hvis disse artiklene i seg selv er skjevhet.

Evnen til å resonnere kan til og med forsterke skjevhet. En skjev LLM kan være bedre til å veve tilsynelatende logiske argumenter basert på feilaktige antakelser. For eksempel kan en LLM trent på skjevhetshistoriske tekster "resonnere" at en viss rase er underlegen, selv om dataene selv er feil.

Så, resonerende LLM er ikke en universalløsning for skjevhet. Vi trenger robuste etiske rammeverk for å sikre at disse kraftfulle verktøyene brukes ansvarlig. Dette inkluderer: 
Data Granskning: Nøye utvelgelse og vurdering av treningsdata for å minimere skjevhet. 
Transparens: Forstå hvordan LLM kommer til sine konklusjoner og flagging av mulige skjevheter. 
Menneskelig Tilsyn: Å holde mennesker i løkken for å sikre at AI-utdata er etiske og i tråd med menneskelige verdier.

Resonnerende LLM er et betydelig steg fremover, men problemer knyttet til skjevheter eller etiske bekymringer forblir uløst. Derfor må vi være forsiktige optimister, og utnytte disse fremskrittene på en ansvarlig måte for å sikre at AI tjener menneskene på en menneskevennlig måte.