Oppiskele Harha, Oikeudenmukaisuus ja Representaatio

Generatiivinen Syväoppiminen

Pyyhkäise näyttääksesi valikon

Generatiivisen tekoälyn yleistyessä sisällöntuotannossa ja päätöksenteossa on tärkeää varmistaa, että nämä järjestelmät ovat oikeudenmukaisia ja puolueettomia. Koska ne koulutetaan suurilla internetistä kerätyillä aineistoilla, ne voivat omaksua ja jopa vahvistaa yhteiskunnassa esiintyviä ennakkoluuloja. Tämä voi olla vakava ongelma erityisesti silloin, kun tekoälyn tuottama sisältö vaikuttaa siihen, miten ihmisiä kohdellaan tai ymmärretään tosielämässä.

Algoritminen vinouma

Generatiiviset mallit, erityisesti suuret kielimallit ja diffuusiopohjaiset kuvageneraattorit, oppivat kaavoja valtavista internetistä kerätyistä aineistoista. Näissä aineistoissa esiintyy usein historiallisia vinoumia, stereotypioita ja edustuksen epätasapainoa. Tämän seurauksena mallit voivat:

Vahvistaa sukupuoleen, etnisyyteen tai kulttuuriin liittyviä stereotypioita;
Suosia enemmistöryhmien kielellisiä ilmauksia tai visuaalisia piirteitä;
Tuottaa sisältöä, joka syrjäyttää tai jättää huomiotta aliedustettuja yhteisöjä.

Esimerkki

Tekstigeneraattorimalli voi täydentää lauseen "Lääkäri sanoi…" miespuolisilla pronomineilla ja "Sairaanhoitaja sanoi…" naispuolisilla pronomineilla, mikä heijastaa ammatteihin liittyviä sukupuolistereotypioita.

Ratkaisut:

Datan auditointi: järjestelmällinen koulutusdatan analysointi epätasapainon tai ongelmallisen sisällön tunnistamiseksi ennen mallin koulutusta;
Harhan tunnistustyökalut: työkalujen, kuten Fairness Indicatorsin tai räätälöityjen mittareiden, käyttö harhaisten tulosten tunnistamiseen mallin arvioinnin aikana;
Prompttien suunnittelu: syötteiden muokkaaminen tasapainoisempien tulosten edistämiseksi (esim. neutraalin kielen tai eksplisiittisen kontekstin käyttö).

Lievitysstrategiat

Harhan tehokkaaksi vähentämiseksi tutkijat ja kehittäjät soveltavat erilaisia teknisiä ja menettelyllisiä menetelmiä koko mallin elinkaaren ajan:

Datan tasapainottaminen: aineistojen täydentäminen tai suodattaminen aliedustettujen ryhmien edustuksen lisäämiseksi;
Harhanpoistotavoitteet: oikeudenmukaisuustietoiset termit mallin tappiofunktioon;
Adversaarinen harhanpoisto: mallien kouluttaminen vastakkaisilla komponenteilla, jotka estävät harhaisia esityksiä;
Jälkikäteiskorjaukset: tulosten suodatus- tai uudelleenkirjoitustekniikoiden soveltaminen ongelmallisen sisällön vähentämiseksi.

Esimerkki

Kuvien generoinnissa monipuolisten syötevariaatioiden, kuten "a Black woman CEO", käyttäminen auttaa testaamaan ja parantamaan edustuksellista oikeudenmukaisuutta.

Representaatio ja kulttuurinen yleistys

Representaatio-ongelmat ilmenevät, kun generatiiviset mallit eivät kata kielen, ulkonäön, arvojen ja maailmankuvien koko monimuotoisuutta eri väestöryhmissä. Tämä tapahtuu, kun:

Data on epäsuhtaisesti peräisin hallitsevista alueista tai kielistä;
Vähemmistöryhmät ja kulttuurit ovat aliedustettuina tai virheellisesti kuvattuja;
Visuaaliset mallit eivät yleisty hyvin ihonväreihin, pukeutumiseen tai piirteisiin, jotka poikkeavat harjoitusaineiston yleisimmistä kategorioista.

Esimerkki

Kuvamalli voi tuottaa stereotyyppisesti länsimaisia piirteitä kehotteelle "wedding ceremony", eikä näin ollen edusta maailmanlaajuista kulttuurista monimuotoisuutta.

Ratkaisut

Osallistavien aineistojen kuratointi: käytä monikielisiä ja monikulttuurisia aineistoja, joissa edustus on tasapainossa;
Joukkolähteistetty arviointi: kerää palautetta maailmanlaajuisesti monimuotoiselta käyttäjäjoukolta mallin toiminnan arvioimiseksi;
Kohderyhmien hienosäätö: sovella alakohtaista hienosäätöä suorituskyvyn parantamiseksi eri konteksteissa.

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 1. Luku 15

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 15

Harha, Oikeudenmukaisuus ja Representaatio

Algoritminen vinouma

Esimerkki

Ratkaisut:

Lievitysstrategiat

Esimerkki

Representaatio ja kulttuurinen yleistys

Esimerkki

Ratkaisut

1. Mikä on yleinen syy algoritmiseen vinoumaan generatiivisissa tekoälymalleissa?

2. Mikä seuraavista on strategia oikeudenmukaisuuden parantamiseksi generatiivisissa malleissa?

3. Mikä ongelma syntyy, kun koulutusdatasta puuttuu kulttuurinen monimuotoisuus?