Oppiskele Harha, Oikeudenmukaisuus ja Edustus | Eettiset, Sääntelyyn Liittyvät ja Tulevaisuuden Näkökulmat Generatiivisessa Tekoälyssä

Syvät Generatiiviset Mallit Pythonilla

Pyyhkäise näyttääksesi valikon

Generatiivisen tekoälyn yleistyessä sisällöntuotannossa ja päätöksenteossa on tärkeää varmistaa, että nämä järjestelmät ovat oikeudenmukaisia ja puolueettomia. Koska ne koulutetaan suurilla internetistä kerätyillä aineistoilla, ne voivat omaksua ja jopa vahvistaa olemassa olevia yhteiskunnallisia ennakkoluuloja. Tämä voi olla vakava ongelma erityisesti silloin, kun tekoälyn tuottama sisältö vaikuttaa siihen, miten ihmisiä kohdellaan tai ymmärretään tosielämässä.

Algoritminen vinouma

Generatiiviset mallit, erityisesti suuret kielimallit ja diffuusiopohjaiset kuvageneraattorit, oppivat kaavoja valtavista internetistä kerätyistä aineistoista. Näissä aineistoissa esiintyy usein historiallisia vinoumia, stereotypioita ja edustuksen epätasapainoa. Tämän seurauksena mallit voivat:

Vahvistaa sukupuoleen, etnisyyteen tai kulttuuriin liittyviä stereotypioita;
Suosia valtaväestön kielimalleja tai visuaalisia piirteitä;
Tuottaa sisältöä, joka syrjäyttää tai jättää huomiotta aliedustettuja yhteisöjä.

Esimerkki

Tekstigeneraattorimalli voi täydentää lauseen "Lääkäri sanoi…" miespuolisilla pronomineilla ja "Sairaanhoitaja sanoi…" naispuolisilla pronomineilla, mikä heijastaa ammatteihin liittyviä sukupuolistereotypioita.

Ratkaisut:

Datan auditointi: koulutusdatan järjestelmällinen analysointi epätasapainon tai ongelmallisen sisällön tunnistamiseksi ennen mallin koulutusta;
Harhan tunnistustyökalut: työkalujen, kuten Fairness Indicatorsin tai räätälöityjen mittareiden, käyttö harhaisten tulosten tunnistamiseen mallin arvioinnin aikana;
Prompttien suunnittelu: prompttien muokkaaminen tasapainoisempien tulosten edistämiseksi (esim. neutraalin kielen tai eksplisiittisen kontekstin käyttö).

Lievitysstrategiat

Harhan tehokkaaksi käsittelemiseksi tutkijat ja kehittäjät soveltavat erilaisia teknisiä ja menettelyllisiä menetelmiä koko mallin elinkaaren ajan:

Datan tasapainottaminen: aineistojen laajentaminen tai suodattaminen aliedustettujen ryhmien edustuksen lisäämiseksi;
Harhanpoistotavoitteet: oikeudenmukaisuustietoisien ehtojen lisääminen mallin tappiofunktioon;
Adversaarinen harhanpoisto: mallien kouluttaminen vastakkaisilla komponenteilla, jotka estävät harhaisia representaatioita;
Jälkikäteiskorjaukset: tulosten suodatus- tai uudelleenkirjoitustekniikoiden soveltaminen ongelmallisen sisällön vähentämiseksi.

Esimerkki

Kuvien generoinnissa monipuolisiin prompttivariaatioihin, kuten "a Black woman CEO", perustuva ehdollistaminen auttaa testaamaan ja parantamaan representatiivista oikeudenmukaisuutta.

Representaatio ja kulttuurinen yleistys

Representaatio-ongelmia syntyy, kun generatiiviset mallit eivät kykene kattamaan kielen, ulkonäön, arvojen ja maailmankuvien koko monimuotoisuutta eri väestöryhmissä. Tämä tapahtuu, kun:

Data on epäsuhtaisesti peräisin hallitsevista alueista tai kielistä;
Vähemmistöryhmät ja kulttuurit ovat aliedustettuina tai esitetty virheellisesti;
Visuaaliset mallit eivät yleisty hyvin ihonväreihin, pukeutumiseen tai piirteisiin, jotka eivät kuulu koulutusdatan yleisimpiin kategorioihin.

Esimerkki

Kuvamalli voi tuottaa stereotyyppisesti länsimaisia piirteitä kehotteelle "wedding ceremony", eikä näin ollen edusta maailmanlaajuista kulttuurista monimuotoisuutta.

Ratkaisut

Inklusiivisten aineistojen kuratointi: käytä monikielisiä ja monikulttuurisia aineistoja, joissa edustus on tasapainossa;
Joukkolähteistetty arviointi: kerää palautetta globaalisti monimuotoiselta käyttäjäjoukolta mallin toiminnan auditointiin;
Kohderyhmien hienosäätö: sovella alakohtaista hienosäätöä suorituskyvyn parantamiseksi eri konteksteissa.

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 4. Luku 1

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 4. Luku 1

Harha, Oikeudenmukaisuus ja Edustus

Algoritminen vinouma

Esimerkki

Ratkaisut:

Lievitysstrategiat

Esimerkki

Representaatio ja kulttuurinen yleistys

Esimerkki

Ratkaisut

1. Mikä on yleinen syy algoritmiseen vinoumaan generatiivisissa tekoälymalleissa?

2. Mikä seuraavista on strategia oikeudenmukaisuuden parantamiseksi generatiivisissa malleissa?

3. Mikä ongelma syntyy, kun koulutusdata ei sisällä kulttuurista monimuotoisuutta?