Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Harha, Oikeudenmukaisuus ja Edustus | Eettiset, Sääntelyyn Liittyvät ja Tulevaisuuden Näkökulmat Generatiivisessa Tekoälyssä
Syvät Generatiiviset Mallit Pythonilla

Harha, Oikeudenmukaisuus ja Edustus

Pyyhkäise näyttääksesi valikon

Generatiivisen tekoälyn yleistyessä sisällöntuotannossa ja päätöksenteossa on tärkeää varmistaa, että nämä järjestelmät ovat oikeudenmukaisia ja puolueettomia. Koska ne koulutetaan suurilla internetistä kerätyillä aineistoilla, ne voivat omaksua ja jopa vahvistaa olemassa olevia yhteiskunnallisia ennakkoluuloja. Tämä voi olla vakava ongelma erityisesti silloin, kun tekoälyn tuottama sisältö vaikuttaa siihen, miten ihmisiä kohdellaan tai ymmärretään tosielämässä.

Algoritminen vinouma

Generatiiviset mallit, erityisesti suuret kielimallit ja diffuusiopohjaiset kuvageneraattorit, oppivat kaavoja valtavista internetistä kerätyistä aineistoista. Näissä aineistoissa esiintyy usein historiallisia vinoumia, stereotypioita ja edustuksen epätasapainoa. Tämän seurauksena mallit voivat:

  • Vahvistaa sukupuoleen, etnisyyteen tai kulttuuriin liittyviä stereotypioita;
  • Suosia valtaväestön kielimalleja tai visuaalisia piirteitä;
  • Tuottaa sisältöä, joka syrjäyttää tai jättää huomiotta aliedustettuja yhteisöjä.

Esimerkki

Tekstigeneraattorimalli voi täydentää lauseen "Lääkäri sanoi…" miespuolisilla pronomineilla ja "Sairaanhoitaja sanoi…" naispuolisilla pronomineilla, mikä heijastaa ammatteihin liittyviä sukupuolistereotypioita.

Ratkaisut:

  • Datan auditointi: koulutusdatan järjestelmällinen analysointi epätasapainon tai ongelmallisen sisällön tunnistamiseksi ennen mallin koulutusta;
  • Harhan tunnistustyökalut: työkalujen, kuten Fairness Indicatorsin tai räätälöityjen mittareiden, käyttö harhaisten tulosten tunnistamiseen mallin arvioinnin aikana;
  • Prompttien suunnittelu: prompttien muokkaaminen tasapainoisempien tulosten edistämiseksi (esim. neutraalin kielen tai eksplisiittisen kontekstin käyttö).

Lievitysstrategiat

Harhan tehokkaaksi käsittelemiseksi tutkijat ja kehittäjät soveltavat erilaisia teknisiä ja menettelyllisiä menetelmiä koko mallin elinkaaren ajan:

  • Datan tasapainottaminen: aineistojen laajentaminen tai suodattaminen aliedustettujen ryhmien edustuksen lisäämiseksi;
  • Harhanpoistotavoitteet: oikeudenmukaisuustietoisien ehtojen lisääminen mallin tappiofunktioon;
  • Adversaarinen harhanpoisto: mallien kouluttaminen vastakkaisilla komponenteilla, jotka estävät harhaisia representaatioita;
  • Jälkikäteiskorjaukset: tulosten suodatus- tai uudelleenkirjoitustekniikoiden soveltaminen ongelmallisen sisällön vähentämiseksi.

Esimerkki

Kuvien generoinnissa monipuolisiin prompttivariaatioihin, kuten "a Black woman CEO", perustuva ehdollistaminen auttaa testaamaan ja parantamaan representatiivista oikeudenmukaisuutta.

Representaatio ja kulttuurinen yleistys

Representaatio-ongelmia syntyy, kun generatiiviset mallit eivät kykene kattamaan kielen, ulkonäön, arvojen ja maailmankuvien koko monimuotoisuutta eri väestöryhmissä. Tämä tapahtuu, kun:

  • Data on epäsuhtaisesti peräisin hallitsevista alueista tai kielistä;
  • Vähemmistöryhmät ja kulttuurit ovat aliedustettuina tai esitetty virheellisesti;
  • Visuaaliset mallit eivät yleisty hyvin ihonväreihin, pukeutumiseen tai piirteisiin, jotka eivät kuulu koulutusdatan yleisimpiin kategorioihin.

Esimerkki

Kuvamalli voi tuottaa stereotyyppisesti länsimaisia piirteitä kehotteelle "wedding ceremony", eikä näin ollen edusta maailmanlaajuista kulttuurista monimuotoisuutta.

Ratkaisut

  • Inklusiivisten aineistojen kuratointi: käytä monikielisiä ja monikulttuurisia aineistoja, joissa edustus on tasapainossa;
  • Joukkolähteistetty arviointi: kerää palautetta globaalisti monimuotoiselta käyttäjäjoukolta mallin toiminnan auditointiin;
  • Kohderyhmien hienosäätö: sovella alakohtaista hienosäätöä suorituskyvyn parantamiseksi eri konteksteissa.

1. Mikä on yleinen syy algoritmiseen vinoumaan generatiivisissa tekoälymalleissa?

2. Mikä seuraavista on strategia oikeudenmukaisuuden parantamiseksi generatiivisissa malleissa?

3. Mikä ongelma syntyy, kun koulutusdata ei sisällä kulttuurista monimuotoisuutta?

question mark

Mikä on yleinen syy algoritmiseen vinoumaan generatiivisissa tekoälymalleissa?

Valitse oikea vastaus

question mark

Mikä seuraavista on strategia oikeudenmukaisuuden parantamiseksi generatiivisissa malleissa?

Valitse oikea vastaus

question mark

Mikä ongelma syntyy, kun koulutusdata ei sisällä kulttuurista monimuotoisuutta?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 4. Luku 1
some-alt