Das mit der „Moralmatik“ fand ich ehrlich gesagt ziemlich lustig und irgendwo auch treffend, weil… ganz ehrlich… so eine eingebaute Gewissen-Box für KI klingt erstmal total schräg, aber im Prinzip wäre das echt nicht schlecht. Ist jetzt vielleicht ne blöde Frage, aber: Wenn wir ein ethisches Korrektiv „einbauen“ – wer entscheidet denn, was als korrekt gilt? Da fängt das Dilemma doch schon an. Beispiel: Ich hab mal auf HuggingFace ein Modell getestet (OpenAssistant Llama2, falls es wen interessiert), das bei bestimmten Schlagwörtern so extrem auf Nummer sicher ging, dass fast gar nichts mehr durchkam – da fühlt man sich dann auch irgendwie bevormundet… naja, ihr wisst schon.
Was ich in der Praxis gemerkt hab: Eigentlich ist die größte Baustelle nicht mal die Technik, sondern das Drumherum. Viele Leute (gerade in Unternehmen oder bei kleineren Dev-Teams) nutzen Sprachmodelle einfach, ohne sich groß Gedanken zu machen, was im Hintergrund eigentlich passiert und wie schief das gehen kann, wenn die Datenbasis Mist ist oder das Modell halt gesellschaftliche Vorurteile mit in die Antworten schleppt. Mir ist tatsächlich mal passiert, dass ein Chatbot, den wir intern getestet haben, aus Versehen frauenfeindliche Sprüche rausgehauen hat, weil im Trainingsdatensatz so ein Quatsch mit drin war. Gab natürlich erstmal Frust, bis klar wurde, dass das kein böser Wille, sondern schlicht schlechte Daten waren… trotzdem super unangenehm.
Akkh hat mit Bildung und Sensibilisierung schon nen wichtigen Punkt angesprochen. Würde sogar noch weiter gehen: Es wäre cool, wenn es sowas wie verpflichtende „Ethik-Checks“ für neue Modelle gäbe, so wie ein TÜV fürs Auto. Ein bisschen wie diese Penetrationstests bei Software, nur halt auf Bias und ethische Fallstricke geprüft. Klingt jetzt nach Bürokratie, aber vielleicht brauchts das, damit nicht jeder Quatsch einfach irgendwo in der Produktion landet.
Bin mir aber auch nicht sicher, wie das im Alltag ablaufen würde – also ob das dann alles lähmt oder vielleicht sogar Innovation fördert, weil Entwickler:innen gezwungen sind, genauer nachzudenken. Hat da jemand Erfahrungen gemacht? Oder gibt’s irgendwo schon solche Prüf-Instanzen, über die man mal mehr lesen kann? Bin da selber noch am Grübeln, wie man das praktikabel lösen könnte… 🤔