/ en / Traditional / help

Beats Biblionetz - Texte

The AI Alignment Paradox

Robert West, Roland Aydin
Publikationsdatum:
Erste Seite des Textes (PDF-Thumbnail)
Dieses Biblionetz-Objekt existiert erst seit Juli 2025. Es ist deshalb gut möglich, dass viele der eigentlich vorhandenen Vernetzungen zu älteren Biblionetz-Objekten bisher nicht erstellt wurden. Somit kann es sein, dass diese Seite sehr lückenhaft ist.

iconZusammenfassungen

The better we align AI models with our values, the easier we may make it to realign them with opposing values.
Von Robert West, Roland Aydin im Text The AI Alignment Paradox (2025)
As we argue in this Opinion column, preventing such attacks may be fundamentally challenging due to a paradox that we think is inherent in today’s mainstream AI alignment research: The better we align AI models with our values, the easier we may make it for adversaries to misalignc the models. Put differently, more virtuous AI may be more easily made vicious.
Von Robert West, Roland Aydin im Text The AI Alignment Paradox (2025)

iconDieser wissenschaftliche Zeitschriftenartikel erwähnt ...


Personen
KB IB clear
Stuart Russell

Begriffe
KB IB clear
Chat-GPT , Generative Machine-Learning-Systeme (GMLS)computer-generated text , Generative Pretrained Transformer 3 (GPT-3) , Informatikcomputer science , Künstliche Intelligenz (KI / AI)artificial intelligence , reinforcement learning , RLHF (Reinforcement Learning from Human Feedback)
icon
Bücher
Jahr  Umschlag Titel Abrufe IBOBKBLB
2020 local  Human Compatible (Stuart Russell) 2, 8, 3, 4, 7, 1, 4, 3, 10, 5, 4, 13 10 133 13 190

iconDieser wissenschaftliche Zeitschriftenartikel erwähnt vermutlich nicht ... Eine statistisch erstelle Liste von nicht erwähnten (oder zumindest nicht erfassten) Begriffen, die aufgrund der erwähnten Begriffe eine hohe Wahrscheinlichkeit aufweisen, erwähnt zu werden.

iconTagcloud

iconZitationsgraph (Beta-Test mit vis.js)

iconAnderswo finden

icon

iconVolltext dieses Dokuments

Auf dem WWW The AI Alignment Paradox: Artikel als Volltext (lokal: PDF, 802 kByte; WWW: Link OK )
Auf dem WWW The AI Alignment Paradox: Artikel als Volltext (lokal: PDF, 802 kByte; WWW: Link OK )

iconAnderswo suchen  Auch im Biblionetz finden Sie nicht alles. Aus diesem Grund bietet das Biblionetz bereits ausgefüllte Suchformulare für verschiedene Suchdienste an. Biblionetztreffer werden dabei ausgeschlossen.

iconBeat und dieser wissenschaftliche Zeitschriftenartikel

Beat hat Dieser wissenschaftliche Zeitschriftenartikel erst in den letzten 6 Monaten in Biblionetz aufgenommen. Er hat Dieser wissenschaftliche Zeitschriftenartikel einmalig erfasst und bisher nicht mehr bearbeitet. Beat besitzt kein physisches, aber ein digitales Exemplar. Eine digitale Version ist auf dem Internet verfügbar (s.o.). Es gibt bisher nur wenige Objekte im Biblionetz, die dieses Werk zitieren.

iconBiblionetz-History Dies ist eine graphische Darstellung, wann wie viele Verweise von und zu diesem Objekt ins Biblionetz eingetragen wurden und wie oft die Seite abgerufen wurde.