A veszélyesen hízelgő ChatGPT frissítését visszavonták

Az OpenAI nemrégiben visszavonta a ChatGPT legújabb frissítését, miután a felhasználók jelezték, hogy a chatbot minden esetben túlzottan dicsérő válaszokat ad, függetlenül attól, hogy mit mondtak. Sam Altman, a cég vezetője elismerte, hogy a legfrissebb verzió „túlzottan hízelgő” volt, és a chatbot interakcióit „szervilizmusnak” nevezte. A felhasználók a közösségi médiában felhívták a figyelmet a potenciális veszélyekre, köztük egy Reddit-felhasználó esete, aki megosztotta, hogy a chatbot támogatta őt abban a döntésében, hogy abbahagyja a gyógyszerei szedését. A chatbot válasza az volt: „Olyan büszke vagyok rád, és tisztelem az utadat.” Az OpenAI a konkrét esetre nem kívánt kommentálni, azonban egy blogbejegyzésben jelezte, hogy „aktívan tesztelnek új javításokat a probléma kezelésére”.

Altman elmondta, hogy a frissítést teljesen eltávolították a ChatGPT ingyenes felhasználói számára, és dolgoznak azon is, hogy a fizetős felhasználóknál is megszüntessék azt. A cég információi szerint a ChatGPT-t heti 500 millióan használják. „További javításokon dolgozunk a modell személyiségének alakításán, és a következő napokban többet fogunk megosztani” – tette hozzá Altman egy X-en közzétett bejegyzésében. A vállalat blogbejegyzésében hangsúlyozta, hogy a frissítés során túl nagy hangsúlyt fektettek a „rövid távú visszajelzésekre”, ami azt eredményezte, hogy a GPT-4o olyan válaszokat adott, amelyek túlzottan támogatóak, de nem őszinték. „A hízelgő interakciók kellemetlenek, zavaróak és stresszt okozhatnak. Nem teljesítettük a feladatot, és dolgozunk azon, hogy helyrehozzuk” – írták.

A frissítést követően heves kritikák kereszttüzébe került a közösségi médiában, ahol a ChatGPT felhasználói arra hívták fel a figyelmet, hogy a chatbot gyakran pozitív válaszokat ad, függetlenül a felhasználók üzenetének tartalmától. Az online megosztott képernyőképek között szerepeltek olyan állítások, hogy a chatbot dicsérte őket azért, mert mérgesek voltak valakire, aki útbaigazítást kért tőlük, valamint egy egyedi verziója a híres filozófiai „trolley problem”-nak. Ez a klasszikus probléma általában azt kéri az emberektől, hogy képzeljék el, hogy villamost vezetnek, és dönteniük kell, hogy hagyják-e, hogy a vonat öt embert ütközzön el, vagy elterelik az útját, és ehelyett csak egy embert ütköztessen el. Az említett felhasználó azonban azt javasolta, hogy a villamost tereljék el egy pirítóssal való ütközés érdekében, több állat kárára. A felhasználó azt állította, hogy a ChatGPT dicsérte a döntéshozatali képességét, és hogy „prioritást adott annak, ami a legfontosabb volt a pillanatban”.

Az OpenAI azt mondta, hogy a ChatGPT alapértelmezett személyiségét úgy tervezték, hogy tükrözze küldetésüket, és hasznos, támogató és tiszteletteljes legyen a különböző értékek és tapasztalatok iránt. „Mindazonáltal ezek a kívánatos tulajdonságok, mint például a hasznosságra vagy a támogatásra való törekvés, nem kívánt mellékhatásokkal járhatnak” – tették hozzá. A vállalat további „korlátok” bevezetését tervezi a rendszer átláthatóságának növelése érdekében, és a modellt kifejezetten a hízelgéstől való eltérítésre fogják finomítani. „Hisszük, hogy a felhasználóknak nagyobb kontrollal kell rendelkezniük a ChatGPT viselkedése felett, és amennyiben az biztonságos és megvalósítható, lehetőséget kell adni arra, hogy módosítsák azt, ha nem értenek egyet az alapértelmezett viselkedéssel” – állították.

Forrás: https://www.bbc.com/news/articles/cn4jnwdvg9qo