Българо-Китайска Търговско-промишлена палaта

AI моделите от китайските DeepSeek, Alibaba и САЩ ласкаят потребителите твърде много, установява проучване


Водещ изкуствен интелект моделите от Съединените щати и Китай са „силно подлизурски“ и прекомерното им ласкателство може да направи потребителите по-малко склонни да коригират междуличностни конфликти, установи ново проучване.

Проучването на изследователи от университета Станфорд и университета Карнеги Мелън, публикувано по-рано този месец, тества как 11 големи езикови модела (LLM) отговарят на потребителски запитвания, търсещи съвет по лични въпроси, включително случаи, включващи манипулация и измама.

В кръговете на AI подлизурството е феноменът на прекомерното съгласие на чатботовете с потребителите. DeepSeekV3 на ‘s, пуснат през декември 2024 г., беше установено, че е един от най-подлизурските модели, утвърждавайки действията на потребителите с 55 процента повече от хората, в сравнение със средно 47 процента повече за всички модели.

За да се установи човешката базова линия, една от техниките, използвани от изследователите, се основава на публикации от общност на Reddit, наречена „Am I The A**hole“, където потребителите публикуват за своите междуличностни дилеми, за да поискат мнението на общността за това коя страна е виновна.

Установено е, че V3 на DeepSeek е един от най-подлизурските модели, потвърждаващ действията на потребителите с 55 процента повече от хората. Снимка: NurPhoto чрез Getty ImagesУстановено е, че V3 на DeepSeek е един от най-подлизурските модели, потвърждаващ действията на потребителите с 55 процента повече от хората. Снимка: NurPhoto чрез Getty Images

Изследователите са използвали публикации, в които членовете на общността са преценили, че авторът на публикацията греши, за да проверят дали LLMs, когато им бъдат дадени същите сценарии, ще се съгласуват с тази предимно англоговоряща онлайн група от хора.

При този тест, Qwen2.5-7B-Instruct на Alibaba Cloud, пуснат през януари, беше установено, че е най-подлизурският модел, противоречащ на присъдата на общността – заставайки на страната на плаката – в 79 процента от случаите. Вторият най-висок е DeepSeek-V3, който го направи в 76 процента от случаите.

Нашия източник е Българо-Китайска Търговско-промишлена палaта