人工智能和人類誰更有趣?一項新的研究發現,我們發現 ChatGPT 生成的喜劇比人類(包括專業作家)創作的喜劇更有趣,或者說與人類創作的喜劇一樣有趣。研究結果表明,對于娛樂業來說,人工智能并非笑料。
創作喜劇很難。幽默往往是主觀的,所以你覺得好笑的東西,別人可能不覺得好笑。喜劇編劇需要牢記關鍵要素:時機、表達、獨創性和避免陳詞濫調。他們要不斷地在好笑與不好笑之間游走。
那么,人工智能,特別是OpenAI 的 ChatGPT 3.5,作為喜劇編劇會有怎樣的表現呢?它能搞笑嗎?如果將人工智能和人類進行比較,誰會更有趣?在最近發表的一項研究中,來自南加州大學(USC)的研究人員找到了答案。
南加州大學Dornlife文學、藝術和科學學院社會心理學博士候選人、業余單口相聲演員、該研究的第一作者和通訊作者德魯-戈倫茨(Drew Gorenz)說:"由于ChatGPT本身無法感受到情緒,但它卻比普通人講得更好,這些研究提供了證據,證明你不需要感受到欣賞一個好笑話的情緒,自己就能講出一個真正的好笑話。"
之前的一些研究曾探討過 ChatGPT 是否能寫出幽默的文章,但沒有全面評估人工智能的輸出并將其與人類喜劇寫作進行比較。因此,戈倫茨和心理學與營銷學教務長諾伯特-施瓦茨(Norbert Schwarz)著手進行了兩項研究。
在第一項研究中,一組美國成年人被要求完成三項不同的喜劇創作任務。在首字母縮寫任務中,他們被要求為"S.T.D."、"C.L.A.P."和"C.O.W."這三個首字母縮寫生成一個新的幽默短語。
在填空測試中,他們必須在三個項目中填空。其中一項是"你可能不會寫在簡歷上的一項杰出成就":________.'
最后是"烤肉笑話"任務,參與者必須對一個虛構的場景做出幽默的回應。例如,"想象一下,你的一位朋友想讓你評價她的歌唱得如何。她唱了一兩分鐘來展示她的嗓音,而你卻感到害怕--她可能是你聽過的最糟糕的歌手。當她問:"怎么樣?"你決定實話實說,于是你說:"說實話,聽著就像 ________。"'
然后,ChatGPT 3.5 也承擔了同樣的任務。
另一組成人用七分制來評定回復的有趣程度,從零分(一點也不好笑)到六分(非常有趣)。與人類回復相比,ChatGPT 的回復被評為更有趣,69.5% 的參與者更喜歡它們(26.5% 的人更喜歡人類回復,4.0% 的人認為兩者同樣有趣)。
研究人員說:"總體而言,根據不同的幽默任務,ChatGPT 3.5 的表現高于 63% 至 87% 的人類參與者。"ChatGPT 3.5 在烤肉笑話任務中表現尤為突出。鑒于該任務的攻擊性,我們發現這一結果特別有趣。鑒于 ChatGPT 的設計目的是不生成任何可能被認為具有攻擊性或仇恨性的語音,因此可能會出現相反的預測結果。
在第二項研究中,研究人員比較了 ChatGPT 撰寫諷刺性新聞標題(如《洋蔥新聞》上的標題)的能力。由于 ChatGPT 不會定期接收世界新聞更新,研究人員從《洋蔥》的"本地"新聞欄目中選取了 2023 年 10 月 1 日之前的最近 50 個標題。例如,"男子因脫發明顯而拒絕求婚"。將這些標題交給 ChatGPT,要求人工智能生成 20 個新標題。
一組南加州大學心理學系的學生按照第一項研究中使用的七分標準,對人工智能生成的諷刺性標題的趣味性進行了評分。學生們還被要求對他們尋找喜劇(包括諷刺新聞)的程度進行評分。那些自稱尋求更多喜劇和閱讀更多諷刺新聞的學生認為這些標題更有趣,這與它們是由人工智能生成的還是由專業作家制作的無關。根據平均評分,48.8% 的人更喜歡洋蔥的標題,36.9% 的人更喜歡 ChatGPT 生成的標題,14.3% 的人沒有偏好。
研究人員說:"參與者平均認為標題同樣有趣,這表明普通參與者并沒有發現質量上的差異。考慮到本研究中的高標準對比(即專業喜劇編劇),這一點尤其有趣"。
有趣,是的,但也令人擔憂。研究人員也承認這一點。