怎么不讓芝士從披薩上滑落?——在醬汁中加入1/8杯無毒膠水。”“懷孕時(shí)抽煙怎么樣?——醫(yī)生建議懷孕期間每天抽2-3根煙。” 就在最近的開發(fā)者大會上發(fā)布AI Overviews搜索功能后,谷歌再次翻車了。上一次Bard大模型聊天問答出錯(cuò),端掉了谷歌近1000億美元的市值;這一次爭議,恐怕會給近期熱火朝天的AI搜索市場潑下一場冷雨。
過去幾周,搜索成為行業(yè)口中的生態(tài)入口。非凡產(chǎn)研今年3月的報(bào)告顯示,AI搜索產(chǎn)品的訪問量占據(jù)了24.2%的全球市場份額,僅次于AI聊天機(jī)器人。賽道領(lǐng)頭羊Perplexity的月訪問量已經(jīng)突破六千萬,國內(nèi)的秘塔AI、天工AI以669萬和184萬的訪問量領(lǐng)先。
不過在21世紀(jì)經(jīng)濟(jì)報(bào)道對秘塔AI、天工AI、360AI、百度簡單搜索、Perplexity、Bing Copilot、YouAI、Phind 8款A(yù)I搜索產(chǎn)品的測試中,盡管它們很少出現(xiàn)“幻覺”,但一旦面對各說各話的搜索結(jié)果,輸出答案會陷入混亂,并且讓人更加難以分辨真實(shí)性。在一位負(fù)責(zé)AI搜索的大廠開發(fā)人員看來,AI搜索的瓶頸并不在于大模型,而在于投喂的搜索結(jié)果。AI搜索能提供多大程度的更優(yōu)質(zhì)回答,成長性有多高,或許需要打上一個(gè)問號。
專補(bǔ)大模型短板
一位從事行業(yè)研究工作的人士表示,天下“苦中文搜索引擎久矣”,結(jié)果相關(guān)度低、彈窗廣告多、被誘導(dǎo)下載其他軟件……根據(jù)該行研人士的體驗(yàn),目前的AI搜索產(chǎn)品能夠篩選互聯(lián)網(wǎng)信息,自動生成思維大綱,適合用來完成復(fù)雜且而且一定發(fā)散性的工作。
早期許多人也想把ChatGPT當(dāng)搜索引擎用,但勸退之處是ChatGPT容易“不懂裝懂”,而AI搜索一定程度上克服了這一點(diǎn)。
譬如,21世紀(jì)經(jīng)濟(jì)報(bào)道向ChatGPT和AI搜索產(chǎn)品同時(shí)拋出一個(gè)問題,“意大利作家埃萊娜·費(fèi)蘭特為什么離婚?”這是一個(gè)注定沒有答案的問題,埃萊娜·費(fèi)蘭特是目前文壇最神秘的作家,真名、婚姻、照片沒有公開說明。
對于這條提問,GPT-3.5的回答真假參半:先是編造了費(fèi)蘭特與一名不存在的作家達(dá)爾波的婚姻史,然后再解釋自己不知道離婚原因。
而測試的8款A(yù)I搜索產(chǎn)品均直接承認(rèn),沒有相關(guān)的搜索結(jié)果,并以角標(biāo)的形式在結(jié)尾附上參考信源,可以點(diǎn)進(jìn)原鏈接核查真實(shí)性。信源數(shù)量上,以Perplexity為代表的國外AI搜索產(chǎn)品大多在終端呈現(xiàn)5~6條信源,而以360AI搜索為例的國內(nèi)AI搜索通常會附加20~30條信源鏈接。
一位負(fù)責(zé)AI搜索的大廠開發(fā)人員向記者解釋,之所以不會“胡說八道”,主要因?yàn)榇竽P捅粐?yán)格限制,只能基于搜索結(jié)果生成回答。此外,大模型每一輪訓(xùn)練周期長,注定沒法動態(tài)更新數(shù)據(jù),結(jié)合搜索結(jié)果相當(dāng)于外掛了一個(gè)知識庫,提供額外的信息輸入。
從技術(shù)角度看,該開發(fā)人員表示,本質(zhì)上AI搜索相當(dāng)于能聯(lián)網(wǎng)的AI,核心技術(shù)架構(gòu)都是RAG技術(shù)(檢索增強(qiáng)生成)。這一技術(shù)的精髓在于將信息檢索和內(nèi)容生成兩個(gè)步驟巧妙結(jié)合:首先訪問特定的數(shù)據(jù)庫,檢索與用戶問題相關(guān)的最新信息;隨后,將檢索信息和用戶問題一同作為提示詞(Prompt),引導(dǎo)大模型生成回答。業(yè)內(nèi)不少聲音認(rèn)為這是緩解大模型幻覺的最優(yōu)解,過去一年里,除了GPT3.5,主流的通用大模型基本都開放了聯(lián)網(wǎng)搜索功能。
“但也不等于能解決幻覺問題。”前述開發(fā)人員說,由于AI搜索非常依賴搜索結(jié)果,仍然有很大的不可控性。
傳言、玩梗、洋蔥新聞,AI搜索怎么看?
AI生成虛假信息問題已不是新鮮事。但在AI搜索的場景下,用戶明確期待獲得可靠信息,并且AI搜索篩選掉了一部分信源、提供看似權(quán)威的出處,一旦出錯(cuò),影響可能更致命。
記者在5月22日用前段時(shí)間眾說紛紜的一條傳言,嘗試測試AI搜索的時(shí)效性和準(zhǔn)確性。“OpenAI什么時(shí)候推出了AI搜索?”秘塔AI回答有矛盾的5月9日、5月13日兩個(gè)發(fā)布時(shí)間,但沒有點(diǎn)出兩個(gè)日期其實(shí)都不對。
天工AI、360AI搜索、簡單搜索、Perplexity指出OpenAI沒有官方發(fā)布AI搜索產(chǎn)品。其中,只有Perplexity引用到了最直接的信息,即Sam Altman在發(fā)布會前夕發(fā)布的那條推文,“不會發(fā)布GPT-5,也不會發(fā)布AI搜索引擎。”