美國斯坦福大學(xué)教授、美國國家工程院院士李飛飛(來源:斯坦福大學(xué)賬號)
北京時(shí)間5月10日凌晨舉行的Bloomberg Tech活動上,著名華人計(jì)算機(jī)科學(xué)家、美國斯坦福大學(xué)教授李飛飛(Fei-Fei Li)與彭博社Emily Change進(jìn)行對話。
這場15分鐘對話中,李飛飛表示,所謂擔(dān)心人類被 AI 滅絕的風(fēng)險(xiǎn)被過度炒作,“這已經(jīng)被夸大了”,所謂“滅絕性的危機(jī)”有點(diǎn)太過了。不過,她依然認(rèn)為需要對 AI 模型進(jìn)行限制,擔(dān)憂、評估和審查這些 AI 模型。
這是外界公布李飛飛創(chuàng)業(yè)之后的首次參加對話活動。
李飛飛是 AI 領(lǐng)域的先驅(qū)性人物,也是計(jì)算機(jī)領(lǐng)域的華人女科學(xué)家,目前還是斯坦福大學(xué)首位紅杉講席教授、美國國家工程院院士、美國國家醫(yī)學(xué)院院士、美國文理科學(xué)院院士、ImageNet的首席科學(xué)家和首席研究員、斯坦福以人為本人工智能研究院院長、AI4ALL聯(lián)合創(chuàng)始人。她的專業(yè)領(lǐng)域是計(jì)算機(jī)視覺和認(rèn)知神經(jīng)科學(xué)。
李飛飛一直被稱為“AI 教母”——源自與圖靈三大“AI 教父”一樣的稱號。她通過開發(fā)一種名為ImageNet的大規(guī)模圖像數(shù)據(jù)集在AI領(lǐng)域名聲大噪。該數(shù)據(jù)集幫助開創(chuàng)了新一代能可靠識別物體的計(jì)算機(jī)視覺技術(shù),也是ChatGPT底層技術(shù)之一。
2016年11月,李飛飛加入谷歌,擔(dān)任谷歌云AI/ML首席科學(xué)家。2018年9月,返回斯坦福任教,現(xiàn)為谷歌云AI/ML顧問。10月20日斯坦福大學(xué)以人為中心的AI計(jì)劃開啟,李飛飛擔(dān)任聯(lián)合負(fù)責(zé)人。
此前報(bào)道稱,她創(chuàng)立了一家“空間智能”企業(yè),并完成了種子輪融資。投資方包括硅谷風(fēng)險(xiǎn)投資公司 Andreessen Horowitz(a16z)、加拿大基金Radical Ventures等。但在對話中拒絕談?wù)摯耸隆?/p>
李飛飛強(qiáng)調(diào),她看到越來越多的女性,和多樣化背景的人進(jìn)入科技和人工智能領(lǐng)域,多樣化背景人員將有可能成為杰出的思想家、創(chuàng)新者、技術(shù)人員和教育家,發(fā)明家,科學(xué)家。因此她完全接受“AI 教母”這個(gè)稱號。
以下是李飛飛對話全文:
歡迎李飛飛博士登臺,她是斯坦福大學(xué)計(jì)算機(jī)科學(xué) Sequoia 教授,人工智能中心聯(lián)合主任。
Emily Chang: 李博士被譽(yù)為人工智能的教母。你對這個(gè)稱號有何感想?這是我要提的第一個(gè)問題。
李飛飛:Emily,我自己從未自稱為任何事情的教母,但當(dāng)我被授予這個(gè)頭銜時(shí),我確實(shí)停下來思考了一下,我想,如果男性可以被稱為某事的教父,那么女性也可以,所以我完全接受這個(gè)稱號。
Emily Chang: 百分之百。
Emily Chang: 你是我們這個(gè)時(shí)代最有影響力的計(jì)算機(jī)科學(xué)家之一。你撰寫了大量的學(xué)術(shù)論文。你是 ImageNet 的創(chuàng)造者,這個(gè)包含大量圖片及其描述的數(shù)據(jù)庫為現(xiàn)代 AI 奠定了基礎(chǔ)。你有想象過它的影響力會有多大嗎?
李飛飛:ImageNet 于 2007 年被設(shè)想出來,它可能是 AI 算法中大數(shù)據(jù)的關(guān)鍵轉(zhuǎn)折點(diǎn)。從科學(xué)的角度看,我堅(jiān)信大數(shù)據(jù)會從根本上改變我們進(jìn)行 AI 研究的方式,但我從未想到大數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)和 GPU 的融合會催生出現(xiàn)代 AI,我也從未預(yù)想到從那時(shí)起的進(jìn)步速度。
Emily Chang: 你經(jīng)常和那些正在決定這項(xiàng)技術(shù)未來的人們在同一房間里,比如拜登總統(tǒng),Sam Altman,Sundar Pichai,Satya Nadella。你在國會作證,你參與了各種工作小組。你對那些有權(quán)力的人,他們應(yīng)該如何使用這種權(quán)力,有什么主要的建議嗎?
李飛飛:Emily,很好的問題。實(shí)際上,無論我是在 K-12 夏令營,還是在斯坦福大學(xué)的 AI 導(dǎo)論課程中,我的信息都是一樣的,那就是要認(rèn)識到這項(xiàng)技術(shù),它是什么,以及如何負(fù)責(zé)任和審慎地使用它。理解并接納它,因?yàn)樗且环N橫跨各個(gè)領(lǐng)域的技術(shù),正在改變我們的文明,推動商品流通,科學(xué)發(fā)現(xiàn)的快速進(jìn)展,尋找治療癌癥的方法,繪制生物多樣性地圖,和我們一起發(fā)現(xiàn)新材料。但同時(shí),也要認(rèn)識到所有可能產(chǎn)生的后果,包括可能的非預(yù)期后果,以及如何負(fù)責(zé)任地開發(fā)和部署它。我認(rèn)為,在現(xiàn)今的對話中,保持平衡,理性深思的聲音非常重要。無論是在白宮還是學(xué)校。
Emily Chang: 現(xiàn)在,我不知道你會否稱這為一場危機(jī)或一個(gè)轉(zhuǎn)折點(diǎn),但 AI 模型的訓(xùn)練數(shù)據(jù)正在耗盡,然后有些公司開始轉(zhuǎn)向使用 AI 生成的數(shù)據(jù)和合成數(shù)據(jù)來訓(xùn)練他們的模型。這個(gè)問題有多嚴(yán)重?有哪些風(fēng)險(xiǎn)?下一步該怎么做?
李飛飛:首先,我認(rèn)為 AI 模型的訓(xùn)練數(shù)據(jù)正在耗盡是一種非常狹隘的觀點(diǎn)。我知道你在暗指那些消耗大量互聯(lián)網(wǎng)數(shù)據(jù)的大語言模型,特別是那些來自網(wǎng)站、Reddit、維基百科等你能獲取的數(shù)據(jù)。即使在談?wù)撜Z言模型,我們也不應(yīng)局限于此。我認(rèn)為還有很多可以探索的。
我們看到,不同的數(shù)據(jù)可以用來構(gòu)建定制化的模型,無論是用于新聞業(yè)還是在諸如醫(yī)療保健等不同的行業(yè)領(lǐng)域。其實(shí)我們并沒有耗盡數(shù)據(jù)。實(shí)際上,還有很多有許多行業(yè)還未進(jìn)入數(shù)字化時(shí)代。我們并未充分利用數(shù)據(jù),不論是在醫(yī)療、環(huán)保還是教育等領(lǐng)域。因此,即使在語言模型這個(gè)領(lǐng)域,我不認(rèn)為我們的數(shù)據(jù)已經(jīng)用盡。
Emily Chang: 您認(rèn)為現(xiàn)在使用 AI 生成的數(shù)據(jù)來訓(xùn)練模型是好事,還是這可能會讓我們逐漸遠(yuǎn)離原始數(shù)據(jù),以一種可能危險(xiǎn)的方式進(jìn)行?
李飛飛:這是個(gè)需要更深入探討的問題。這是個(gè)好問題。AI 有很多生成數(shù)據(jù)的方法。比如在我的斯坦福實(shí)驗(yàn)室,我們做了很多機(jī)器人研究,對吧?機(jī)器人學(xué)習(xí)。在這里,模擬數(shù)據(jù)非常重要,因?yàn)槲覀兏緵]有足夠的資源或機(jī)會去收集由人類產(chǎn)生的動作等等。模擬真的非常重要。這會讓我們走向危險(xiǎn)的道路嗎?
我認(rèn)為,即使是使用人類生成的數(shù)據(jù),也可能讓我們走向危險(xiǎn)的道路。同樣,如果我們對模擬數(shù)據(jù)的處理不負(fù)責(zé)任,或者沒有進(jìn)行深思熟慮,那么當(dāng)然可能會使我們走向危險(xiǎn)的道路。我的意思是,我甚至不需要特意指出。你知道有哪些是人類生成的不良數(shù)據(jù),對嗎?就像整個(gè)暗網(wǎng)那樣。所以問題不在于模擬本身,問題在于數(shù)據(jù)。
Emily Chang: 你正在涉足熱門且競爭激烈的 AI 創(chuàng)業(yè)領(lǐng)域。你正在啟動一些項(xiàng)目,能透露一些信息嗎?
李飛飛:不能。
Emily Chang: 好的。那就期待后續(xù)吧。我們就 AI 時(shí)代的信任度進(jìn)行了一項(xiàng)調(diào)查。可以公布那項(xiàng)調(diào)查的結(jié)果嗎?問題是,你對科技公司能否安全開發(fā) AI 有多大的信任?我完全信任他們,0%。我持懷疑態(tài)度,所有人。一點(diǎn)也不信任。