極客號(Daydx.com)9月21日 消息:麻省理工學(xué)院(MIT)的研究人員發(fā)現(xiàn),相較于僅使用單個(gè)AI系統(tǒng),讓多個(gè)AI系統(tǒng)辯論問題的答案可以顯著提高響應(yīng)的準(zhǔn)確性和推理能力。這一研究成果出現(xiàn)在題為《通過多智能體辯論提高語言模型的真實(shí)性和推理能力》的論文中。該研究還得到了Google DeepMind研究員Igor Mordatch的合作。
研究人員將這一方法命名為“多智能體社會(Multiagent Society)”,并發(fā)現(xiàn)它可以減少生成輸出中的幻覺。最令人興奮的是,這一方法甚至可以應(yīng)用于像OpenAI的ChatGPT這樣的現(xiàn)有黑盒模型。
這一方法的實(shí)施包括多輪回的響應(yīng)生成和評論。模型首先生成對給定問題的答案,然后整合來自其他智能體的反饋,以更新自己的響應(yīng)。研究人員發(fā)現(xiàn),這一過程可以改善最終的輸出,因?yàn)樗愃朴趫F(tuán)隊(duì)討論的結(jié)果,各個(gè)智能體共同貢獻(xiàn)答案以達(dá)成統(tǒng)一的結(jié)論。
此外,這一方法還可以用于結(jié)合不同的語言模型,比如將ChatGPT與Google Bard進(jìn)行對比。雖然這兩個(gè)模型在示例提示下都生成了不正確的答案,但它們之間可以生成正確的最終答案。
通過多智能體社會方法,MIT團(tuán)隊(duì)能夠在自然語言處理、數(shù)學(xué)和解謎等各種基準(zhǔn)測試中取得卓越的成績。例如,在流行的MMLU基準(zhǔn)測試中,使用多個(gè)智能體的模型準(zhǔn)確度得分為71,而僅使用單個(gè)智能體的得分為64。
主要研究人員之一,MIT博士生Yilun Du表示:“我們的方法使用了多個(gè)AI模型,每個(gè)模型都帶來了獨(dú)特的見解來解決問題。盡管它們的初始響應(yīng)可能會顯得縮短或包含錯(cuò)誤,但這些模型可以通過審查其同行提供的響應(yīng)來提煉和改進(jìn)自己的答案。”
這一研究成果為AI領(lǐng)域的進(jìn)一步發(fā)展提供了新的思路和方法,有望改進(jìn)現(xiàn)有的語言模型,并提高其真實(shí)性和推理能力。