在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<address id="ugjqb"><var id="ugjqb"><center id="ugjqb"></center></var></address>

MIT微軟證實(shí)GPT-4具備自我糾錯(cuò)能力較弱的模型則沒(méi)有這種能力

用戶投稿 ? 2023年7月5日 15:20 ? 熱點(diǎn)

極客號(hào)（Daydx.com）7月5日消息:最近，麻省理工學(xué)院（MIT）和微軟的研究學(xué)者發(fā)現(xiàn)，GPT-4在自修復(fù)方面表現(xiàn)出了有效能力，而GPT-3.5則沒(méi)有。此外，GPT-4還能夠?qū)PT-3.5生成的代碼提供反饋。

大型語(yǔ)言模型（LLM）已經(jīng)被證明可以從自然語(yǔ)言中生成代碼片段，但在應(yīng)對(duì)復(fù)雜的編碼挑戰(zhàn)，例如專業(yè)競(jìng)賽和軟件工程專業(yè)面試時(shí)，仍然面臨巨大挑戰(zhàn)。最近的研究試圖通過(guò)自修復(fù)來(lái)提高模型的編碼性能，自修復(fù)是指模型反思并糾正自身代碼中的錯(cuò)誤。

論文地址：https://arxiv.org/pdf/2306.09896.pdf

從本研究的實(shí)驗(yàn)中，研究者得出以下發(fā)現(xiàn):

考慮到檢查和修復(fù)的成本，只有GPT-4的自修復(fù)能力能夠提供性能收益;對(duì)于GPT-3.5，在所有配置下，修復(fù)的通過(guò)率低于或等于基線模型或無(wú)修復(fù)方法的通過(guò)率。

即使對(duì)于GPT-4，性能提升也是適度的（從66%提升到71%的通過(guò)率），而且取決于初始程序是否具有足夠的多樣性。實(shí)驗(yàn)的預(yù)算是使用7000個(gè)標(biāo)記，約45個(gè)獨(dú)立同分布(i.i.d.)的GPT-4樣本。

使用GPT-4生成的反饋替代GPT-3.5對(duì)錯(cuò)誤的解釋，可以獲得更好的自修復(fù)性能，甚至超過(guò)了基線的無(wú)修復(fù)GPT-3.5方法（從50%提升到使用7000個(gè)標(biāo)記時(shí)的54%）。

使用人類的解釋代替GPT-4自身的解釋可以顯著改善修復(fù)結(jié)果，從而使通過(guò)測(cè)試的修復(fù)程序數(shù)量增加57%。

愛(ài)丁堡大學(xué)的博士生符堯表示:“只有GPT-4具備自我改進(jìn)的能力，而較弱的模型則沒(méi)有，這一發(fā)現(xiàn)非常有趣，表明大型模型可能具有一種新型的涌現(xiàn)能力，即通過(guò)改進(jìn)自然語(yǔ)言反饋來(lái)實(shí)現(xiàn)，這種能力可能只存在于模型足夠成熟（大而整齊）的情況下。類似的能力在論文《Improving Language Model Negotiation with Self-Play and In-Context Learning from AI Feedback》中也有提及?！?/p>

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場(chǎng)，版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。

亞馬遜 AWS 副總裁淡化人工智能存在威脅生成式 AI 不會(huì)一個(gè)模型統(tǒng)治市場(chǎng)

上一篇 2023年7月5日 15:20

女生用一個(gè)魚(yú)缸做出海市蜃樓網(wǎng)友：勇氣可嘉

下一篇 2023年7月5日 15:20

日本電視劇收視率歷史排名(電視劇收視率歷史排名)
收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時(shí)候總會(huì)去看，好像如果這個(gè)夏天沒(méi)有看這個(gè)電視劇，夏天好像就沒(méi)有到來(lái)?？梢?jiàn)這部電視劇對(duì)于…
2024年1月24日
0
液壓機(jī)械缸鍛造廠家品質(zhì)好的有哪些值得推薦？
液壓機(jī)是一種以液體為工作介質(zhì)的重要機(jī)械設(shè)備，其核心功能是傳遞能量，實(shí)現(xiàn)各種工藝流程。除了在鍛壓成形方面的應(yīng)用，液壓機(jī)還廣泛應(yīng)用于矯正、壓裝、打包、壓塊和壓板等領(lǐng)域。根據(jù)工作介質(zhì)的不…
2024年1月24日
0
湖南暴雪已致1萬(wàn)多人受災(zāi)
據(jù)@湖南氣象，22日7時(shí)至23日7時(shí)，湘中、湘南出現(xiàn)大到暴雪，長(zhǎng)沙（瀏陽(yáng)）、株洲（醴陵、茶陵）等13個(gè)縣市區(qū)出現(xiàn)大暴雪，郴州（北湖區(qū)）、株洲（荷塘區(qū)）出現(xiàn)特大暴雪；全省23個(gè)縣市…
2024年1月24日
0
落馬貪官退贓像“割肉”，詢問(wèn)能不能少交點(diǎn)
“就像割我身上的肉一般，會(huì)讓我痛不欲生?！?24日，中央紀(jì)委國(guó)家監(jiān)委網(wǎng)站發(fā)布了針對(duì)云南省文山州住房和城鄉(xiāng)建設(shè)局原黨組成員、副局長(zhǎng)李慶明嚴(yán)重違紀(jì)違法案的剖析。信奉金錢至上的李慶明惜財(cái)…
2024年1月24日
0
中國(guó)gdp排行榜城市(中國(guó)gdp排行榜)
中國(guó)各省gdp排名 1、根據(jù)查詢國(guó)家統(tǒng)計(jì)局官網(wǎng)信息顯示，2023年各省排名，廣東：GDP為1243667億。江蘇：GDP為116362億。山東：GDP為83099億。浙江：GDP為…
2024年1月24日
0
SK-II大中華區(qū)季度銷售額暴跌34%，寶潔：日本核污水排海是主因
財(cái)聯(lián)社1月24日訊（編輯卞純）全球日用消費(fèi)品巨頭寶潔公司（ProcterGamble）周二表示，在截至12月底的第二財(cái)季，其高端護(hù)膚品牌SK-II在大中華區(qū)的銷售額下降了34%，…
2024年1月24日
0
呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退
呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退原標(biāo)題：呼和浩特白塔機(jī)場(chǎng)通報(bào)“保潔員占母嬰室吃飯”：涉事人已被辭退央視網(wǎng)消息：據(jù)@呼和浩特白塔國(guó)際機(jī)場(chǎng) 消息，呼和浩…
2024年1月24日
0
退休職工舉報(bào)局長(zhǎng)被判刑，被舉報(bào)人卻提級(jí)退休把人看懵了
文|龍之朱又見(jiàn)錯(cuò)抓錯(cuò)判上了熱搜。據(jù)媒體報(bào)道，從2016年3月起，安徽宿州市碭山縣農(nóng)機(jī)局退休職工李平實(shí)名向紀(jì)檢部門舉報(bào)局長(zhǎng)王超經(jīng)濟(jì)問(wèn)題，均石沉大海。 2017年7月，李平夫婦及親…
2024年1月24日
0
6寸蛋糕用5斤車?yán)遄拥昙业狼?
【#6寸蛋糕用5斤車?yán)遄拥昙业狼?：客服能力不足，多報(bào)了2斤車?yán)遄印?遇到商家虛假宣傳你會(huì)怎么辦# 近日，有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車?yán)遄右裏嶙h。 1月22日，涉事店家就“6寸…
2024年1月24日
0
格蘭芬多院徽簡(jiǎn)筆畫(huà)(格蘭芬多院徽)
哈利波特的霍格沃茨學(xué)校分別是哪些學(xué)院? 1、《哈利波特》電影中的霍格沃茨學(xué)院，一共分為四個(gè)學(xué)院，分別是：格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學(xué)院共有格蘭芬多、…
2024年1月24日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時(shí)間：周一至周五，10:30-18:30，節(jié)假日休息

<dfn id="dbzml"></dfn>

<dfn id="dbzml"><var id="dbzml"><fieldset id="dbzml"></fieldset></var></dfn>

<dfn id="dbzml"></dfn>

<address id="dbzml"></address>