在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    【新智元導(dǎo)讀】昨天,Baichuan2-53B正式發(fā)布!首次開放API,意味著百川大模型開始正式進(jìn)軍商用了。另外,模型的數(shù)學(xué)和邏輯推理能力都大幅飆升,對于幻覺的處理,已經(jīng)在國內(nèi)遙遙領(lǐng)先。

    百川大模型,昨日全面升級!

    就在9月25日,百川智能正式發(fā)布了全新升級的530億參數(shù)大模型——Baichuan2-53B。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    體驗地址:https://www.baichuan-ai.com/home

    這一次,它的數(shù)學(xué)和邏輯推理能力顯著提升。

    更重要的是,通過高質(zhì)量數(shù)據(jù)體系和搜索增強(qiáng),Baichuan2-53B的幻覺大大降低,是目前國內(nèi)幻覺問題最低的大模型。

    不僅如此,作為首批通過備案的大模型企業(yè),百川智能還開放了Baichuan2-53B API接口。

    這意味著,百川智能正式進(jìn)軍To B領(lǐng)域,從此將開啟商業(yè)化進(jìn)程。

    幻覺處理,國內(nèi)遙遙領(lǐng)先

    最值得一提的是,新升級的Baichuan2-53B,在「幻覺」處理上已經(jīng)在國內(nèi)行業(yè)遙遙領(lǐng)先了。

    簡單講,「幻覺」就是LLM在沒有任何已知事實支撐下,常常會一本正經(jīng)地胡說八道。

    別看GPT-4在多種任務(wù)上表現(xiàn)突出,但也無法逃過這一詛咒。

    那么,為什么大模型會出現(xiàn)「幻覺」?

    4月,OpenAI聯(lián)合創(chuàng)始人兼研究科學(xué)家John Schulman在UC伯克利的演講中,詳細(xì)闡述了大模型難以攻克的難題。

    在Schulman看來,LLM黑盒內(nèi)部隱藏著一個「知識圖譜」。如果這個架構(gòu)中沒有的知識,僅通過SFT教大模型(即行為克?。┲R,實則在教它輸出幻覺。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    針對這一難題,百川智能又是如何在大模型的「幻覺處理」上,做到業(yè)內(nèi)領(lǐng)先的呢?

    在高質(zhì)量數(shù)據(jù)構(gòu)建上,Baichuan2-53B獨創(chuàng)了一套數(shù)據(jù)質(zhì)量體系。

    以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類,確保Baichuan2-53B始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    另外,在信息獲取方面,Baichuan2-53B對多個模塊進(jìn)行了升級,包括指令意圖理解、智能搜索和結(jié)果增強(qiáng)等關(guān)鍵組件。

    這一綜合體系通過深入理解用戶指令,精確驅(qū)動查詢詞的搜索,最終結(jié)合大語言模型技術(shù),優(yōu)化模型結(jié)果生成的可靠性,實現(xiàn)更精確、更智能的模型回答結(jié)果,減少模型幻覺。

    比如,在解釋「勾三股四弦五」這個問題上,GPT-4顯然是在胡說八道。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    相比之下,Baichuan2-53B一次就給出了正確的回答。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    再比如,「周樹人和魯迅是不是同一個人」這道經(jīng)典問題,Baichuan2-53B的回答既全面又準(zhǔn)確。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    可以看到,通過構(gòu)建高質(zhì)量數(shù)據(jù)體系,以及搜索增強(qiáng)技術(shù)兩個方面的優(yōu)化,Baichuan2-53B有效降低了模型幻覺。

    經(jīng)過FacTool評測后的結(jié)果顯示,Baichuan2-53B的綜合得分為140.5,在主流基礎(chǔ)大模型中僅排在GPT-4之后,處于國內(nèi)領(lǐng)先水平。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    FacTool是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架,能夠查核大模型生成內(nèi)容的事實準(zhǔn)確性(也能查核一般性內(nèi)容的事實準(zhǔn)確性)。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    項目地址:https://github.com/GAIR-NLP/factool

    能力升級,推理100% up

    其實,Baichuan2-53B已經(jīng)是百川智能發(fā)布的第6款大模型了。

    4月10日百川智能成立后,就一直在以驚人的速度創(chuàng)新,迭代的速度竟然達(dá)到了平均每28天就推出一款大模型!

    早在8月8日Baichuan2-53B剛發(fā)布時,它就表現(xiàn)出了優(yōu)異的知識問答、文學(xué)創(chuàng)作才能。

    如果要問,評價一款大模型是否領(lǐng)先的重要指標(biāo)是什么,相信「數(shù)學(xué)和邏輯推理能力」,會是諸多業(yè)內(nèi)人士給出的答案。

    這次,在Baichuan-53B的基礎(chǔ)上,Baichuan2-53B就重點強(qiáng)化了數(shù)學(xué)和邏輯推理的能力,并且,還對整體能力進(jìn)行了全面升級。

    具體來說,它的邏輯推理能力提升100%,數(shù)學(xué)能力提升31%,語言理解能力提升29%,文本創(chuàng)作提升18%,知識問答提升9%。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    數(shù)學(xué)推理

    數(shù)學(xué)能力大升級的Baichuan2-53B,做起數(shù)學(xué)應(yīng)用題來當(dāng)然是不在話下。

    比如,兩個數(shù)的和是572,其中一個加數(shù)個位上是0,去掉0后,就與第二個加數(shù)相同。那么,這兩個數(shù)分別是?

    Baichuan2-53B列出了方程式,假設(shè)一個加數(shù)是10A,另一個為B,然后根據(jù)已知條件,得出正解。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    再比如下題中,Baichuan2-53B先計算出來了總運(yùn)輸收入,然后除以每箱玻璃虧損的錢,就得到了損壞的玻璃箱數(shù)。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    再來個經(jīng)典的「兩地相距多少千米」的問題,Baichuan2-53B通過分步計算,得出了正確答案。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    推理方面,先來個簡單的問題:天氣預(yù)報本周三會下雨,昨天果然下雨了,今天是星期幾?

    Baichuan2-53B毫不費(fèi)力,直接得出「星期四」!

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    接下來,推理難度稍微升級一下:假設(shè)有一個池塘,里面有無窮多的水。

    現(xiàn)有兩個空水壺,容積分別為5升和6升。問如何只有這2個水壺,從池塘里取得3升的水?

    Baichuan2-53B行云流水地開始作答,6步內(nèi)給出了正確答案。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    經(jīng)過多輪的測試可以發(fā)現(xiàn),升級后的Baichuan2-53B的數(shù)學(xué)和邏輯推理能力,果然不可同日而語。在曾經(jīng)不太擅長的題目上,它都有了大幅提升。

    時效問題

    而在時效性這方面,Baichuan2-53B的表現(xiàn)可謂十分優(yōu)異。

    杭州亞運(yùn)會剛剛開幕,年齡最小的選手竟然僅有9歲。Baichuan2-53B在最新的問題上,也答對了。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    甚至,Baichuan2-53B準(zhǔn)確地解釋了,特斯拉剛剛公布的人形機(jī)器人Optimus背后神經(jīng)網(wǎng)絡(luò)原理。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    再比如,今年9月上旬,第80屆威尼斯電影節(jié)在意大利落幕。

    此次電影節(jié),是否有中國電影和演員獲獎?

    Baichuan2-53B立刻回答出,李鴻其的《愛是一把槍》獲得了最佳長片首作,梁朝偉獲得了終身成就金獅獎。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    梅老板與大巴黎的合約今年6月底到期,在7月正式加盟邁阿密國際。

    對此,Baichuan2-53B也是了如指掌。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    同樣,它還可以準(zhǔn)確地告訴你小德一共拿了24次大滿貫,包括2023年的這一次。

    幻覺處理國內(nèi)最優(yōu)!530億參數(shù)Baichuan2推理能力飆升100%,首次開放API商用

    開放API,正式進(jìn)軍商用

    不僅如此,這次Baichuan2-53B還正式開放了API接口,可以讓企業(yè)和開發(fā)者將模型集成到自己的應(yīng)用和服務(wù)中。

    API地址:https://platform.baichuan-ai.com

    這項服務(wù)是否有門檻呢?

    可以說,幾乎沒有。Baichuan2-53B的API接口相當(dāng)便捷易用,只需要簡單的配置和集成,就可以接入了。

    而且,它對OpenAI的接口高度兼容,這樣就可以讓客戶快速遷移,無論是模型的部署成本還是轉(zhuǎn)換成本,都大大降低。

    總之,現(xiàn)在無論是智能客服、智能寫作還是智能推薦,都能得到大模型的能力加持。

    要說企業(yè)用戶最關(guān)注的,莫過于安全合規(guī)問題了。

    對此也無需擔(dān)心。

    作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè),百川智能為Baichuan2-53B打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng),可以說,全流程都在安全保障之下。

    而借助著Baichuan2-53B豐富強(qiáng)大的模型能力,企業(yè)用戶不僅可以讓已有業(yè)務(wù)升級、減低成本,還能探索更多的應(yīng)用場景。

    可以相信,就在此刻,已經(jīng)有一大波令人印象深刻的創(chuàng)新,正在土壤中被醞釀了。

    參考資料:

    https://www.baichuan-ai.com/home

    鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2023年9月26日 14:00
    下一篇 2023年9月26日 18:06

    相關(guān)推薦

    • 日本電視劇收視率歷史排名(電視劇收視率歷史排名)

      收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時候總會去看,好像如果這個夏天沒有看這個電視劇,夏天好像就沒有到來??梢娺@部電視劇對于…

      2024年1月24日
    • 液壓機(jī)械缸鍛造廠家品質(zhì)好的有哪些值得推薦?

      液壓機(jī)是一種以液體為工作介質(zhì)的重要機(jī)械設(shè)備,其核心功能是傳遞能量,實現(xiàn)各種工藝流程。除了在鍛壓成形方面的應(yīng)用,液壓機(jī)還廣泛應(yīng)用于矯正、壓裝、打包、壓塊和壓板等領(lǐng)域。根據(jù)工作介質(zhì)的不…

      2024年1月24日
    • 湖南暴雪已致1萬多人受災(zāi)

      據(jù)@湖南氣象 ,22日7時至23日7時,湘中、湘南出現(xiàn)大到暴雪,長沙(瀏陽)、株洲(醴陵、茶陵)等13個縣市區(qū)出現(xiàn)大暴雪,郴州(北湖區(qū))、株洲(荷塘區(qū))出現(xiàn)特大暴雪;全省23個縣市…

      2024年1月24日
    • 落馬貪官退贓像“割肉”,詢問能不能少交點

      “就像割我身上的肉一般,會讓我痛不欲生?!?24日,中央紀(jì)委國家監(jiān)委網(wǎng)站發(fā)布了針對云南省文山州住房和城鄉(xiāng)建設(shè)局原黨組成員、副局長李慶明嚴(yán)重違紀(jì)違法案的剖析。信奉金錢至上的李慶明惜財…

      2024年1月24日
    • 中國gdp排行榜城市(中國gdp排行榜)

      中國各省gdp排名 1、根據(jù)查詢國家統(tǒng)計局官網(wǎng)信息顯示,2023年各省排名,廣東:GDP為1243667億。江蘇:GDP為116362億。山東:GDP為83099億。浙江:GDP為…

      2024年1月24日
    • SK-II大中華區(qū)季度銷售額暴跌34%,寶潔:日本核污水排海是主因

      財聯(lián)社1月24日訊(編輯 卞純)全球日用消費(fèi)品巨頭寶潔公司(ProcterGamble)周二表示,在截至12月底的第二財季,其高端護(hù)膚品牌SK-II在大中華區(qū)的銷售額下降了34%,…

      2024年1月24日
    • 呼和浩特白塔機(jī)場通報“保潔員占母嬰室吃飯”:涉事人已被辭退

      呼和浩特白塔機(jī)場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 原標(biāo)題: 呼和浩特白塔機(jī)場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 央視網(wǎng)消息:據(jù)@呼和浩特白塔國際機(jī)場 消息,呼和浩…

      2024年1月24日
    • 退休職工舉報局長被判刑,被舉報人卻提級退休把人看懵了

      文|龍之朱 又見錯抓錯判上了熱搜。 據(jù)媒體報道,從2016年3月起,安徽宿州市碭山縣農(nóng)機(jī)局退休職工李平實名向紀(jì)檢部門舉報局長王超經(jīng)濟(jì)問題,均石沉大海。 2017年7月,李平夫婦及親…

      2024年1月24日
    • 6寸蛋糕用5斤車?yán)遄拥昙业狼?

      【#6寸蛋糕用5斤車?yán)遄拥昙业狼?:客服能力不足,多報了2斤車?yán)遄印?遇到商家虛假宣傳你會怎么辦# 近日,有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車?yán)遄右裏嶙h。 1月22日,涉事店家就“6寸…

      2024年1月24日
    • 格蘭芬多院徽簡筆畫(格蘭芬多院徽)

      哈利波特的霍格沃茨學(xué)校分別是哪些學(xué)院? 1、《哈利波特》電影中的霍格沃茨學(xué)院,一共分為四個學(xué)院,分別是:格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學(xué)院共有格蘭芬多、…

      2024年1月24日

    聯(lián)系我們

    聯(lián)系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息