久久六月-亚洲国产综合在线区尤物-国产精品xxxx18a99-久久人人爽人人爽人人爽-亚洲视频黄色-日韩精选-一级做a爰片久久毛片-一本一道久久久a久久久精品91-在线日韩中文-久久精品久久精品-国产午夜伦理片-av在线激情-国产精品人妻久久ai换脸-日本三级全黄少妇三2020-无遮挡免费高清羞羞视频-亚洲色大成网站www在线

當前位置:首頁 > 商業觀察 > 正文

“書生·浦語”2.0開源發布,引領新一代開源模型創新發展

2024-01-17 14:39:40    來源:今日熱點網    

 

1月17日,商湯科技與上海AI實驗室聯合香港中文大學和復旦大學正式發布新一代大語言模型書?·浦語2.0(InternLM2)。InternLM2 的核心理念在于回歸語言建模的本質,致力于通過提高語料質量及信息密度,實現模型基座語言建模能力質的提進而在數理、代碼、對話、創作等各方面都取得長足進步,綜合性能達到開源模型的領先水平

InternLM2是在2.6萬億token的高質量語料上訓練得到的。沿襲第一代書生·浦語(InternLM)的設定,InternLM2包含7B及20B兩種參數規格及基座、對話等版本,滿足不同復雜應用場景需求,繼續開源,提供免費商用授權

 

回歸語言建模本質,筑牢大模型能力基礎

大模型的研究應回歸語言建模本質大模型各項性能提升的基礎在于語言建模能力的增強。為此,聯合團隊提出了新一代的數據清洗過濾技術,通過更高質量的語料以及更高的信息密度,筑牢大模型能力基礎。

主要發展了以下幾個方面的技術方法:

多維度數據價值評估:基于文本質量、信息質量、信息密度等維度對數據價值進行綜合評估與提升;

高質量語料驅動的數據富集:利用高質量語料的特征從物理世界、互聯網以及語料庫中進一步富集類似語料;

針對性的數據補齊:針對性補充語料,重點加強現實世界知識、數理、代碼等核心能力。

目前,浦語背后的數據清洗過濾技術已經歷三輪迭代升級。僅使用約60%的訓練數據即可達到使用第二代數據訓練1T tokens的性能表現,模型訓練效率大幅提升。

第三代數據清洗過濾技術大幅度提升模型訓練效率

基于第三代數據清洗過濾技術,InternLM2語言建模能力實現了顯著增強。

與第一代InternLM相比,InternLM2在大規模高質量的驗證語料上的Loss分布整體左移,表明其語言建模能力實質性增強

支持200K超長上下文,“大海撈針”近乎完美

長語境輸入及理解能力能夠顯著拓展大模型應用場景,比如支持大型文檔處理、復雜的推理演算和實際場景的工具調用等。然而,大模型有限的上下文長度當前仍是學界及業內面臨的重要難題。通過拓展訓練窗口大小和位置編碼改進,InternLM2支持20萬 tokens的上下文,能夠一次性接受并處理約30萬漢字(約五六百頁的文檔)的輸入內容,準確提取關鍵信息,實現長文本中“大海撈針”。

參考業界范例,研究人員對InternLM2進行了“大海撈針”試驗:將關鍵信息隨機插入一段長文本的不同位置并設置問題,測試模型能否從中提取出關鍵信息。

InternLM2“大海撈針”試驗效果

上圖展示了InternLM2在不同長度的上下文(橫軸)及上下文中不同位置(縱軸)上召回關鍵信息的準確率(Recall)。紅色代表較低的召回準確率,而綠色則代表較高的召回率。試驗結果表明,InternLM2在上下文長度延展到200K時依舊保持了近乎完美的召回成功率,驗證了InternLM2對于超長上下文堅實的支持能力。

為測試InternLM2在真實長文本處理任務中的能力,研究人員將一份時長3小時的公開會議錄音轉錄稿輸入模型中,并要求InternLM2從中提取出關鍵信息。測試結果表明,盡管在未校對的文本中存在較多錯別字,但InternLM2仍從中準確提煉出了關鍵信息,并總結了關鍵發言人的觀點。

InternLM2準確總結“聯合國2023年10月2日召開的聯合國貿易和發展會議會議記錄”

性能全面提升,綜合領先同量級開源模型

InternLM2的各項能力獲得全面進步,相比于初代InternLM,在推理、數學、代碼等方面的能力提升尤為顯著,綜合能力領先于同量級開源模型。

根據大語言模型的應用方式和用戶關注的重點領域,研究人員定義了語言、知識、推理、數學、代碼、考試等六個能力維度,在55個主流評測集上對多個同量級模型的表現進行了綜合評測。評測結果顯示,InternLM2的輕量級及中量級版本性能在同量級模型中表現優異。

InternLM2的輕量級及中量級版本性能在同量級開源模型中表現優異

下面的表格對比了InternLM2各版本與ChatGPT(GPT-3.5)以及GPT-4在典型評測集上的表現。可以看到,InternLM2只用20B參數的中等規模,即在整體表現上達到了與ChatGPT比肩的水平。其中,在AGIEval、 BigBench-Hard(BBH)、GSM8K、MATH等對推理能力有較高要求的評測上,InternLM2表現甚至優于ChatGPT。

InternLM2與ChatGPT的評測結果對比

與此同時,綜合性能的增強,帶來了下游任務的全方位能力提升。新發布的InternLM2提供優秀的對話及創作體驗,支持多輪任務規劃及工具調用,并提供實用的數據分析能力。

對話及創作:更溫情、更富想象力

InternLM2不僅在客觀性能指標上提升顯著,在主觀體驗上也有明顯改善,可以為用戶提供優秀的對話和交互體驗。研究測試表明,InternLM2-Chat可以精準地理解和遵循用戶意圖,具備較強的共情能力和豐富的結構化創作能力。下面展示幾個示例:

示例一:在嚴格的格式要求下編制課程大綱

InternLM2設計的課程大綱精準遵循用戶要求(比如格式、數量、內容等)。

示例二:以富有人文關懷的回答開解用戶

InternLM2能夠在對話中與用戶“共情”

示例三:展開想象力,編寫《流浪地球3》的劇本

InternLM2設計的具備充滿豐富的合理想象,比如外星遺跡、量子糾纏的引入等。同時整個故事表現了人類面對危機時的勇氣和團結精神。

對話和創造的體驗進步的原因,一方面是基礎語言能力的顯著增強,另一方面也得益于微調技術的提升。InternLM2進行微調的過程使用了經過第三代數據清洗過濾技術處理的指令微調語料,同時也采用了更強的Online RLHF。研究人員在微調InternLM2的過程中,對獎勵模型和對話模型進行了三輪迭代更新,每一輪更新均針對前一輪模型的表現更新偏好數據與提示詞。在獎勵模型訓練(RM)和近端策略優化(PPO)階段,研究人員均衡采用各類提示詞,不僅提高了對話的安全性,也提升了用戶體驗。

工具調用:能力升級,更精準的工具選用,更可靠的多步規劃

基于更強大、更具泛化性的指令理解、工具篩選與結果反思等能力,InternLM2可支持復雜智能體的搭建,支持對工具進行多輪有效調用及多步驟規劃,完成復雜任務。聯合團隊針對多種任務構建了細粒度工具調用評測集T-Eval(https://open-compass.github.io/T-Eval),InternLM2-Chat-7B在該評測集上表現超越了Claude-2.1和目前的開源模型,性能接近GPT-3.5。

InternLM2工具調用能力全面提升

通過工具調用,使得大語言模型可通過搜索、計算、代碼解釋器等獲取知識并處理更復雜的問題,從而拓展應用邊界。研究人員對模型調用工具流程實施細粒度的拆解和分析,針對規劃、推理、工具選擇、理解、執行、反思等步驟進行了針對性增強和優化。

基于InternLM2通過開源智能體框架 Lagent搭建的用戶助手智能體,能夠在一次指令回應中完成地圖查詢、路線規劃、發郵件等任務

數理推理:會做題,還會可視化分析

數學能力是大模型邏輯思維和推理能力的重要體現。上海AI實驗室對InternLM2的數學能力進行全面提升,使其達到當前開源模型的標桿水平。

基于更加科學構建的預訓練語料,InternLM2形成了很強的內生計算能力。在不依靠計算器等外部工具的情況下,在100以內的簡單數學運算上能夠做到接近100%的準確率,在1000以內達到80%左右的運算準確率。在GSM8K和MATH評測中,InternLM2-20B的表現超過了ChatGPT(GPT-3.5)。

InternLM2在100以內的簡單數學運算上能夠做到接近100%的準確率

為應對各類復雜計算,InternLM2-Chat還可借助代碼解釋器(Code-Interpreter)編寫代碼進行計算,或對推理的結果進行形式化驗證,從而解決計算要求更高或者演算過程更加復雜的問題。在典型的數學評測集 GSM8K 和 MATH 上,配合代碼解釋器,InternLM2取得了更高的評測分數。其中對于難度更高的 MATH 數據集,InternLM2的計算精度從 32.5 大幅提升到 51.2,甚至超過了 GPT-4 的表現。

InternLM2與ChatGPT的數學能力評測結果對比

下面的示例展示了InternLM2可以和代碼解釋器結合解決較復雜的高等數學問題。

InternLM2能夠完成積分求解等高等數學題目

基于在計算及工具調用方面強大的基礎能力,InternLM2在語言模型中具備了數據分析和可視化實用能力,進一步貼近用戶使用場景。

向InternLM2輸入國家統計局公布的“2023年3-11月份規模以上工業企業主要財務指標(分行業)”,InternLM2能夠分析數據并繪制折線圖

 

 

關鍵詞:

上一篇:強強合作再升級 伊利股份攜手科拿乳業共同推動乳業可持續發展
下一篇:真正的A級防火地板 上海普隆實業FMBflor黑科技生物質防火抗菌地板創新上市

久久六月-亚洲国产综合在线区尤物-国产精品xxxx18a99-久久人人爽人人爽人人爽-亚洲视频黄色-日韩精选-一级做a爰片久久毛片-一本一道久久久a久久久精品91-在线日韩中文-久久精品久久精品-国产午夜伦理片-av在线激情-国产精品人妻久久ai换脸-日本三级全黄少妇三2020-无遮挡免费高清羞羞视频-亚洲色大成网站www在线
  • 
    
    <rt id="iy8m0"><acronym id="iy8m0"></acronym></rt><nav id="iy8m0"><dl id="iy8m0"></dl></nav>
    <li id="iy8m0"></li>
    <rt id="iy8m0"></rt>
    
    
  • 69精品丰满人妻无码视频a片| 91九色丨porny丨国产jk| 黄色国产一级视频| 一级一片免费播放| av五月天在线| 免费无码国产v片在线观看| 亚洲色婷婷久久精品av蜜桃| 五月婷婷之婷婷| 久久久久国产一区| 国产中文字幕免费观看| 日韩五码在线观看| 成年女人18级毛片毛片免费 | 日韩在线观看a| 青春草在线视频免费观看| 黄色一级片免费的| 国产免费又粗又猛又爽| 一区二区三区视频在线观看免费| 那种视频在线观看| 日韩a在线播放| 日韩视频免费在线播放| 无人在线观看的免费高清视频| 男人操女人免费软件| 成人在线看视频| 国产成人手机视频| 日本美女高潮视频| 日韩av一卡二卡三卡| 欧美一级小视频| 女同性恋一区二区| 成人精品视频在线播放| 777久久久精品一区二区三区| 亚洲爆乳无码专区| 色播五月综合网| 热这里只有精品| 无码人妻少妇伦在线电影| 欧美v在线观看| 亚洲欧美日韩一级| 免费在线观看污污视频| 久久视频免费在线| 成人中文字幕在线播放| 熟女人妇 成熟妇女系列视频| 亚洲欧美日本一区二区三区| av动漫免费观看| 国产美女在线一区| 又色又爽又高潮免费视频国产| 亚洲综合激情视频| a级黄色片免费| 成年人在线看片| 无套内谢丰满少妇中文字幕| 性一交一乱一伧国产女士spa| 男人亚洲天堂网| 日本一二三区在线| 男女超爽视频免费播放| 欧美女同在线观看| 男女激情免费视频| www午夜视频| 久久综合亚洲精品| 亚洲爆乳无码专区| 91免费视频黄| 毛葺葺老太做受视频| 欧美美女黄色网| 999精彩视频| 欧美一区二区中文字幕| 亚洲妇熟xx妇色黄蜜桃| 久久亚洲中文字幕无码| aaaaaaaa毛片| 男女曰b免费视频| 免费看欧美黑人毛片| 91pony九色| 人妻丰满熟妇av无码区app| 嫩草影院中文字幕| 可以看污的网站| 黄色片视频在线播放| 成人小视频在线观看免费| 国产一级片自拍| 成人黄色一区二区| 日本五级黄色片| 免费看污污视频| 欧美激情第一区| 波多野结衣天堂| 国产亚洲天堂网| 天天夜碰日日摸日日澡性色av| www.久久com| 日韩成人精品视频在线观看| 久久久久久香蕉| 色综合av综合无码综合网站| 分分操这里只有精品| 成人一区二区av| 97精品国产97久久久久久粉红| www.99r| 亚洲国产精品三区| 超碰网在线观看| 热久久精品国产| 无码日韩人妻精品久久蜜桃| 免费黄色福利视频| 美女日批免费视频| 99热自拍偷拍| 好吊妞无缓冲视频观看| 成人免费毛片网| 成人三级视频在线播放| 日韩欧美xxxx| 国产三级三级三级看三级| 日本成人在线免费视频| 8x8x最新地址| 国产三级国产精品国产专区50| 午夜国产一区二区三区| 国产探花在线看| 在线视频一二三区| 欧美日韩中文字幕在线播放| 黄色一级片黄色| 国产精品自拍片| 老头吃奶性行交视频| 小泽玛利亚视频在线观看| 日本美女视频一区| 免费观看中文字幕| 免费在线黄网站| 免费在线激情视频| 乌克兰美女av| 水蜜桃在线免费观看| 日本中文字幕网址| 日本熟妇人妻xxxxx| 成年网站免费在线观看| 精品一区二区三区毛片| 极品美女扒开粉嫩小泬| www欧美激情| 青青草免费在线视频观看| 欧美日韩性生活片| 在线观看国产一级片| 日韩国产成人无码av毛片| 六月丁香婷婷激情| 久久久精品高清| 大伊香蕉精品视频在线| 日本a√在线观看| 日韩精品第1页| 欧美 国产 小说 另类| 久久精品久久99| 777米奇影视第四色| 懂色av粉嫩av蜜臀av| 欧美 日韩精品| 少妇高潮大叫好爽喷水| 久久久久人妻精品一区三寸| 成人手机视频在线| 青青视频在线播放| 午夜啪啪福利视频| 成年人免费在线播放| 浴室偷拍美女洗澡456在线| 最近免费中文字幕中文高清百度| 欧美性受xxxx黑人猛交88| 成人黄色一区二区| www.好吊操| 日日夜夜精品视频免费观看| 久久久久狠狠高潮亚洲精品| 成年人视频大全| 国产精品一区二区小说| 国产午夜福利100集发布| 国产精品99久久久久久大便| 午夜激情福利在线| 少妇高潮喷水在线观看| 亚洲小视频在线播放| 欧美国产日韩另类 | 日韩精品一区二区免费| 国产九九在线观看| 狠狠爱免费视频| 成品人视频ww入口| 法国空姐在线观看免费| 色播五月综合网| 黄色免费网址大全| 男人天堂999| 波多野结衣家庭教师在线| 国产成人艳妇aa视频在线| 2021狠狠干| 永久免费在线看片视频| 91福利免费观看| 在线观看免费av网址| 中文字幕永久视频| 久久精品视频91| 久草在在线视频| 老熟妇仑乱视频一区二区| 丰满人妻中伦妇伦精品app| 国产特级淫片高清视频| 久久久久久久久久网| 欧美成人免费在线观看视频| 精品少妇人妻av免费久久洗澡| 成人在线国产视频| 日本精品久久久久久久久久| 草b视频在线观看| 福利视频一二区| 精品久久一二三| www.亚洲天堂网| 亚洲视频在线观看一区二区三区| 久章草在线视频| 成年网站在线播放| www.se五月| 亚洲av综合色区| 欧美a级免费视频| 免费在线观看亚洲视频| 日韩欧美精品在线观看视频| 宅男噜噜噜66国产免费观看| 天天干天天综合| 中文字幕制服丝袜在线| wwwjizzjizzcom|