久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利

二維碼
企資網

掃一掃關注

當前位置: 首頁 » 企業資訊 » 資訊 » 正文

禁止大型語言模型胡編亂造_給點外部知識_推理靠

放大字體  縮小字體 發布日期:2023-02-19 19:02:32    瀏覽次數:206
導讀

選自arXiv作者:Hangfeng He等機器之心編譯編輯:王楷該研究提出的 RR(Rethinking with Retrieval)方法不需要額外的訓練或微調,也不受大型語言模型(LLM)輸入長度限制,在常識推理、時間推理和表格推理任務中顯

選自arXiv

作者:Hangfeng He等

機器之心編譯

編輯:王楷

該研究提出的 RR(Rethinking with Retrieval)方法不需要額外的訓練或微調,也不受大型語言模型(LLM)輸入長度限制,在常識推理、時間推理和表格推理任務中顯著提高了 LLM 性能。

大型語言模型 (LLM) 已通過 In-context Learning 在各種復雜任務上展現出卓越的性能,并且無需針對特定任務進行訓練或微調,近期 prompt 和解碼方面取得的進展也使 LLM 解決復雜推理任務變成了現實。

然而,LLM 可能會存儲過時、不全面或不正確的知識,要將 LLM 成功部署到實際應用中,外部知識來源(例如維基百科)至關重要。此前,人們嘗試將知識用于較小的語言模型 (LM),例如 T5、BERT 和 RoBERTa,但這些方法通常需要額外的訓練或微調,成本高昂,對于 LLM 來說完全不切實際。

基于此,來自羅徹斯特大學、騰訊 AI Lab 和賓夕法尼亞大學的研究者聯合提出了一種稱為 Rethinking with Retrieval (RR) 的后處理方法,以在 LLM 中利用外部知識。

論文地址:https://arxiv.org/pdf/2301.00303v1.pdf

該研究的思路是首先使用思維鏈 (chain-of-thought,CoT) prompting 方法生成一組不同的推理路徑,類似于 Wang et al. (2022) 的方法。然后該研究使用這些路徑中的每個推理步驟來檢索相關的外部知識,讓 RR 方法可以提供更合理的解釋和更準確的預測。

該研究使用 GPT-3 175B 和幾種常見的外部知識源(維基百科、維基數據、WordNet 和 Conceptnet)來評估 RR 方法在三個復雜推理任務上的有效性,包括常識推理、時序推理和表格推理。實驗結果表明,無需額外的訓練或微調,RR 在這三項任務上始終優于其他方法,這表明 RR 方法在利用外部知識來提高 LLM 性能方面具有很大優勢。

利用檢索進行重新思考

實際上,盡管 LLM 已準確捕捉了回答問題所需的要素,但這些模型有時還是會生成錯誤的結果。這種現象說明 LLM 存儲和檢索知識的方式存在一些問題,包括:

  • 預訓練語料庫中存在過時、不正確或缺失的相關知識;
  • 預訓練時對相關知識的存儲有誤;
  • 推理階段對相關知識的錯誤檢索。

    RR 方法的大致思路如下:給定一個輸入問題 Q,RR 方法先利用思維鏈(chain-of though)prompting 生成一組不同的推理路徑 R_1、R_2、……、R_N,其中每個推理路徑 R_i 由解釋 E_i 和跟在其后的預測 P_i 組成,然后再從合適的知識庫 KB 中檢索相關知識 K_1、……、K_M 來支持每個推理路徑中的解釋,并選擇最符合該知識的預測

    思維鏈(CoT)prompting。與標準 prompting 明顯不同,CoT prompting 包括在 prompting 中進行分步推理實例演示來生成一系列捕獲推理過程的短句。

    例如,給定輸入問題:「亞里士多德使用筆記本電腦嗎?」CoT prompting 旨在生成完整的推理路徑:

    CoT prompting 的推理過程為:「亞里士多德死于公元前 322 年。第一臺筆記本電腦于 1980 年發明。因此,亞里士多德沒有使用筆記本電腦。所以答案是 no。」而非簡單地輸出「No」。

    對不同的推理路徑采樣。與 Wang et al. (2022) 相似,該研究對一組不同的推理路徑 R_1、R_2、……、R_N 進行了采樣,而不是像 Wei et al. (2022) 那樣只考慮最優比例路徑(greedy path)。對于「亞里士多德是否使用筆記本電腦?」這一問題,可能的推理路徑如下:

    (R_1) 亞里士多德死于 2000 年。第一臺筆記本電腦發明于 1980 年。因此,亞里士多德使用過筆記本電腦。所以該問題的答案為是。

    (R_2) 亞里士多德于公元前 322 年去世。第一臺筆記本電腦發明于 2000 年。因此,亞里士多德沒有使用過筆記本電腦。所以答案為否。

    知識檢索。不同的知識庫可以用來處理不同的任務。例如,為了解決「亞里士多德使用筆記本電腦了嗎?」這個問題,我們可以使用維基百科作為外部知識庫 KB。信息檢索技術可用于基于分解的推理步驟從維基百科中檢索相關知識 K_1、……K_M。理想情況下,針對此問題我們可以從維基百科中獲得以下兩段內容:

    (K_1) 亞里士多德(公元前 384 至公元前 322 年)是古希臘古典時期的希臘哲學家和博學大師

    (K_2) 第一臺筆記本電腦 Epson HX-20 于 1980 年發明……

    忠實的推理。我們可以使用函數 f_KB(R_i)來估算每個推理路徑 R_i 的置信度,該函數建立在從知識庫 KB 檢索的相關知識 K_1、……、K_M 基礎之上。最終的預測可以通過運用以下推斷過程來獲得:

    實驗評估

    本節中,該研究介紹了 RR 在三個復雜推理任務上的評估:常識推理、時序推理和表格推理。

    實驗設置。在所有實驗中,除非另有說明,該研究都使用 GPT-3 text-davinci-002。實驗完成期間生成的最大 token 數量被設置為 256,zero-shot、few-shot 以及 chain-of-thought prompting,溫度參數(temperature)固定設置為 0。

    結果。如表 1 所示,本文提出的方法 RR,在所有三個推理任務上始終優于所有基準,而無需額外的訓練或微調。這些結果凸顯出了 RR 在利用外部知識提高 LLM 表現方面的有效性。

    該研究在 StrategyQA 數據集上展示了帶有 CoT prompting 方法的關于 GPT-3 的分析。在仔細檢查 GPT-3 的輸出后,該研究觀察到 RR 可以為許多問題提供合理的解釋和正確的預測。例如,當給出「佐治亞州的奧爾巴尼會在紐約州的奧爾巴尼之前先達到十萬名住戶嗎?」這個問題時,GPT-3 產生了以下輸出:

    總體來看對于問題的輸出答案質量很高。然而,該研究也觀察到 GPT-3 可能偶爾會為其解釋提供不正確的事實支持,或為其預測做出不正確的推理,盡管它通常能夠識別出合適的觀點。

    錯誤的支持事實。如表 2 所示,GPT-3 為 Lil Jon 在 Billboard 榜單中排名最高的歌曲提供了錯誤的事實支持,指出排名最高的歌曲是 Get Low 而非正確答案 Yeah。另外,GPT-3 還做出了錯誤的推理,即富士山的山頂不會高于日本海,而不是正確答案會高于。

    更多技術細節請參閱原論文。

  •  
    (文/小編)
    免責聲明
    本文僅代表作發布者:個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
     

    Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

    粵ICP備16078936號

    微信

    關注
    微信

    微信二維碼

    WAP二維碼

    客服

    聯系
    客服

    聯系客服:

    在線QQ: 303377504

    客服電話: 020-82301567

    E_mail郵箱: weilaitui@qq.com

    微信公眾號: weishitui

    客服001 客服002 客服003

    工作時間:

    周一至周五: 09:00 - 18:00

    反饋

    用戶
    反饋

    久久er99热精品一区二区三区,波多野结衣在线观看一区二区 ,成人做爰视频www网站小优视频,在线免费福利
    日韩一区欧美一区| 精品国产电影一区二区| 国产精品538一区二区在线| 麻豆一区二区三区| 国产精品亚洲午夜一区二区三区 | 97久久超碰国产精品| 91丨porny丨国产| 欧美高清精品3d| 亚洲精品一区二区在线观看| 日本一区二区三区在线不卡| 中文字幕一区二区三区精华液 | 99久久久国产精品| 欧美三级电影网站| 欧美一区二区三区公司| 久久久综合激的五月天| 亚洲精品亚洲人成人网在线播放| 亚洲国产精品久久久久婷婷884| 琪琪久久久久日韩精品| 成人精品亚洲人成在线| 欧美日韩三级一区| 136国产福利精品导航| 美女性感视频久久| 欧美在线观看视频在线| 精品少妇一区二区三区日产乱码| 国产精品久久综合| 国产麻豆午夜三级精品| 制服丝袜亚洲播放| 亚洲激情五月婷婷| 国产在线不卡一卡二卡三卡四卡| 欧美三级午夜理伦三级中视频| 久久久久久久久久久久久久久99 | 欧美日韩一级片网站| 国产精品久久久久久久午夜片| 天天操天天综合网| 欧美午夜一区二区三区免费大片| 国产精品久久久久天堂| 国产精品资源在线观看| 欧美成人伊人久久综合网| 韩国成人福利片在线播放| 91美女福利视频| 亚洲精品中文字幕乱码三区| 国产主播一区二区三区| 精品国产伦一区二区三区观看体验| 亚洲成人久久影院| 欧美美女黄视频| 日韩成人伦理电影在线观看| 欧美色视频一区| 日韩激情一二三区| 51精品秘密在线观看| 奇米精品一区二区三区在线观看一| 欧美日韩国产在线播放网站| 国产成人av在线影院| 中文文精品字幕一区二区| 日本高清不卡一区| 一级中文字幕一区二区| 欧美精品三级在线观看| 蜜臀久久99精品久久久画质超高清 | 韩国av一区二区三区| 久久九九全国免费| 欧美专区日韩专区| 狠狠色狠狠色合久久伊人| 国产精品久久夜| 在线不卡欧美精品一区二区三区| 美女精品自拍一二三四| 综合欧美一区二区三区| 欧美在线你懂得| 国产精品自拍网站| 日韩av网站在线观看| 日韩伦理av电影| 久久精品亚洲精品国产欧美kt∨| 91久久一区二区| 国产91在线看| 国内精品久久久久影院一蜜桃| 亚洲欧美日韩国产成人精品影院| 日韩一区二区电影在线| 欧美日本一区二区三区| 99精品视频在线播放观看| 国产精品综合一区二区| 麻豆一区二区三| 日韩不卡在线观看日韩不卡视频| 亚洲欧美日韩在线不卡| 日韩码欧中文字| 亚洲色图一区二区三区| 国产精品久久久久毛片软件| 国产亚洲成aⅴ人片在线观看| 2021国产精品久久精品| 精品久久99ma| 久久久欧美精品sm网站| 欧美电视剧免费观看| 久久综合久久综合亚洲| 久久综合九色综合97婷婷女人| 精品国产免费人成在线观看| 26uuu精品一区二区在线观看| 精品播放一区二区| 国产精品美女久久久久久久久 | 精品国产免费视频| 久久久精品国产免费观看同学| 国产亚洲欧美中文| 亚洲男同1069视频| 五月婷婷色综合| 国产一区免费电影| 在线免费观看成人短视频| 91精品国产高清一区二区三区蜜臀| 精品粉嫩aⅴ一区二区三区四区 | 国产精品一区二区三区乱码| 99久久精品国产毛片| 精品婷婷伊人一区三区三| 3751色影院一区二区三区| 久久九九99视频| 亚洲午夜免费电影| 色婷婷久久久久swag精品| 91精品国产乱码| 一区二区三区在线观看国产| 久久精品国产99| 欧美日韩综合一区| 亚洲欧洲成人自拍| 国产成人综合在线观看| 91精品国产乱码| 亚洲www啪成人一区二区麻豆| 国产一区不卡视频| 日韩免费在线观看| 亚洲一区二区不卡免费| 99久久婷婷国产综合精品| 精品国产凹凸成av人网站| 婷婷开心激情综合| 欧美视频在线不卡| 伊人开心综合网| 色综合久久久久综合99| 日韩一区欧美一区| 波多野结衣中文字幕一区| 欧美激情综合五月色丁香| 国产主播一区二区| 久久免费偷拍视频| 精品一区二区在线观看| 2023国产一二三区日本精品2022| 日本不卡不码高清免费观看| 欧美一级日韩一级| 国产伦理精品不卡| 国产精品不卡在线| 一本大道久久a久久精品综合| 亚洲国产成人av| 欧美一区二区人人喊爽| 国产又黄又大久久| 国产精品久久久久久久蜜臀| 色琪琪一区二区三区亚洲区| 婷婷一区二区三区| 久久久av毛片精品| 色悠悠久久综合| 麻豆一区二区在线| 日韩美女精品在线| 欧美精品精品一区| 97久久精品人人做人人爽| 亚洲一区在线播放| 日本一区二区电影| 欧美精选在线播放| 99久久99久久精品国产片果冻 | 日韩亚洲欧美一区二区三区| aaa亚洲精品一二三区| 日韩在线卡一卡二| 亚洲欧美日韩系列| 久久色成人在线| 欧美日本一区二区在线观看| 成人美女视频在线看| 裸体健美xxxx欧美裸体表演| 夜夜操天天操亚洲| 亚洲丝袜美腿综合| 国产亚洲女人久久久久毛片| 色综合色狠狠综合色| 久久亚洲精品国产精品紫薇| 色猫猫国产区一区二在线视频| 国产精品一级片在线观看| 老司机午夜精品| 日韩电影在线免费观看| 中文字幕一区二区5566日韩| 久久久精品天堂| 久久精品一二三| 久久久久久久一区| 久久久精品欧美丰满| 国产日韩影视精品| 欧美激情在线看| 国产精品乱码人人做人人爱 | 视频在线在亚洲| 日本中文字幕一区| 久久精品国产成人一区二区三区 | 欧美一二三在线| 久久精品亚洲乱码伦伦中文 | 色播五月激情综合网| 欧洲一区在线观看| 欧美亚洲一区二区三区四区| 欧美猛男gaygay网站| 日韩三级免费观看| 中文字幕av在线一区二区三区| 国产精品久久久久四虎| 五月开心婷婷久久| 国产精品 欧美精品| 欧美这里有精品| 精品福利一区二区三区| 一区二区三区在线视频观看58 | 日韩三级在线观看| 国产精品伦理一区二区|