免费人妻无码中文_AV毛片一区二区久久_天天透天天碰天天爽_1a级毛片免费观看

OpenAI的推理模型有時(shí)會(huì)用中文“思考” 背后原因眾說紛紜

分類一的子分類1 7

  來源:財(cái)聯(lián)社

  據(jù)媒體報(bào)道,在人工智能(AI)研究公司OpenAI 發(fā)布其首個(gè)推理AI模型o1不久后,人們發(fā)現(xiàn)了一個(gè)奇特的現(xiàn)象,即使在用英文提問的情況下,o1有時(shí)會(huì)中途使用中文、波斯語或其他語言進(jìn)行推理。

OpenAI的推理模型有時(shí)會(huì)用中文“思考” 背后原因眾說紛紜

  例如,當(dāng)被問到“Strawberry”(草莓)這個(gè)單詞里有幾個(gè)字母“r”時(shí),o1會(huì)通過一系列推理步驟得出答案。如果問題是用英文寫的,o1的最終回答通常也會(huì)是英文,但在推理過程中,它可能會(huì)用另一種語言處理部分步驟,然后得出結(jié)論。

  一些人在網(wǎng)絡(luò)社區(qū)討論了這一現(xiàn)象?!埃╫1)推理到一半時(shí)突然開始用中文‘思考’了,”一位 Reddit用戶寫道。

  另一位X平臺(tái)上的用戶發(fā)帖詢問:“為什么(o1)會(huì)突然用中文思考?整段對(duì)話(超過5條消息)里完全沒有涉及中文。”

  OpenAI尚未對(duì)o1的這種怪異行為作出解釋,也沒有承認(rèn)這一現(xiàn)象的存在。AI專家對(duì)此也沒有確切答案,但提出了一些理論。

  AI 專家眾說紛紜

  在X平臺(tái)上,包括AI初創(chuàng)公司Hugging Face首席執(zhí)行官Clément Delangue在內(nèi)的多人提到,像o1這樣的推理模型是用包含大量中文字符的數(shù)據(jù)集訓(xùn)練的。

  谷歌DeepMind的研究員Ted Xiao指出,包括OpenAI在內(nèi)的公司使用了來自中國的第三方數(shù)據(jù)標(biāo)注服務(wù),而o1切換到中文可能是“中文語言對(duì)推理的影響”的一個(gè)例子。

  標(biāo)注在模型訓(xùn)練過程中幫助模型理解和解釋數(shù)據(jù)。例如,訓(xùn)練圖像識(shí)別模型的標(biāo)注可能包括圍繞物體的標(biāo)記或描述圖像中每個(gè)人、地點(diǎn)或物體的文字說明。

  然而,其他專家并不認(rèn)同關(guān)于“o1使用中文數(shù)據(jù)標(biāo)注”的猜測。他們指出,o1在推理過程中同樣可能切換到印地語、泰語或其他非中文的語言。

  這些專家認(rèn)為,o1和其他推理模型可能只是選擇了它們認(rèn)為最有效的語言來完成任務(wù),或者是出現(xiàn)了“幻覺”。

  “模型并不知道語言是什么,也不知道語言之間的區(qū)別,”阿爾伯塔大學(xué)的 AI 研究員兼助理教授Matthew Guzdial表示?!皩?duì)它來說,一切都只是文本。”

  Hugging Face軟件工程師Tiezhen Wang同意Guzdial的觀點(diǎn),他認(rèn)為,推理模型的語言不一致性可能源于模型在訓(xùn)練期間與特定語言建立的某些關(guān)聯(lián)。

  “通過接納每一種語言的細(xì)微差別,我們擴(kuò)展了模型的世界觀,讓它從全方位的人類知識(shí)中學(xué)習(xí),”Wang在X上寫道。“比如,我喜歡用中文做數(shù)學(xué)計(jì)算,因?yàn)槊總€(gè)數(shù)字都只有一個(gè)音節(jié),這讓計(jì)算變得簡潔高效。但在涉及無意識(shí)偏見這樣的話題時(shí),我會(huì)自動(dòng)切換到英語,主要因?yàn)檫@些概念是我最初用英語學(xué)習(xí)和吸收的?!?/p>

  非營利組織艾倫人工智能研究所的研究科學(xué)家Luca Soldaini則指出,目前無法確定造成這一現(xiàn)象的真正原因。

  “由于這些模型非常不透明,對(duì)已部署的AI系統(tǒng)的這種觀察是無法證實(shí)的。這正是為什么AI系統(tǒng)開發(fā)過程中的透明性至關(guān)重要的原因之一,”Soldaini表示。

標(biāo)簽: