OpenAI的推理模型有時(shí)會(huì)用中文“思考” 背后原因眾說紛紜

分類一的子分類1 2025年01月15日 07:15:07 7

　　來源：財(cái)聯(lián)社

　　據(jù)媒體報(bào)道，在人工智能（AI）研究公司OpenAI 發(fā)布其首個(gè)推理AI模型o1不久后，人們發(fā)現(xiàn)了一個(gè)奇特的現(xiàn)象，即使在用英文提問的情況下，o1有時(shí)會(huì)中途使用中文、波斯語或其他語言進(jìn)行推理。

　　例如，當(dāng)被問到“Strawberry”（草莓）這個(gè)單詞里有幾個(gè)字母“r”時(shí)，o1會(huì)通過一系列推理步驟得出答案。如果問題是用英文寫的，o1的最終回答通常也會(huì)是英文，但在推理過程中，它可能會(huì)用另一種語言處理部分步驟，然后得出結(jié)論。

　　一些人在網(wǎng)絡(luò)社區(qū)討論了這一現(xiàn)象?！埃╫1）推理到一半時(shí)突然開始用中文‘思考’了，”一位 Reddit用戶寫道。

　　另一位X平臺(tái)上的用戶發(fā)帖詢問：“為什么（o1）會(huì)突然用中文思考？整段對(duì)話（超過5條消息）里完全沒有涉及中文。”

　　OpenAI尚未對(duì)o1的這種怪異行為作出解釋，也沒有承認(rèn)這一現(xiàn)象的存在。AI專家對(duì)此也沒有確切答案，但提出了一些理論。

　　AI 專家眾說紛紜

　　在X平臺(tái)上，包括AI初創(chuàng)公司Hugging Face首席執(zhí)行官Clément Delangue在內(nèi)的多人提到，像o1這樣的推理模型是用包含大量中文字符的數(shù)據(jù)集訓(xùn)練的。

　　谷歌DeepMind的研究員Ted Xiao指出，包括OpenAI在內(nèi)的公司使用了來自中國的第三方數(shù)據(jù)標(biāo)注服務(wù)，而o1切換到中文可能是“中文語言對(duì)推理的影響”的一個(gè)例子。

　　標(biāo)注在模型訓(xùn)練過程中幫助模型理解和解釋數(shù)據(jù)。例如，訓(xùn)練圖像識(shí)別模型的標(biāo)注可能包括圍繞物體的標(biāo)記或描述圖像中每個(gè)人、地點(diǎn)或物體的文字說明。

　　然而，其他專家并不認(rèn)同關(guān)于“o1使用中文數(shù)據(jù)標(biāo)注”的猜測。他們指出，o1在推理過程中同樣可能切換到印地語、泰語或其他非中文的語言。

　　這些專家認(rèn)為，o1和其他推理模型可能只是選擇了它們認(rèn)為最有效的語言來完成任務(wù)，或者是出現(xiàn)了“幻覺”。

　　“模型并不知道語言是什么，也不知道語言之間的區(qū)別，”阿爾伯塔大學(xué)的 AI 研究員兼助理教授Matthew Guzdial表示?！皩?duì)它來說，一切都只是文本。”

　　Hugging Face軟件工程師Tiezhen Wang同意Guzdial的觀點(diǎn)，他認(rèn)為，推理模型的語言不一致性可能源于模型在訓(xùn)練期間與特定語言建立的某些關(guān)聯(lián)。

　　“通過接納每一種語言的細(xì)微差別，我們擴(kuò)展了模型的世界觀，讓它從全方位的人類知識(shí)中學(xué)習(xí)，”Wang在X上寫道。“比如，我喜歡用中文做數(shù)學(xué)計(jì)算，因?yàn)槊總€(gè)數(shù)字都只有一個(gè)音節(jié)，這讓計(jì)算變得簡潔高效。但在涉及無意識(shí)偏見這樣的話題時(shí)，我會(huì)自動(dòng)切換到英語，主要因?yàn)檫@些概念是我最初用英語學(xué)習(xí)和吸收的?！?/p>

　　非營利組織艾倫人工智能研究所的研究科學(xué)家Luca Soldaini則指出，目前無法確定造成這一現(xiàn)象的真正原因。

　　“由于這些模型非常不透明，對(duì)已部署的AI系統(tǒng)的這種觀察是無法證實(shí)的。這正是為什么AI系統(tǒng)開發(fā)過程中的透明性至關(guān)重要的原因之一，”Soldaini表示。

標(biāo)簽：

本文地址：http://pedrorockypoint.com/post/5514.html

本文標(biāo)題：OpenAI的推理模型有時(shí)會(huì)用中文“思考” 背后原因眾說紛紜

版權(quán)聲明：除非特別標(biāo)注，否則均為本站原創(chuàng)文章，轉(zhuǎn)載時(shí)請以鏈接形式注明文章出處。