OpenAI員工在推特上,像極了上班的你

OpenAI發布旗艦推理模型o3和o3-mini,成為他們2024年的收官之作,制造了一波小熱潮。和往常一樣,Twitter (x.com)依然是外網討論的主陣地。
但有件事不知你發現沒,這次來自OpenAI“自己人”的聲量明顯增強了——幾乎所有擁有x賬號的OpenAI員工都在發文,為公司的重大模型更新站臺助威。
網友們越刷推越發現,放眼望去,怎么滿世界都是OpenAI的工程師和研究員。而且這次不再局限于那幾個耳熟能詳的名字,整個團隊都出來了。
此情此景,是不是還挺熟悉~Twitter上的OpenAI員工們,像不像在朋友圈奮力為東家“營業”的你?
1 OpenAI全員共創o3盛事之:領導班子帶頭PR
掌門人奧特曼不用多說了:從發布前按捺不住以“oh oh oh”暗示新品,邀請大家申請o3測試權限;
到強調o3-mini編程表現以顯著降低的成本超越o1,在線感激團隊成員的辛勞付出,稱大家一起工作是“人生中最大的快樂之一”;
再到各種一鍵三連同事們的o3推文,熱鬧非常。
上個月剛結束"人生中最長假期"的OpenAI聯合創始人兼總裁Greg Brockman,回歸后一直在緊密配合公司的每一步動作,勤勞搞宣發。
o3上線后他發聲力贊:新模型在最具挑戰性的測試中實現了質的飛躍,直接達到一個全新的高度。
首席產品官Kevin Weil和研究副總裁Mark Chen分別轉發ARC-AGI測試突破和o3-mini團隊的推文。
新任OpenAI首席信息安全官Dane Stuckey也來“一二三,上鏈接”了,感嘆這是“多么令人興奮的一天”。
有意思的是,Stuckey大約四年前就注冊了推特賬號,而直到今年10月他離開Palantir Tech,官宣加入OpenAI后,才開始正式發文。并且一改往日低調,變得異常活躍。
主創團隊攜手登場
在這次發布直播中,年輕的華人研究員Hongyu Ren作為團隊代表,詳細介紹了輕量級模型o3 mini。
他隨后在推特上發文,重點講解o3 mini的卓越性能,包括其高效性、成本效益以及靈活可調的推理時間。還特別提到了幾位參與o3-mini研發的核心成員,向他們致敬。
幾位主創也紛紛發文回應,稱o3-mini是“一個聰明的小怪獸”、“速度極快”、擁有“驚人的數學和代碼性能”,言語間自豪之情盡顯。
其實,這些研究員們在業內已經頗有建樹。查看他們的背景就會發現,不少人都是o1和o1-mini的關鍵貢獻者。不過這一波官宣也確實讓更多公眾認識了他們,以OpenAI的造星能力來看,出幾個新的大模型界KOL或許指日可待。
各組同事扎堆夸夸
此次“OpenAI夸夸團”的團友之多:只要點進一位員工的x賬號,就大概率能順著各種"套娃式"轉發,連環點進其他幾位同事夸贊o3的推文里。
搞得我們都懷疑奧特曼是不是下達了什么指標,把增加o3曝光度也算進員工KPI里。
在微軟研究院工作了十年、曾擔任AI副總裁及杰出科學家的知名計算機大佬Sébastien Bubeck,于今年10月入職了OpenAI。他在置頂推文中坦言,o3和o3-mini是自己截至目前最喜歡的模型,o3各項評估簡直封神,特別是前沿數學25%的測試成績。
領導過GPT-4o預訓練和o1開發的研究員Aidan Clark更是連發五條,激贊“Hongyu 真得太厲害了”,表示o3-mini是第一個讓他真正能提出難題的模型。
專注GPT增長的技術團隊成員Anshita Saini說,o3給人的感覺很不一樣。整個o3系列的理念會讓她停下來思考“一個將AGI產品化的世界是什么樣子”。
研究人員在線剖析
除了以上這種直給式力挺,還有一些OpenAI研究員承擔了答疑解惑的角色,試圖通過分享觀點來澄清一些問題。
o3和o3-mini的發布給社區帶來振奮的同時,也引發了一些爭議和質疑。有人因為ARC-AGI的測試結果歡呼AGI近在咫尺,甚至已經實現;也有人嗤之以鼻,對o3高昂的算力需求和運營成本表示擔憂,吐槽這不過是又一個"畫餅"產品。
對此,OpenAI多模態推理研究員Noam Brown發文表示:外界對ARC-AGI測試的反應有些過度,突破ARC-AGI基準并不意味著模型已達到AGI水平。他還提到了AI領域的一個普遍現象:人們往往認為某個基準測試需要"超智能"才能完成,但當真的有模型攻克這個基準時,人們又會因為它沒有達到預期中的"超智能"水平而感到失望。
言外之意:請理性對待,不要捧殺。
OpenAI API工程主管Sherwin Wu對此深表贊同,Sherwin提醒社區:比起ARC-AGI測試,o3在編程和數學上的突破才更值得關注——o3的編程水平已經超越了自己,而o3能答對四分之一的前沿數學題目自己更是一道都解不出。
另外,針對o3模型是否使用特定數據集、通過特定領域優化、或人為調整提示格式來提高評估結果的質疑,公司研究員Brandon McKinzie和Rhythm Garg相繼回應:
評估中使用的arc-agi公共訓練集僅是更大o3訓練數據的一小部分,無法決定模型表現;o3是通用模型,未進行任何特定領域的微調;ARC-AGI高分并非依賴調整提示,而是模型通用性和訓練結果的自然體現。
關于o3的高昂價格,研究員Nat McAleese這樣解釋:雖然o3是目前測試階段成本最高的模型,但它開啟了一個"用計算換性能"的新時代。通過增加測試階段的計算量,o3將模型性能提升到了一個"令人難以置信的水平"。
Nat認為,盡管目前確實很貴,但隨著技術進步,token價格會逐漸降低。更關鍵的是,團隊已經找到了一種能夠高效地將計算量轉化為性能提升的方法,這預示著未來AI模型的能力還將大幅提升。
最后是OpenAI模型訓練速度的問題。在中文社區頗有影響力的Jason Wei表示:從o1到o3的升級僅用了三個月時間,證明了基于思維鏈的強化學習新范式,比傳統預訓練方式每1-2年才能推出一個新模型的節奏要快得多。
連OpenAI日本辦公室總裁Tadao Nagasaki也出來捧場:“我們不是才在九月份發布了 o1?現在已經開始對o3 早期評估了!”
2 集體營業要傳達什么信息
這次OpenAI員工集體為o3發布背書,首先是出于對產品的高度自信。通過不同角度的解讀,他們希望外界能夠更全面地了解o3在數學、編程和推理方面的突破性成就。OpenAI有意向外界展示:自己依然是AI技術的領導者,在競爭者四起的市場上存在感依舊。
此外,在當前OpenAI面臨外界質疑、競爭壓力加劇的關鍵時間點,加之核心員工頻繁流失以及“吹哨人”風波的影響,全員營業也帶有了些許“抱團取暖”的意味。他們試圖借這次發布向社區傳遞幾個信號:
1. 擴展法則有新突破
多位OpenAI研究員指出,o3和o3-mini驗證了增加計算資源、數據量和模型參數確實能帶來顯著性能提升,并且突破了傳統擴展法則“遞減效益”的限制,證明模型在未來仍有巨大的提升空間。
2. 技術創新沒有“撞墻”
員工們通過轉發測試數據和詳細解讀,強調o3系列的理念和性能突破了許多人對AI模型邊界的想象,不僅在性能上取得了超越預期的突破,也展現了更廣泛的適用性。相比外界對GPT-5“難產”的傳言,OpenAI想證明他們正在開辟另一條創新之路。
3. 訓練速度并未放緩
面對外界關于OpenAI模型迭代速度的質疑,特別是在全球AI競爭日益激烈的背景下,從o1到o3的迅速升級成了明確回應。表明OpenAI有能力突破傳統預訓練1-2年的開發周期,以更快的速度推出高質量模型,穩固市場信心。
回過頭看,從上線o1正式版到官宣o3,這12天技術直播更像一場聲勢浩大的OpenAI大秀。去年這個時候,那場震撼全網的"OpenAI is nothing without its people"全員聲援才剛剛落幕。一年過去,OpenAI不能說不好,卻也不復曾經GPT時的巔峰輝煌。在經歷了各種高低曲折后,或許每位員工都想在年底拼一把來make OpenAI great again。
本文鏈接:http://www.albanygandhi.com/news-23-149803.htmlOpenAI員工在推特上,像極了上班的你
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
最小、最輕、最快的微型機器人來了
【解讀】《關于調整減免車輛購置稅新能源汽車產品技術要求的公告》解讀
【解讀 】《關于調整本市人力資源服務業務部分經辦政策有關問題的通知》
【解讀】提升專利質量促進轉化運用——《專利轉化運用專項行動方案(2023-2025年)》看點解析
【解讀】為加工貿易注入發展新動能——海關總署詳解推動加工貿易持續高質量發展16條改革措施
關于進一步做好2023年綜合運輸春運后半程疫情防控和運輸服務保障工作的通知(聯防聯控機制春運發電〔2023〕5號)
2024年載人航天工程發射任務啟幕 天舟飛船解鎖3小時“速運”模式
【征集】關于組織開展“無廢園區”“無廢企業”典型案例征集工作的通知(工信廳聯節函〔2024〕16號)
北京經濟技術開發區支持高精尖產業人才創新創業實施辦法(2.0版)
門頭溝區開展“一業一證”改革工作方案
大吉大利:深圳南山區代還信用卡可長期合作,高效便捷服務
海闊天空:蘋果id貸必下,2024正規蘋果id貸款口子
代購曝光 孟加拉白盒奧希替尼代購方法 孟加拉9291不出國購買價格便宜多少錢
干頭萬緒:羊小咩最簡單套現方法?-?推薦三個操作方法
流程:白條額度能全套出來嗎,一文知曉最新提現方法-知者
龍鳳呈祥:惠州代還信用卡墊還,可長期合作,多年經驗誠信
大吉大利:深圳墊還信用卡,多年經營,值得信任
通知:京東白條怎么把錢取出來《最新白條操作步驟簡單》開始
四種方法:羊小咩便荔卡包哪里取出來靠譜小白必備:
厚積薄發:DY月付怎么套出來 - 推薦十個操作方法