導讀:ChatGPT發布五天內,該聊天機器人的用戶就超過了100萬人,Facebook用了10個月時間才達到這個里程碑。
1、關于ChatGPT背后的數據
本文開篇之前,先看一組關于ChatGPT爆紅背后的驚人數據。
圖來源:金十數據
2022年11月30日,人工智能領域可能迎來了關鍵時刻。舊金山人工智能公司OpenAI的CEO山姆·阿爾特曼,宣告了這個時刻的來臨。 OpenAI成立于2015年,得到了埃隆·馬斯克、彼得·泰爾和其他PayPal幫成員以及LinkedIn聯合創始人雷德·霍夫曼等一眾硅谷大佬的投資。 11月30日,公司成立約7年后,阿爾特曼發推文稱:“今天我們發布了ChatGPT。歡迎點擊這里與它聊天。”任何人通過推文中的鏈接注冊一個賬號,開始與OpenAI的新聊天機器人免費聊天。
2、深入學習ChatGPT資源(可下載)
github.com/dalinvip/Awesome-ChatGPThttps://github.com/chenweiphd/ChatGPT-Hub
3、ChatGPT誕生背景介紹
通常在對用戶知之甚少的情況下,ChatGPT生成內容只要大約一秒鐘時間,且它生成的許多內容并沒有想象的那么糟糕。 ChatGPT發布五天內,該聊天機器人的用戶就超過了100萬人,Facebook用了10個月時間才達到這個里程碑。 ChatGPT是一股相關人工智能技術浪潮的一部分,這種技術被統稱為“生成式人工智能”,還囊括了Midjourney和Lensa等熱門藝術生成模型。 OpenAI位于科技行業“下一個大事件”的前沿,具備了一家傳奇初創公司的特征,包括全明星級別的團隊和投資者的熱捧,該公司的估值據稱已經達到290億美元。 該公司最近的突然躥紅引發了嫉妒、猜疑和恐慌。 谷歌(Google)利潤豐厚的搜索帝國可能受到影響。為了應對ChatGPT,谷歌內部已經拉響了“紅色警報”。 OpenAI能成為超強科技公司俱樂部的成員,出乎人們的意料。幾年前,它甚至還不是一家公司,而是一家致力于學術研究的小型非營利性實驗室。 “我認為最好的情況好到令人難以想象……好到談論它的人會令人覺得這人是個瘋子。我認為最糟糕的情況是,我們所有人都死去。”——OpenAI聯合創始人兼CEO山姆·阿爾特曼 OpenAI與微軟(Microsoft)擴大合作的消息于近日公布,微軟將向該公司投資高達100億美元,作為回報,未來幾年,該軟件業巨頭將獲得OpenAI的大部分利潤。 37歲的聯合創始人兼CEO阿爾特曼,充分體現了OpenAI謎一樣的特性。 作為一位資深科技創業者,阿爾特曼更為人們所熟知的是他出色的商業才能,而不是其工程技術成就。他是OpenAI估值暴漲的推手,也是給該技術潑冷水的主力。 他曾公開表示ChatGPT距離真正可靠仍有很大差距。同時,他認為,該技術是實現公司使命的重要一步。 該公司有一個堂吉訶德式的使命,即開發一種計算機超級智能,又稱通用人工智能(AGI)。 對于一家營利性的企業而言,這種指導理念不同尋常,尤其是有些計算機科學家認為阿爾特曼的執念純屬幻想。 通過發布ChatGPT,阿爾特曼將OpenAI及其宏大的人工智能使命,變得令整個科技界為之著迷。 問題的關鍵在于,他與微軟的合作能否解決ChatGPT的缺點,利用其先發優勢改變整個科技行業。
谷歌和其他科技業巨頭紛紛在加大力氣開發各自的人工智能平臺;未來,更完善的軟件可能使ChatGPT看起來如同兒戲。 OpenAI總有一天可能會發現,它的技術突破開啟了未來的大門,這個未來卻與它無關。
1
1月中旬一個星期四的晚上,阿爾特曼在舊金山罕見地公開露面。 他上身穿灰色針織衫,下身穿藍色牛仔褲,腳蹬一雙時髦的亮色扎染運動鞋,走進一個擠滿投資者、技術人員和記者的房間。 所有人都想收集與ChatGPT或近期融資有關的信息。
當StrictlyVC創始人康妮·洛伊佐斯詢問他,對于公司引起媒體轟動的看法時,阿爾特曼回答稱:“我不看新聞,實際上我不太關注媒體的報道。” 活動在賽富時大廈(Salesforce Tower)的46層召開,房間內座無虛席。阿爾特曼似乎有意在給這種熱烈的氛圍降溫。 他表示:“它們的表現令人印象深刻,卻并不可靠。所以你在使用第一版演示版的時候,會產生一種非常深刻的反應:‘哇,真是不可思議,我已經迫不及待了’。在用過一百次之后,你就會發現它的缺點。” 這種謹慎似乎代表了OpenAI總部的官方態度。 該公司總部位于舊金山教會區的一家舊行李箱工廠。OpenAI在幾個月前,幾乎要叫停ChatGPT項目。 ChatGPT的聊天界面,支持用戶以簡單的英語(和其他多種語言)與人工智能對話,OpenAI最初的設想是,將這個界面作為完善其“大語言模型”(LLM)的一種方式。 大多數生成式人工智能系統核心,都有一個大語言模型。 大語言模型是將非常龐大的神經網絡,應用于大量人為創建文本所生成的。 神經網絡是大致基于人腦內部神經連接的一種人工智能。
模型從這個數據庫中學習一個復雜的統計學概率圖,代表了任何一組單詞在特定語境下相鄰出現的統計學概率。 這樣一來,大語言模型就可以執行大量自然語言處理任務,例如翻譯、總結或寫作等。 OpenAI已經創建了全世界最強大的大語言模型之一。
該模型名為GPT-3,由1750億個統計性聯系組成,在約2/3互聯網、整個維基百科和兩個大型圖書數據集中進行訓練。 OpenAI發現,GPT-3很難準確提供用戶想要的結果。 一個團隊提議使用“強化學習”系統完善該模型,“強化學習”是從試錯中學習以取得最大化回報的人工智能系統。 2022年初,該團隊開始開發這款聊天機器人,也就是后來的ChatGPT。 開發完成后,OpenAI邀請貝塔測試人員對其進行了測試。
據OpenAI聯合創始人兼現任總裁格雷戈·布洛克曼表示,測試人員的反饋卻令OpenAI失望;人們不知道該與聊天機器人交流哪些內容。 OpenAI一度改變了策略,嘗試開發專業聊天機器人,希望為特定領域的專業人員提供協助。
這個項目也遇到了問題,部分原因是OpenAI缺少訓練專業聊天機器人的合適數據。 2022年10月25日,OpenAI首席技術官米拉·穆拉蒂參加《特雷弗·諾亞每日秀》 來源:COURTESY OF MATT WILSON/COMEDY CENTRAL’S “THE DAILY SHOW”
布洛克曼表示,OpenAI決定孤注一擲,對外發布ChatGPT,交給用戶使用,任其自由發展。布洛克曼表示:“我承認,我當時的立場是,不知道它是否會成功。” OpenAI的高管表示,這款聊天機器人的突然爆紅,令公司措手不及。 其CTO米拉·穆拉蒂表示:“這令我們非常驚訝。”在舊金山召開的風險投資活動上,阿爾特曼表示,他的“預期可能要低一個量級——它所引起的熱度低一個量級。”
2
OpenAI還有更多創新蓄勢待發。 OpenAI在貝塔測試版GPT-4中采用了更強大的大語言模型,預計該版本將于今年甚至很快發布。阿爾特曼也表示,公司正在研發一款可根據文本描述生成視頻的系統。 在1月中旬,OpenAI表示其計劃發布ChatGPT的商業版。付費用戶可通過一個界面使用聊天機器人,更容易將其整合到自己的產品和服務當中。 可以確定的是,ChatGPT的出現攪動了一個鯊群出沒的水域。
它在風投界掀起了一場狂熱的追逐,風投公司希望利用OpenAI高管、員工和創始人非公開出售股權的機會,獲得該公司的股份。 同時,微軟將在該公司追加投資高達100億美元的消息,剛剛對外公布。 微軟在2016年開始與OpenAI合作,三年前與之建立戰略合作伙伴關系,并宣布投資10億美元。
山姆·阿爾特曼與微軟CEO薩蒂亞·納德拉在位于華盛頓州雷德蒙德的微軟總部合影 來源:IAN C. BATES—THE NEW YORK TIMES/REDUX
據知情人士透露,微軟通過一種不同尋常的投資結構,獲得了巨大的財務優勢。 《財富》雜志掌握的文件顯示,在新投資完成且OpenAI的首批投資者收回初始資本后,微軟將有權獲得OpenAI 75%的利潤,直至其收回130億美元投資,其中包括OpenAI才披露的20億美元投資。 之后,微軟在該公司的持股比例將逐步下降到49%,直至該軟件巨頭獲得920億美元利潤為止。 與此同時,其他風險投資者和OpenAI的員工,將有權獲得該公司49%的利潤,直至利潤達到1500億美元為止。 利潤達到上述上限之后,微軟和投資者的股份,將重新歸還給OpenAI的非營利基金。 要收回投資和實現利潤上限目標,可能需要一段時間。 《財富》雜志掌握的文件顯示,到目前為止,OpenAI只有相對微薄的收入,依舊處在嚴重虧損狀態。 文件顯示,該公司去年的收入預計不足3000萬美元,計算和數據支出預計達到4.1645億美元,人工支出8931萬美元,其他非特定營業費用為3875萬美元。 其在2022年的凈虧損總計為5.445億美元,不含員工股票期權。 OpenAI預測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會快速增長。該公司預測2023年收入2億美元,2024年收入預計超過10億美元。 OpenAI并未預測其支出的增長情況以及何時能夠扭虧為盈。 微軟已開始收獲雙方合作協議的成果。 微軟在其Azure Cloud平臺中,推出了一系列OpenAI品牌的工具和服務,支持Azure客戶使用OpenAI的技術,包括GPT和DALL-E工具。
例如,汽車交易平臺CarMax已經推出了可在這些Azure工具上運行的新服務。 微軟人工智能平臺企業副總裁埃里克·博伊德表示,滿足訓練和運行OpenAI大語言平臺的需求,推動了創新,將使所有Azure客戶受益。 例如,微軟為人工智能創建了其認為全球最強大的超級計算集群,并開發了多種軟件創新,使在這些機器上訓練和運行大型人工智能模型變得更容易。 微軟正在將OpenAI的技術整合到其許多軟件當中。微軟在其搜索引擎必應(Bing)中推出了一款圖片創作工具以及一款新型設計師圖片設計工具,這兩款工具均由DALL-E驅動。 對微軟而言,更大的回報可能是在搜索領域。 科技媒體The Information最近報道稱,微軟計劃將ChatGPT整合到必應,使其能夠為用戶反饋簡潔明了的回答,且使用戶可以通過與聊天機器人對話進行深入探究,而不是逐一查看一列鏈接。 谷歌目前在搜索市場占據主導地位,其全球市場份額超過90%。必應名列第二,市場份額僅有約3%。 在2022年前九個月,谷歌搜索業務的收入為1200億美元,約占谷歌總收入的60%。
ChatGPT或許為微軟動搖谷歌的霸主地位,提供了唯一一次真正的機會。 按照微軟的標準,這些積極的回報非常劃算。
微軟在OpenAI的總投資額為130億美元,確實是一個天文數字,這筆投資占其過去12個月850億美元稅前利潤的15%,卻能獲得一項顛覆性技術的近期控制權,是一筆成本相對較低的交易。 OpenAI和阿爾特曼卻可能要付出不同的代價:微軟的優先任務可能對OpenAI自己的優先任務產生排擠效應,使OpenAI更宏大的使命面臨風險,并且降低助力公司成功的科學家們對其的歸屬感。
3
阿爾特曼從最開始就參與了OpenAI的創立,他直到2019年5月后才擔任該公司CEO。 該公司從一家研究實驗室變成價值數十億美元的現象級企業的過程,充分顯示出阿爾特曼獨特的融資能力,以及以產品為導向的經營理念。 作為OpenAI的領導人,從某種程度上來說,阿爾特曼就是硅谷的典型代表:
年輕的白人男性;堅定專注;精通極客技術;熱衷于效率和生產率最大化;致力于“改變世界”的工作狂。 阿爾特曼從斯坦福大學計算機科學專業肄業,參與創建了一家社交媒體公司Loopt,該公司的應用可以告知用戶好友所在的位置。 該公司在2005年,成為Y Combinator的首批初創公司,阿爾特曼出售該公司所得的收入,幫助他進入了風投界,他創建了一家小型風險投資公司Hydrazine Capital,募資約2100萬美元。 阿爾特曼是一位創業者,而不是科學家或人工智能研究人員,他為人所津津樂道的是極其擅長進行風投融資。
據OpenAI的多位現任和前內部人士爆料,隨著阿爾特曼掌管公司,公司開始轉移業務重心。曾經廣泛的研發議題被精簡,主要專注于自然語言處理領域。 OpenAI首席科學家薩茨科爾和阿爾特曼辯稱,這種轉變的目的是,在目前似乎最有可能實現通用人工智能的研發領域,最大程度增加投入。
有前員工表示,部分原因是這些模型可以迅速投入商業應用。 有員工抱怨,OpenAI創立的目的是不受企業影響,但它很快就變成了科技界巨頭的工具。
OpenAI也變得不再像以前那么開放。 該公司已經開始以擔心其技術可能被濫用為由,收回此前做出的公開所有研究和將代碼開源的承諾。OpenAI僅通過API提供其先進模型,保護了自己的知識產權和收入流。 OpenAI表示相比其他人工智能實驗室,其會繼續公布更多研究成果。 公司還為重心向產品轉移的做法進行辯護。CTO穆拉蒂說道:“你不能只在實驗室里開發通用人工智能。”她主張,發布產品是了解人們希望如何使用和濫用技術的唯一途徑。 她表示,直到發現人們使用GPT-3進行編程,OpenAI才知道GPT-3最受歡迎的應用是編寫軟件代碼。
同樣,OpenAI最擔心的問題是,人們利用GPT-3生成虛假的政治信息,但事實證明這只是杞人憂天。 穆拉蒂表示,OpenAI希望通過公開其技術,“最大程度降低真正強大的技術可能對社會產生的沖擊。” 薩茨科爾也認為,OpenAI與微軟的合作創造了一種全新的預期,“即我們需要利用我們的技術開發一種有用的產品”,他堅持認為,OpenAI文化的核心并未改變。 他說道,可以使用微軟的數據中心,對于OpenAI的發展至關重要。 布洛克曼也表示,與微軟的合作使OpenAI能夠創造收入,同時不必過多關注商業運營,否則公司可能不得不在商業運營方面投入更多精力。 他說道:“招聘數千名銷售人員,可能會改變這家公司,而與一家已經擁有銷售團隊的公司成為合作伙伴,實際上是非常好的策略。”
批評者表示,OpenAI以產品為導向開發先進人工智能的做法是不負責任的,這相當于向人們發放上膛的槍支,理由是,這是確定人們是否真的會相互射擊的最佳途徑。 紐約大學(New York University)認知科學專業榮譽退休教授加里·馬庫斯,對以深度學習為中心的人工智能開發策略持懷疑態度。 他認為,生成式人工智能“將對社會結構產生切實的、迫在眉睫的威脅”。他表示,GPT-3和ChatGPT等系統,將生成虛假信息的成本降低到接近于零,可能會掀起虛假信息泛濫的狂潮。 馬庫斯表示,我們甚至已經看到了第一批受害者。 程序員發布和回答編程問題的網站Stack Overflow,已經不得不禁止用戶提交ChatGPT生成的回答,這種貌似合理實則錯誤的回答已經令該網站疲于應付。
科技資訊網站CNET開始使用ChatGPT生成資訊文章,后來發現,許多文章存在事實性錯誤。 對有些人而言,真正的風險是ChatGPT能夠編寫準確的代碼。 網絡安全公司Check Point的研究副總裁瑪雅·霍洛維茨表示,她的團隊可以用ChatGPT設計每一個階段的網絡攻擊,包括杜撰一封令人信服的釣魚郵件,編寫惡意代碼,以及逃避常見的網絡安全檢查等。 她警告稱,ChatGPT基本可以讓不懂編程的人成為網絡罪犯。 有無數批評者和教育工作者痛斥,學生很容易使用ChatGPT作弊。
紐約、巴爾的摩和洛杉磯的校區均禁止學校管理的網絡訪問聊天機器人,澳大利亞的一些高校表示,將轉為通過有專人監考的書面考試評估學生。 OpenAI未來能否維持其在語言人工智能領域的主導地位,仍是個未知數。 倫敦人工智能公司Faculty的創始人兼CEO馬克·華納表示:“歷史上,對于這種高度通用的算法,我們所看到的是,它們并沒有達到足夠可靠的程度,能夠保證一家公司獨占全部回報。” 例如,面部識別和圖像識別技術最早的開發者是谷歌和英偉達(Nvidia)等科技巨頭,現在它們已經無處不在。 法院和監管部門,也可能對生成式人工智能所依賴的數據飛輪橫插一腳。
同時,OpenAI的競爭對手并沒有坐以待斃。 據《紐約時報》(New York Times)報道,失去搜索領域主導地位的可能性,已經促使谷歌高管發布了“紅色警報”。 谷歌CEO桑達爾·皮查伊已經多次召開會議,重新制定公司的人工智能策略,計劃發布20款支持人工智能的新產品,并將在今年發布搜索聊天界面的演示版本。 谷歌擁有一款強大的聊天機器人LaMDA,由于擔心一旦該產品被濫用可能影響公司信譽,因此一直未對外發布。
據《時代》雜志稱,現在,公司計劃以ChatGPT為標桿“重新評估”其風險承受能力。 該雜志報道稱,谷歌還在開發一款文本轉圖片的生成系統,與OpenAI的DALL-E等產品競爭。 當然,目前尚不確定聊天機器人是否代表了搜索行業的未來。
ChatGPT經常會杜撰信息,這種現象被人工智能研究人員稱為“幻覺”。它無法可靠地引用其信息來源,或簡單地提供鏈接。現有版本無法訪問互聯網,因此無法提供最新信息。 OpenAI已經公布了對另外一個版本GPT的研究。 該版本名為WebGPT,可以通過查詢搜索引擎和匯總查詢到的信息來回答問題,包括對相關來源的注釋。 阿爾特曼極少在公開場合熱烈討論人工智能。在談到人工智能的時候,他可能聽上去像是一位幻想思想家。 在舊金山舉辦的風險投資活動上,當被問到人工智能的最佳狀況時,他夸張地說道:
“我認為最好的情況好到令人難以想象……好到談論它的人會令人覺得這人是個瘋子。”
編輯:黃飛
評論
查看更多