互聯(lián)網(wǎng)時代的杰作是「連接」,人工智能時代的標志是「決策」。——在過去的一個月,對于人工智能時代的定義區(qū)分,大多數(shù)行業(yè)人士在大模型的創(chuàng)造力上找到了答案。
舉個例子,為何大數(shù)據(jù)與機器學習算法的結(jié)合早已出現(xiàn),過去的十年(2012年到2022年)卻仍然停留在互聯(lián)網(wǎng)時代,而 ChatGPT 的出現(xiàn)卻勾畫出了人們心中所想的人工智能時代呢?
這背后的本質(zhì),概括來說,其實是 AI 算法能對生產(chǎn)力產(chǎn)生多大的影響。所謂「生產(chǎn)力」,形象的說法是機器與人的 ROI 比例區(qū)分,而大數(shù)據(jù)與過去統(tǒng)計學習、小模型深度學習的結(jié)合,沒有在生產(chǎn)過程中明顯降低人力的投入。例如,過去十年全球 AI 研究者在計算機視覺的探索上,扮演了高凈值的「科技民工」角色,AI 生產(chǎn)即使注入高門檻的科技屬性,也還沒有擺脫堆人力的「勞動密集型」屬性,因此 AI 生產(chǎn)力的釋放有限。
但在 GPT-3 為代表的大模型風潮中,大模型解決多項任務(wù)的「通用」表現(xiàn)讓 AI 第一次有了從項目交付跨向平臺賦能的可能,有效控制成本、提高收益,并在ChatGPT 的產(chǎn)品設(shè)計創(chuàng)新中爆發(fā)大規(guī)??尚行?、在 GPT-4 中愈加彰顯「通用人工智能」(AGI)潛力。借助大模型,AI 的落地由此第一次稱得上「智能」生產(chǎn)力,AI 時代來臨。
比方說,ChatGPT 較于互聯(lián)網(wǎng),一次「詢問」的搜索,互聯(lián)網(wǎng)產(chǎn)品的反饋結(jié)果是一條條檢索信息,需要用戶花大量的時間去篩選、甄別;而人工智能產(chǎn)品,如 ChatGPT,是基于檢索信息做「決策」性的整合,一鍵生成匹配用戶詢問的答案,節(jié)約了大量的時間成本,以及人力成本。
然而,我們只停留在基于大模型的單一「產(chǎn)品形態(tài)」(如對話形態(tài)的通義千問、ChatGPT...)上是沒有意義的。如果只將想象力放在「溝通」上,那么容易走 Siri 為代表的對話產(chǎn)品老路。對于人機對話,過去 AI 領(lǐng)域的研究學者囿于「改善溝通語氣」的目標上,導致了上一代智能對話產(chǎn)品更多局限于情感慰藉的效果;而 OpenAI 的研究者率先注意到更背后的需求:「溝通」是為了提升解決問題的效率,所以他們將大模型的語言理解與生成能力,與對話做了結(jié)合,創(chuàng)造出了 ChatGPT。
由此再看 OpenAI 的通用人工智能路徑:2020年推出的 GPT-3 是大模型的技術(shù),2022年推出的 ChatGPT 是基于大模型的產(chǎn)品形態(tài),2023年與可口可樂等企業(yè)合作則是基于大模型的「生態(tài)」創(chuàng)造。據(jù) EnterpriseAppsToday 統(tǒng)計,截止 2023 年 1 月, OpenAI 已跟科技、教育、企服、制造、金融、零售等等行業(yè)的 902 家企業(yè)形成合作關(guān)系。技術(shù)-產(chǎn)品-生態(tài)是 OpenAI 的三部曲,其中,生態(tài)是 OpenAI 跑進人工智能時代的最后一公里。
目前,國內(nèi)絕大多數(shù)的關(guān)注點聚焦在類 ChatGPT 的「產(chǎn)品」形態(tài)上,也就是第二步。但實際上,從2017年谷歌推出 BERT 以來,Transformer引領(lǐng)的大模型研究就已在中美兩國如火如荼展開,又在 2020 年GPT-3 的爆紅中吸取了堆數(shù)據(jù)、堆算力的訓練啟示,因此,早已進入大模型賽道的各家巨頭,如海外的微軟、谷歌,以及國內(nèi)的阿里幾乎處于同一起跑線。ChatGPT 雖然帶來產(chǎn)品的創(chuàng)新,但技術(shù)含量并非不可超越,因此國內(nèi)的科技巨頭也很快成功追趕上,比如阿里、百度、智譜甚至360,都能很快推出自己的類 ChatGPT 產(chǎn)品。
但論最終「生態(tài)」的競爭,究竟誰更有優(yōu)勢?背后其實是綜合能力的較量。而綜合能力,比拼三點:一是應(yīng)用大模型的基礎(chǔ)設(shè)施;二是先有落地場景與平臺的比拼;三是降本增效的工程能力。囿于綜合能力的限制,「生態(tài)」遲遲未在國內(nèi)開展。
直到今天。
剛剛兼任阿里云智能集團CEO的張勇(花名:逍遙子)在阿里云北京峰會上放出重磅消息:阿里所有的產(chǎn)品都將用「通義千問」大模型改造。此外,阿里云智能集團CTO周靖人稱,通義千問將基于阿里云基礎(chǔ)設(shè)施向企業(yè)開放,企業(yè)可以在阿里云上訓練企業(yè)自己的行業(yè)、垂類大模型。到這個時候,中國 AI 行業(yè)者才第一次嗅到應(yīng)用大模型的春風,國內(nèi)大模型的逐趕者才意識到:
中國大模型「生態(tài)」的角逐,被阿里云領(lǐng)先了一個身位。
大模型在前,應(yīng)用在后如何從互聯(lián)網(wǎng)時代邁入人工智能時代?
過去數(shù)月,這是威脅中國互聯(lián)網(wǎng)時代利益既得者的最核心問題。不同于直播帶貨對傳統(tǒng)電商平臺的沖擊,前者是在同一個范式(互聯(lián)網(wǎng))下的競爭,大模型產(chǎn)品 ChatGPT 的「一鍵搜索與生成」能力代表的是人工智能對信息鏈接的降維打擊。
解決這個心頭大患,中國的互聯(lián)網(wǎng)創(chuàng)業(yè)者快速經(jīng)歷了兩波發(fā)展:一,下場做大模型,如王小川、王慧文、李志飛等人;二,基于大模型做產(chǎn)品應(yīng)用創(chuàng)新,如 Adobe、金山辦公等沒有大模型發(fā)電廠的團隊。
加上微軟應(yīng)用 OpenAI 大模型能力的啟示,互聯(lián)網(wǎng)邁向人工智能的第一步最終選擇了一條顯而易見的道路:互聯(lián)網(wǎng)連接平臺的升級,例如:大模型+搜索,出現(xiàn)微軟的New Bing、谷歌的 Bard;大模型+辦公,出現(xiàn)微軟的Copilot。這些產(chǎn)品都可以視為 Bing、谷歌搜索、MS Office 的 3.0 作品(PC互聯(lián)網(wǎng)時代是1.0,移動互聯(lián)網(wǎng)時代是2.0,人工智能時代則是3.0)。
毫無疑問,國內(nèi)大模型的落地場景也首先會出現(xiàn)在各類先有的互聯(lián)網(wǎng)產(chǎn)品上。而BAT、美團、字節(jié)等擅長打平臺戰(zhàn)的企業(yè)對此都有需求,然而,并非每個互聯(lián)網(wǎng)巨頭都有通用大模型的技術(shù)積累。同理,新一輪的 AI 浪潮中,擁有大模型積累的創(chuàng)業(yè)公司不具備成熟的互聯(lián)網(wǎng)產(chǎn)品。因此,在這一局中,這一輪領(lǐng)跑者必須具備兩個條件:一是大模型,二是落地場景。
而如上所述,大模型的較量中,大廠之間只要具備算力、數(shù)據(jù)與算法,效果沒有本質(zhì)上的差距,百度有文心、阿里有通義(包括M6/PLUG)、華為有盤古……所以決勝點之一就是應(yīng)用的數(shù)量與質(zhì)量。所以,當張勇表示阿里巴巴集團旗下全系產(chǎn)品都將接入 AI 大模型時,阿里云峰會的臺下觀眾沸騰了——
阿里系產(chǎn)品家族:
- 電商:天貓,淘寶,速賣通,閑魚
- 出行:高德,飛豬
- 娛樂:優(yōu)酷,淘票票,靈犀互娛,大麥,西瓜影視,微博
- 生活:餓了么,淘鮮達,盒馬
- 搜索:UC瀏覽器
- 辦公:釘釘
- 家居:天貓精靈……
OpenAI 沒有大規(guī)模產(chǎn)品形態(tài),因此第一階段只能依靠微軟的應(yīng)用產(chǎn)品來釋放大模型的生產(chǎn)力,如落地成 NewBing 與 Copilot。其余大模型的競爭者還停留在技術(shù)與產(chǎn)品打磨的第一或第二階段,生產(chǎn)力的釋放也仍受到客觀局限。兼?zhèn)浯竽P图夹g(shù)(通義)、產(chǎn)品(通義千問)與應(yīng)用(釘釘、天貓精靈等)的阿里,很自然地沖到了「生態(tài)」前面,成為獨立締造生態(tài)的玩家(區(qū)別于微軟與OpenAI的聯(lián)手締造)。
阿里云北京峰會上,接入了「通義千問」大模型技術(shù)的釘釘,首次打開了國內(nèi) AI 時代智能產(chǎn)品的想象力——
新一代的釘釘向智能辦公邁進:針對辦公會議,釘釘可以在會議結(jié)束后自動生成會議紀要與待辦事項;針對日常辦公的文本寫作,釘釘可以自動生成活動策劃、會議策劃等工作流程方案,以及文生圖;針對群聊,釘釘可以自動生成群聊的聊天要點;針對開發(fā),釘釘可以拍一張功能草圖自動生成小程序……
在過去,文本總結(jié)、文本生成、文本翻譯、文生圖等等都是自然語言處理(NLP)中的一個個細分方向,大模型出現(xiàn)之前,NLP 研究者是各自選擇一兩個細分方向深耕,雖然各有精辟,但在落地上成本與效益不匹配,類似大炮轟小鳥;但大模型出現(xiàn)后,一個大模型就可以解決總結(jié)、生成、翻譯等等多項任務(wù),落地也就轉(zhuǎn)為了高速公路的思路:雖然建設(shè)成本高,但覆蓋用戶廣、使用頻率高,就具備了商業(yè)可行性。
在未來,用大模型做單個產(chǎn)品的智能升級,將成為行業(yè)趨勢,我們可以拭目以待。
和其它團隊不同的是,阿里最大的優(yōu)勢是其場景豐富,覆蓋電商、出行、娛樂、生活、辦公、搜索等等品類,使其在大模型產(chǎn)品形態(tài)的創(chuàng)新上為「生態(tài)」做了更進一步的鋪墊:
以「幫我制定一份五一出游攻略」的問題為例,若詢問 ChatGPT,用戶只能得到一份關(guān)于機票、酒店、當?shù)亟煌ā嬍车鹊确矫娴奈淖只卮?;而詢問「通義千問」,用戶不僅可以得到一份文字版的攻略,未來還能相應(yīng)獲取基于阿里產(chǎn)品生態(tài)及其外圍合作商家所提供的機酒飲食娛樂等真實產(chǎn)品與服務(wù):
阿里旗下每個應(yīng)用單個拎出來均扛打,對其在「AI 生態(tài)」第一階段的布局至關(guān)重要。
同時,阿里因為從 2019 年開始關(guān)注 Transformer技術(shù)做預訓練大模型的探索,在大模型技術(shù)上有深厚積累,推出全球首個萬億級參數(shù) M6 大模型,又率先在多模態(tài)方向上探索出通義系列大模型,為其本身應(yīng)用軟件的迭代升級做足了技術(shù)儲備,相輔相成。
表面上看,這是阿里借助 ChatGPT 的一次領(lǐng)跑,但追根溯源,還是其打磨垂類產(chǎn)品、堅持大模型研發(fā)多年的厚積薄發(fā)。阿里入局大模型角逐,沒有停留在單一的產(chǎn)品形態(tài)上,而是率先將重心放在縮小 AI 大模型與影響行業(yè)之間的鴻溝上,是其能領(lǐng)跑大模型「生態(tài)」的原因所在。
不能被忽視的「 AI 基礎(chǔ)設(shè)施」
用大模型將旗下所有產(chǎn)品進行一次改造,是阿里從技術(shù)、產(chǎn)品邁向生態(tài)的第一步。
但一個完整生態(tài)的形成不能光靠阿里一家。「開放才能共贏」——這個觀點在文生圖模型 Stable Diffusion 憑借開源趕超 OpenAI 的 DALL·E 2.0 上得到了驗證,在 HuggingFace 為代表的 AI 模型開源社區(qū)中也得到了驗證,因此,國內(nèi)的科技巨頭如百度、阿里、華為在大模型角逐中也強調(diào)這一點。
如張勇所言,面向智能時代,所有的公司都在同一起跑線上。以通用人工智能(AGI)為中心的 AI 時代才剛剛拉開序幕,大廠也好,創(chuàng)業(yè)公司也好,大模型應(yīng)用創(chuàng)業(yè)者也好,如何跑完「降本增效」的最后一公里才是最終華山?jīng)Q勝的關(guān)鍵所在。
我們必須認識到技術(shù)發(fā)展的一個客觀需求:大模型的成熟,不是單一算法的勝利。與訓練大模型的框架、算法同樣重要的,還有計算、開發(fā)、服務(wù)等配套設(shè)施。「平民版」大模型是科學家挑戰(zhàn)自己的主觀命題,也是大模型落地行業(yè)的客觀需求。
「盡管谷歌在這波大模型產(chǎn)品創(chuàng)新中落后 OpenAI 與微軟,但我們不得不肯定它的一點是,谷歌做大模型會從底層架構(gòu)(如 Pathways)、算力設(shè)施(如 TPU)等多方面投入,配合降低大模型的研發(fā)成本。研發(fā)成本低,最終基于大模型的產(chǎn)品應(yīng)用成本才能低?!挂晃恍袠I(yè)人士告訴雷峰網(wǎng)。
換言之,大模型的底層基礎(chǔ)設(shè)施決定了它的能力下限,同時又決定了它的應(yīng)用上限。
從阿里云北京峰會的發(fā)布重點來看,「通義千問」更像是阿里研究大模型過程中的一個中間形態(tài),而非終點。在云計算、互聯(lián)網(wǎng)應(yīng)用(如釘釘、天貓精靈)與魔搭社區(qū)等等成果的加持下,諸如「通義千問」的大模型成為鏈接行業(yè)的重要一環(huán)。
大會現(xiàn)場,周靖人表示,每個企業(yè)都能在阿里云擁有一個專屬的「大模型空間」,既可以調(diào)用「通義千問」的 AI 能力,也可以結(jié)合企業(yè)自身的行業(yè)知識與應(yīng)用場景,訓練出獨有的「企業(yè)專屬大模型」。換言之,阿里也要做 AI 時代的「發(fā)電廠」,成為給各個企業(yè)提供電力。
AI 浪潮來臨,大模型的能力有目共睹,這衍生出一系客觀的行業(yè)事實:
首先,不僅是阿里自己,相信國內(nèi)大部分的公司都會用 AI 大模型將先有的軟件升級一遍,這無疑會引發(fā)訓練與推理大模型的算力需求井噴。但另一方面,國內(nèi)大多數(shù)公司沒有能力自建大模型訓練的基礎(chǔ)設(shè)施;即使對于許多行業(yè)頭部企業(yè),訓練大模型的費用也高于預期,對成本與效率的需求需要平衡。
千億級參數(shù)的大模型研發(fā),不是單一的算法問題,而是囊括了底層算力、網(wǎng)絡(luò)、存儲、大數(shù)據(jù)、AI 框架、AI 模型等復雜技術(shù)的系統(tǒng)性工程問題,需要 AI 與云的全棧技術(shù)能力;云服務(wù)來看,AI 基礎(chǔ)設(shè)施需要超大規(guī)模且超高性能的算力底座,這又指向公共云是最佳載體。
阿里云則早已鍛造了強大的基礎(chǔ)設(shè)施:
在IaaS層,阿里云自建的「飛天智算平臺」是目前國內(nèi)規(guī)模最大的智算中心,單集群可達10萬臺規(guī)模,千億級文件數(shù),EB級別存儲空間,千卡并行效率達 90%,可以解決計算擁堵問題,提升計算效率。在PaaS層,基于飛天智算的阿里云深度學習平臺PAI,可將計算資源利用率提高 3 倍以上,AI 訓練效率提升 11 倍,推理效率提升 6 倍。
在技術(shù)創(chuàng)新和規(guī)模效應(yīng)的加持下,阿里云則將普惠推向了極致,據(jù)張勇介紹,跟十年前相比,阿里云提供的算力服務(wù)價格降低了 80%,存儲服務(wù)的價格降低了接近 90%。
在阿里云北京峰會上,周靖人還發(fā)布了一個致力于「大模型生態(tài)」建設(shè)的計劃——「飛天免費計劃」,讓開發(fā)者免費試用云上開發(fā)大模型應(yīng)用來解決業(yè)務(wù)問題。
周靖人稱,阿里在擁抱「Serverless」(去服務(wù)器化)的概念,同時推出了一款新的彈性計算產(chǎn)品,叫「U 實例」。U 實例具有通用計算特征,能夠聚合當前多種服務(wù)器的規(guī)格,無需開發(fā)者進行繁瑣的資源匹配,可以降低生態(tài)伙伴在應(yīng)用大模型開發(fā)過程中使用彈性計算的門檻,促進云上的大模型應(yīng)用開發(fā)。
在IaaS和PaaS之上,阿里的另一個殺手锏是MaaS(Model as a service),作為業(yè)界首個提出這一理念的企業(yè),阿里在去年云棲大會發(fā)布了國內(nèi)首個 AI 模型開源社區(qū)——魔搭(ModelScope)。而這也被認為是鏈接大模型、開發(fā)者及下游應(yīng)用的關(guān)鍵一環(huán)。
不久前,微軟亞洲研究院與浙江大學的研究團隊將 ChatGPT 與 HuggingFace 結(jié)合,推出了大模型的一個新玩法,叫「HuggingGPT」。HuggingGPT 將大模型產(chǎn)品形態(tài)化作一個控制器,背靠模型開源社區(qū)HuggingFace,用戶在前端提問,大模型可以調(diào)用 HuggingFace 里在這個問題上表現(xiàn)最好的開源模型去解答。本質(zhì)上,這是大模型+開源項目的聯(lián)手勝利。
同樣地,阿里推出「通義千問」后,「通義千問+魔搭社區(qū)」也打造了類似的模式。在魔搭社區(qū)上,不僅僅是阿里在開放AI模型,還有智譜 AI 等知名大模型團隊均在魔搭社區(qū)上貢獻了自家模型,目前,社區(qū)模型量已超過800 個,總用戶量超 100 萬,模型總下載量超 1600 萬。
通義千問發(fā)布后,阿里也給開發(fā)者開放了 API。企業(yè)與個人開發(fā)者都可以登陸阿里靈駿平臺獲取 API 鑰匙,快速訪問「通義千問」,調(diào)用通義千問的大模型能力,這樣可以幫助應(yīng)用開發(fā)者以更低的成本、更少的訓練數(shù)據(jù)實現(xiàn) AI 場景應(yīng)用創(chuàng)新。
阿里的態(tài)度很明確:
在 AI 大模型時代,他們要做對基礎(chǔ)設(shè)施要求更高的通用大模型,如通義大模型,并基于通用大模型做通用類的大模型產(chǎn)品形態(tài),如「通義千問」。做好自己的「本分」后,阿里率先升級自家產(chǎn)品,一是彰顯通義大模型技術(shù)和產(chǎn)品的落地可行性,二是帶領(lǐng) AI 大模型生態(tài)的繁榮。
同時,外部企業(yè)可以基于通義大模型訓練各自行業(yè)的「垂類大模型」。行業(yè)垂類大模型同樣存在壁壘,如「高質(zhì)量的行業(yè)數(shù)據(jù)、足夠深入的行業(yè) Know-How、先發(fā)布局的試點驗證」,企業(yè)結(jié)合自身業(yè)務(wù)特點在通用大模型的基礎(chǔ)上精調(diào)行業(yè)模型,開發(fā)出可以產(chǎn)生實際價值的應(yīng)用,才是大模型走向行業(yè),AI 生態(tài)最終形成的序曲。
仰望星空
先有「云原生」,爾后有「智能原生」。
無論是技術(shù),產(chǎn)品還是生態(tài),中國的大模型仍處于起步階段。技術(shù)上,與 GPT-4 相比,國內(nèi)的大模型研發(fā)仍存在一定差距。但依賴用戶、數(shù)據(jù)與場景的優(yōu)勢,大模型的生態(tài)正在迅速發(fā)展。無論是 3 月百度文心一言的領(lǐng)跑,還是四月大模型技術(shù)的集中發(fā)布,中國的技術(shù)創(chuàng)新者都感受到了猶如十年前移動互聯(lián)網(wǎng)剛起來的火熱。
我們迎接人工智能時代的第一步,是對大模型產(chǎn)品的好奇心;第二步,則是對大模型產(chǎn)品的應(yīng)用,也是在這一步,AI 的「生態(tài)」開始形成——大模型成為生產(chǎn)力,改變生產(chǎn)關(guān)系,必然要走向?qū)嶋H、影響具體行業(yè)。
締造一個新的時代——這是一個龐大的事業(yè)。因此,在大模型「生態(tài)」的締造上,每個人都能找到自己的位置。借助「通義千問+」、云基礎(chǔ)設(shè)施與模型開源的理念,阿里首先撕開了「生態(tài)」的口子,在智能商業(yè)平臺的顛覆上做了表率啟示,也在技術(shù)底座上傳達了「服務(wù)者」的心態(tài)。
有人說這是 ChatGPT 加劇了 SaaS 的寒冬,但也有人說,「通用大模型+垂類大模型」的打法恰恰是利好行業(yè)服務(wù)者。大模型的「功能集成」與「一鍵解答」思想,恰恰是實現(xiàn)降本增效的手段啟示。
阿里的大模型在短時間內(nèi)歷經(jīng)技術(shù)、產(chǎn)品與生態(tài)三個階段,也間接傳達了市場焦灼的狀態(tài):大模型初步進入工程化階段,基礎(chǔ)設(shè)施、產(chǎn)品創(chuàng)新、工程落地的齊發(fā)力,哪怕錯過一個環(huán)節(jié)(如算力的缺失),晚一個月,也可能被時代的巨浪遠遠甩在后面。阿里率先撬開生態(tài)的口子,是實力的自信,也是行業(yè)發(fā)展需求使然。
對于不具備大模型研發(fā)能力、算力基礎(chǔ)設(shè)施的新一代 AI 淘金者,他們所面臨的內(nèi)外「逼迫」也不亞于互聯(lián)網(wǎng)大廠。每一個不想被時代淘汰的人,在大模型主導的產(chǎn)品革新浪潮中,每一步都變得至關(guān)重要。選擇對的合作伙伴,也變得重要。
AI 的新時代,舉杯歡慶的同時,愿我們跨過險灘,到達新的彼岸。