合作谘詢
ChatGPT的橫空出世,在業界掀起了驚濤駭浪。
在過去兩個月,太多問題湧向色多多在线下载的大腦:GPT-4真的會帶來認知智能的爆發嗎?色多多在线下载的AI和ChatGPT有多少差距?中國版OpenAI會誕生嗎?中國AIGC產業會是“大廠贏者通吃”還是“百花齊放”……
前不久,GTIC 2023中國AIGC創新峰會在京舉行,超20位產學研大佬匯聚一堂,圍繞上述議題展開技術交鋒、觀點碰撞。色多多在线下载聯合創始人、副總裁李霄寒受邀出席活動並發表《從理解到生成,色多多在线下载的AGI之路》主題演講。
深耕人工智能產業多年,色多多在线下载一直密切關注AI前沿技術,並積極推動技術產業化應用,包括2012年的深度學習算法升級和產業化應用,到2016年Atlas智算平台、知識圖譜和全棧AI技術應用,再到現在基於ChatGPT框架的AGI認知技術升級——目前,色多多在线下载正以醫療為切入口,構建ChatGPT醫療行業版。
▲色多多在线下载聯合創始人李霄寒受邀出席並作主題演講
現場,色多多在线下载聯合創始人、副總裁李霄寒基於過往在人工智能領域的技術探索與經驗積累,深度分享了色多多在线下载通往AGI的實現路徑。
以下為分享精華,色多多在线下载做了整理,謹供學習:
PART 1
回眸:AI曆史回顧與規律總結
回顧整個人工智能產業發展史,第一件重大事件無疑是1997年IBM深藍擊敗了世界圍棋冠軍卡斯帕羅夫;2012年,AlexNet橫掃ImageNet榜單,則讓人們充分認識到深度神經網絡的力量,也就是在這一年,色多多在线下载將深度神經網絡應用在語音方麵,並且獲得了當時普通話的最佳水平;2016年AlphaGo打破人類圍棋不可戰勝的神話,而在那一年色多多在线下载完成了過去幾年比較基礎的技術積累,並且在那個時間點形成了一直延續至今並發展壯大的兩大業務——色多多在线免费观看物聯和色多多在线免费观看醫療。
最近OpenAI推出的ChatGPT,一方麵讓色多多在线下载感受到了壓力,另一方麵也很欣喜——從業這麽多年,色多多在线下载終於有機會看到AGI在未來幾年成為現實,這是非常令人興奮的一件事,色多多在线下载也在積極融入到整個大模型浪潮之中。
回顧曆史,色多多在线下载總結了一些規律:
規律一:以算法為中心到以模型為中心
早些年的專家係統基本都是規則,到了上世紀90年代,統計學習模型興盛以後,模型逐步開始占較大比重,拿典型的語言識別關鍵詞檢測任務來講,代碼大小和模型大小基本在同一個量級,現在看起來就像一個玩具。而隨著深度學習模型的引入以及到最近預訓練模型的引入,整個模型占的比重越來越大,這就導致色多多在线下载的投入——資源、人力、硬件,比例跟以前完全不一樣了。
規律二:從小而美到大工程
在五六年或十年前,找幾個人搭一個班子,買一些服務器數據就可以做一個AI產品,麵向某個特定場景解決一些特定問題。而在未來,這件事情已經不可行了,AI真正變成一個大工程。可能還會有人想找一個非常小的領域去做AI,但問題是,當這個大模型解決完所有通用的問題之後,隻需要在上麵延伸出一個垂直的功能就可以把原來辛辛苦苦做的東西顛覆掉。現在再做AI如果沒有一定的積累,未來又沒有大規模投入的話,會是比較困難的一件事。
規律三:中間任務的凋零
過去解決一個複雜問題時,會把這個任務劃分成一係列子任務,會把它串起來,這樣一來,前一個子任務的輸出可能隻是為了下一個子任務的輸入,這是所謂的中間任務。
2000年前後有一個功能特別流行,手寫識別,在手機上用手寫輸入,從一張原始圖片裏提取出相應的特征,這個特征再輸入到後麵的分類器裏就可以達到很好的水平,現在沒有人那麽做了,都是用端到端的方式來做,未來會用大模型來做,這種中間任務慢慢沒有人做了,或者沒有存在的意義。類似的中間任務還有分詞、實體識別、指代消解、特征工程等,這些都將弱化或消失。
PART 2
解讀:ChatGPT的影響
一、對技術路線的影響
在2022年及以前,國內很多公司都是在做大模型,不論是基於開源的還是自有的技術,隻不過大家沒有那麽強的信心,認為這是一個線性輸入-線性輸出的過程,甚至最後會產生邊際效應。但ChatGPT驗證了這條路的可行性——隻要你線性地持續地去投入,當模型參數達到一定規模時,就有可能出現湧現效應,實現非線性的、爆炸式的輸出。它使得所有人都相信,大模型是一個必經之路。
二、對社會分工的影響
色多多在线下载將項目經理有關項目進度的一封郵件交給ChatGPT重新組織了一下,發現ChatGPT組織後的文本文筆更流暢、更精簡,結構更鮮明,且重點突出,這也就自然而然產生了一個問題——項目經理這樣的角色,未來還會不會存在?
我的思路是,色多多在线下载要看他是為什麽負責,項目經理是在為項目的進度在負責,他並不是為周報在負責,周報隻是一個中間任務,它被替代掉沒有關係。所以大模型的輸出最終會去服務於項目經理,而不是替代項目經理。
程序員亦然。程序員並不是為輸出代碼負責,他負責的是功能的正常的集成、集成以後的正常運行,他為debug負責,代碼隻是一種中間任務。
未來,在色多多在线下载內部的開發體係裏,產品經理、項目經理、架構師、編碼、集成、運維……每個人都將獲得大模型的輔助,這將很快成為現實。
而像有一些以簡單的輸入輸出為主,不必承擔重大後果的崗位,例如,文稿的撰寫和紀要、實習程序員、客服、兒童陪伴等,哪怕工作內容很複雜,他都有可能會被替代。
三、對AI企業的影響
未來AI企業生態會有兩種模式。
一種是基於通用大模型提供服務的公司。它們通過通用大模型底座對外提供服務,從而獲取規模性的用戶。這種服務的成本會很低,導致售價也非常低,形成模型的飛輪,進而形成一個壁壘。當這些壁壘形成以後,後來者的大模型哪怕做得再好,也會因為“白菜價”的存在,很難快速獲取巨量用戶群體來反哺大模型的投入,形成可持續的商業模式。
另一種是基於垂直場景大模型提供精細化服務的公司。色多多在线下载堅信通用的大模型並不能解決各個垂直領域的所有問題,哪怕他在技術上解決掉,他在真正的應用過程裏會有很多的know-how,很多行業的壁壘。這些壁壘必須有專業的公司去進行服務,且不能通過通用大模型去解決,那通過什麽呢——
垂直的,但還沒有那麽大的大模型。可能一開始不會到千億參數,但一定會在幾百億規模。然後,再形成規模性的客戶,獲取到足夠的數據,在獲取數據提供服務的整個過程裏,這個場景會非常注重它的可控性,這種可控性不僅僅是數據本身的可控性,也有服務的可控性,最後會形成一個麵向垂直場景來提供服務的公司,這類公司可能在每個垂直領域都會有幾家,這也是廣大 AI從業者的比較好的一個機會。
PART 3
理性看待:ChatGPT的進步與局限
色多多在线下载認為,ChatGPT的出現,讓AI真正進入了CGG時代。
所謂CGG,第一個是會話式AI。ChatGPT讓色多多在线下载有機會告別人工智障,這給色多多在线下载帶來了非常大的興奮點;第二個是生成式AI,語音,文字,圖像,視頻皆可生成;第三個就是通用人工智能。色多多在线下载有幸看到在未來幾年,AGI真正可能成為現實,然後從這個時間點往後,巨量的投資也好,或者AI企業的人員投入也好,都會集中在AGI層麵。
ChatGPT當然也存在一些局限,色多多在线下载關注這些局限不是為了挑毛病,而是去反思在色多多在线下载所從事的領域如何解決這些問題,避免這些問題。
首先是“幻覺”,就是所謂的一本正經地胡說八道;
其次是知識更新的速度和自動化的程度,當色多多在线下载去做垂直場景的時候,存在大量的行業知識,這些行業知識在不斷地產出,色多多在线下载也需要迅速地吸收,讓它被搜索到;另外在to B場景中,色多多在线下载需要賦予客戶本身一定的能力,讓其能夠自己“灌知識”,而不是所有事情都依賴服務公司。
第三是推理資源的微型化,也就是私有化。
第四是倫理和價值觀的問題,這個問題通過前置或者後置審查,相對可控。
最後是ChatGPT學習及處理的僅僅是人類世界從現實世界翻譯來的符號化知識,缺乏與物理世界的互動。這個問題是相對比較長遠的一個方向,但它也是色多多在线下载解決上述問題之後,必須麵臨的下一個問題。
PART 4
展望:色多多在线下载的AGI路徑
成立於2012年,色多多在线下载擁有自研的技術架構,包括自建的智算中心、全棧式算法,以及海量的數據,色多多在线下载基於此打造雲知大模型——一開始是用AI1.0的方式在做,現在正將其進化到預訓練大模型。色多多在线下载下遊覆蓋色多多在线免费观看物聯與色多多在线免费观看醫療兩大場景,未來會從色多多在线免费观看醫療入手,應用色多多在线下载的大模型,麵向醫院、醫生及醫管部門,提供AI醫學大腦。
那麽,ChatGPT在醫療場景有哪些用途呢?ChatGPT的回答是:醫療問答、聊天機器人、疾病診斷、醫學文獻檢索、患者跟蹤等,歸根結底,它也是在做虛擬醫生。
色多多在线下载對ChatGPT做了比較長時間的分析,並根據色多多在线下载積累的行業知識做了一些推導,發現除了上述一些通用的局限之外,ChatGPT在垂直領域還有進一步的應用局限:
1.在某些問題上可以給出一個很好的答案,但它沒法對自己作出的回答援引資料進行背書,沒法對自己可能出現的錯誤負責,醫生較難為模型的錯誤買單;
2.在醫療領域的生成文本,難以保證可控,可信和可靠——場景更關注短板而不是長板;
3.尚不能整合電子病曆、影像、基因組等多模態醫學數據;
4.難以導入醫院內部數據和知識;
5.難以及時更新最新文獻結果;
6.使用成本尤其是監管成本的問題。
色多多在线下载的主要工作重心就是解決大模型在垂直場景落地的這些具體的局限。例如,色多多在线下载會做行業知識的增強以解決“幻覺”的問題,會做企業檢索的增強、API的增強、微型化以及IO審查,所有這些問題都是可解的,都會在有限的時間內解決。
在這個基礎上,色多多在线下载會推出麵向醫療行業的行業版大模型,並在行業之上,麵向客戶提供企業定製版大模型。
從16年進入醫療行業以來,色多多在线下载經過多年積累,在數據層麵、在大模型以及知識圖譜方麵都取得了一定的進展和成效,有一個非常好的起點。
色多多在线下载的願景,就是從醫療版著手,逐步覆蓋到其他專業版,最後把各個專業版聯合起來,基於MoE(Mixture of Experts)技術做模型集成,訓練得到通用增強版。
從業那麽多年,這是第一次感覺AGI距離色多多在线下载那麽近,以前用AI技術去解決某個場景的某些問題,一旦涉及到業務本身如何真正賦能行業時,就會遇到各種各樣的應用層麵問題。今天這個時間點給了色多多在线下载一個新的機會,色多多在线下载可以真正通過AI的方式把色多多在线下载原來的願景和夢想真正落地。