AI開源的未來是如何發(fā)展的?看百度的做法(ai開源的未來是如何發(fā)展的-看百度的做法是什么-)

作者:關(guān)賀宇

AI 開源的黃金時代已來,百度的開源理想要實現(xiàn)了嗎?

《西部世界》中的 AI 機(jī)器人引發(fā)了人們對于 AI 技術(shù)的惶恐——因為它描繪出了一個機(jī)器人擁有意識和意志的世界。埃隆·馬斯克不止一次在公開場合重申了他對超級 AI 潛在崛起的擔(dān)憂。他說:“請記住我的話,AI 比核武器危險得多?!?/p>

核武器沒有開源,而 AI 開源的戰(zhàn)場卻硝煙彌漫。

近幾年來,全球科技巨頭不約而同地在做同一件事:將旗下的 AI 項目開源,與全世界的開發(fā)者共享。對這些 AI 科技巨頭而言,為什么要開源其最先進(jìn)的技術(shù)呢?

今天我們來聊聊 AI 與開源的故事。

AI 開源是科技公司的價值名片

AI 的火熱,得益于大批成功的開源深度學(xué)習(xí)框架的不斷涌現(xiàn)。

2015 年,谷歌推出深度學(xué)習(xí)框架 TensorFlow,它是在 DistBelief 的基礎(chǔ)上研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng),目前已發(fā)展為最受歡迎的深度學(xué)習(xí)框架之一,被廣泛地應(yīng)用于語音識別或圖像識別等多項機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域。

在谷歌開源 TensorFlow 一年以后,百度宣布開源其深度學(xué)習(xí)平臺飛槳(英文名 PaddlePaddle)。飛槳發(fā)展到現(xiàn)在,已經(jīng)具備了開發(fā)便捷的核心框架、支持超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練、多端多平臺部署的高性能推理引擎和產(chǎn)業(yè)級開源模型庫等領(lǐng)先技術(shù)。飛槳是中國首個也是目前國內(nèi)唯一開源開放、功能完備的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,正是因為它的出現(xiàn),百度成為繼 Facebook、谷歌和 IBM 之后世界上又一個開源深度學(xué)習(xí)框架的科技公司。

從傳統(tǒng)觀念來看,開源深度學(xué)習(xí)框架的決定很奇怪。許多科技公司對于自己的產(chǎn)品、技術(shù)一直是保密的,核心算法更是秘而不宣。為什么要開源深度學(xué)習(xí)框架?

  1. 首先看市場需求。AI 具有較高的技術(shù)門檻,對于多數(shù)中小企業(yè)難以長期自主研發(fā)。而在產(chǎn)業(yè)互聯(lián)網(wǎng)的浪潮下,誰能率先擁抱 AI ,誰就能在未來發(fā)展的不確定性中贏得更多主動權(quán)。所以借助成熟的、開源的深度學(xué)習(xí)框架是很多公司的首選。
  2. 其次,對于開源的公司而言,這是一次絕佳的展示機(jī)會。將深度學(xué)習(xí)框架開源,嵌入到其他公司的產(chǎn)品中去,以便更好地擴(kuò)大巨頭的領(lǐng)域。以 TensorFlow 為例,當(dāng)一個用戶在使用它的數(shù)據(jù)庫時,能更加順暢地連接谷歌的云服務(wù)。也就是說,在使用這個免費(fèi)的工具時,用戶會很自然地被引導(dǎo)到需要付費(fèi)的服務(wù)。

這就是為什么處于技術(shù)前沿的公司要公開自己的重要技術(shù),這既是對人工智能領(lǐng)域的資源爭奪,也是提升自己在行業(yè)內(nèi)話語權(quán)的絕佳機(jī)會。

飛槳開源,誠意更大

開源是一張王牌,可以讓企業(yè)走近價值鏈的中心。

IDC 發(fā)布的 2019 年下半年《深度學(xué)習(xí)框架和平臺市場份額》報告顯示,在深度學(xué)習(xí)平臺市場,谷歌、Facebook、百度三強(qiáng)鼎立態(tài)勢穩(wěn)固,已占據(jù)接近 80% 的市場份額,其中百度的市場份額在過去半年里增長迅猛,占比提升 5.98 個百分點。AWS、微軟等國外平臺的份額下滑明顯。

AI開源的未來是如何發(fā)展的?看百度的做法(ai開源的未來是如何發(fā)展的-看百度的做法是什么-)

能在激烈的市場競爭中保持穩(wěn)步增長,與百度多年來深耕 AI 關(guān)系密切。百度的血液里有兩個詞非常關(guān)鍵:一個是搜索,2010 年以前百度靠搜索技術(shù)打下江山;另一個就是 AI,從 2010 年以后,AI 成為百度最鮮明的競爭力。

在 AI 領(lǐng)域,百度做了兩件非常牛的事,一是開源了深度學(xué)習(xí)平臺飛槳,它是中國首個、也是當(dāng)前國內(nèi)唯一開源開放的深度學(xué)習(xí)平臺;另一件是開源了自動駕駛平臺 Apollo。前者讓百度在國外巨頭壟斷的深度學(xué)習(xí)平臺的市場份額里硬是撕出了一道口子;后者則奠定了百度在全球自動駕駛生態(tài)里的核心地位。

百度其實一直走在深度學(xué)習(xí)研究和應(yīng)用的前沿,對于深度學(xué)習(xí)而言,百度在一開始就把握住了機(jī)遇。早在 2012 年百度就將深度學(xué)習(xí) DNN 模型成功應(yīng)用到語音識別、OCR 等任務(wù)中。隨后在 2013 年,百度成立了深度學(xué)習(xí)研究院(IDL)。自此,百度全面進(jìn)入深度學(xué)習(xí)階段,在深度學(xué)習(xí)的框架開發(fā)、平臺建設(shè)以及應(yīng)用創(chuàng)新方面都走在行業(yè)前列,在企業(yè)內(nèi)的應(yīng)用具有很高的實用性、很大的規(guī)模化特色。

百度為什么要開源深度學(xué)習(xí)平臺飛槳?

對于深度學(xué)習(xí)框架的價值,百度首席技術(shù)官(CTO)王海峰曾經(jīng)如此表示:“在智能時代,深度學(xué)習(xí)框架起到了承上啟下的作用,下接芯片,上承各種業(yè)務(wù)模型、行業(yè)應(yīng)用。”

國內(nèi)絕大多數(shù)企業(yè),基本是依賴國外框架,并不掌握最核心的技術(shù)。他們通常是基于 TensorFlow、PyTorch 之類的國外框架和模型進(jìn)行訓(xùn)練,然后再進(jìn)行部署,加上邊緣的工具等,就可以直接使用(例如 XDL,其后臺實際上就是 TensorFlow)。因此,雖然國內(nèi)有一些企業(yè)聲稱自己有深度學(xué)習(xí)框架,但很少有企業(yè)敢于將深度學(xué)習(xí)框架開源。

百度為什么敢?

一位親歷百度開源的工程師曾感慨道:“到目前為止,我仍然堅定的認(rèn)為,百度是中國最適合做技術(shù)的公司?!?strong>百度飛槳的開發(fā),是一行一行的代碼敲出來的,具有完全自主知識產(chǎn)權(quán)。獨立研發(fā)一個深度學(xué)習(xí)平臺,需要深厚的深度學(xué)習(xí)專業(yè)功底、極強(qiáng)的軟件開發(fā)經(jīng)驗和大量的時間,和獨立寫出一個操作系統(tǒng)的難度相差無幾,而百度將飛槳百萬行代碼整體開源,足可見其對技術(shù)的自信和對開源的誠意。截至目前,全球范圍內(nèi)做得比較成功的深度學(xué)習(xí)框架,也只有谷歌、Facebook 和百度。

當(dāng)然,TensorFlow 和飛槳也有很大的不同。

飛槳的核心框架采用基于編程邏輯的組網(wǎng)范式,對于普通開發(fā)者而言更容易上手,符合他們的開發(fā)習(xí)慣。同時,飛槳支持聲明式和命令式編程,兼具開發(fā)的靈活性和高性能,網(wǎng)絡(luò)結(jié)構(gòu)自動設(shè)計,模型效果超越人類專家。

飛槳突破了超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù),實現(xiàn)了世界上首個支持千億特征、萬億參數(shù)、數(shù)百節(jié)點的開源大規(guī)模訓(xùn)練平臺。據(jù)了解,TensorFlow 只支持千億級規(guī)模的模型參數(shù)訓(xùn)練,是飛槳的十分之一。

飛槳不僅兼容其他開源框架訓(xùn)練的模型,還可以輕松地部署到不同架構(gòu)的平臺設(shè)備上。同時,飛槳的推理速度也是全面領(lǐng)先的。比如,在質(zhì)檢線上,一個零件停留的時間可能只有數(shù)十毫秒,因此,速度快就有更大的優(yōu)勢。飛槳適配的國產(chǎn)硬件(華為、寒武紀(jì)等)更多,同樣都是跑在華為麒麟芯片上,飛槳的速度會比 TensorFlow 更快。在與北京大恒圖像視覺有限公司的合作中,使用百度飛槳分割庫 PaddleSeg,可在收集數(shù)據(jù)后快速地完成模型訓(xùn)練和部署,結(jié)合傳統(tǒng)算法對隔膜生產(chǎn)中的缺陷進(jìn)行實時的檢測和分類。

PaddleSeg 集成了豐富的數(shù)據(jù)增廣方法和最新的網(wǎng)絡(luò)模型,使用方便、功能強(qiáng)大。訓(xùn)練出來的模型有良好的泛化能力,能檢測出不同工藝和不同亮度的圖像的缺陷 20 余種,分類精度達(dá)到 0.98,預(yù)測速度 0.12ms/img,分割模型 iou0.82。安裝調(diào)試時間也縮短到 2 周,質(zhì)檢設(shè)備的通用及易用性都得到了較大的提高。

AI開源的未來是如何發(fā)展的?看百度的做法(ai開源的未來是如何發(fā)展的-看百度的做法是什么-)

百度飛槳已累計服務(wù)了 150 多萬開發(fā)者,這一數(shù)字約占中國軟件平均從業(yè)人數(shù)的 1/4。此外,其定制化訓(xùn)練平臺上企業(yè)用戶超過 6.5 萬,發(fā)布了 16.9 萬個模型,2019 年第二季度百度飛槳深度學(xué)習(xí)平臺開發(fā)者下載量環(huán)比增加 45%。

雖然當(dāng)下飛槳的生態(tài)規(guī)模和國外框架想比還有一些差距。但對于國內(nèi)的開發(fā)者而言,深度學(xué)習(xí)平臺飛槳的開源,提供了一個跟國際潮流技術(shù)比肩的選擇。

Apollo 在自動駕駛生態(tài)的特別地位

百度除了開源深度學(xué)習(xí)平臺飛槳之外,在應(yīng)用層面還開源了自動駕駛平臺 Apollo。

百度自動駕駛研發(fā)項目啟動于 2013 年,早年技術(shù)核心是“百度汽車大腦”,包括高精度地圖、定位、感知、智能決策與控制四大模塊;2014 年,正式啟動“百度無人駕駛汽車”研發(fā)計劃,一年后,成立自動駕駛事業(yè)部成立,大規(guī)模投入研發(fā)。

2017 年 7 月,百度 Apollo 發(fā)布 1.0 版本并正式對外開源,歷時兩年零五個月后,Apollo 5.5 版本發(fā)布,重點便是開放了“點到點城市自動駕駛”能力,以及面向量產(chǎn)落地自動駕駛場景的解決方案。

與以往版本比,Apollo 5.5 增加了三項新能力,分別是:

語義地圖深度學(xué)習(xí)方法。該方法是將高精地圖加上交通規(guī)則、車輛信息等語義,然后生成圖片,用深度學(xué)習(xí)的 CNN 網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),從而應(yīng)用于包括感知、預(yù)測在內(nèi)的多個模塊中。

Apollo 還對規(guī)劃算法進(jìn)行了更新。通過靈活的換道策略、智能的路權(quán)處理以及優(yōu)化的速度決策幾個方面的提升,提高問題的可求解性。

Apollo 5.5 引入最新的、基于非線性速度規(guī)劃的數(shù)學(xué)表述,在優(yōu)化器和優(yōu)化器求解上做了大量的改進(jìn),保證在有限時間內(nèi)也可以求出最優(yōu)解。

在 CVPR(全球計算機(jī)視覺及模式識別領(lǐng)域頂級學(xué)術(shù)會議)2019 會議期間,百度 Apollo 公開了國內(nèi)唯一的自動駕駛純視覺城市道路閉環(huán)解決方案——百度 Apollo Lite。據(jù)悉,這是一套自動駕駛純視覺城市道路閉環(huán)解決方案,能夠支持對 10 路攝像頭、200 幀 / 秒數(shù)據(jù)量的并行處理,單視覺鏈路最高丟幀率能夠控制在 5‰ 以下,實現(xiàn)全方位 360° 實時環(huán)境感知,前向障礙物的穩(wěn)定檢測視距達(dá)到 240 米。

前不久,知名投資咨詢公司廣證恒生發(fā)布了《自動駕駛專題研究之企業(yè)評估指標(biāo)體系——立體分析企業(yè)核心競爭力》,對國內(nèi)外數(shù)家自動駕駛公司進(jìn)行排名分析,百度以 3.6 分的綜合評分位居世界第一,谷歌旗下的自動駕駛企業(yè) Waymo 以 0.2 分之差緊隨其后。

AI開源的未來是如何發(fā)展的?看百度的做法(ai開源的未來是如何發(fā)展的-看百度的做法是什么-)

Apollo 平臺是百度自動駕駛的技術(shù)基石。自發(fā)布至今,Apollo 平臺共進(jìn)行了 8 次迭代,分別是 1.0、1.5、2.0、2.5、3.0、3.5、5.0、5.5。以最新的 Apollo 5.5 為例,不僅在開放數(shù)據(jù)的基礎(chǔ)上新增了幫助自動駕駛車輛快速學(xué)習(xí)交通規(guī)則,理解路面環(huán)境的語義地圖深度學(xué)習(xí)方法,還為開發(fā)者開放了一個“技能庫”,提供傳感器標(biāo)定和深度學(xué)習(xí)模型訓(xùn)練的服務(wù),進(jìn)一步提升開發(fā)效率。

截至目前,百度 L4 級別自動駕駛城市道路測試?yán)锍桃呀?jīng)突破 300 萬公里,已經(jīng)在 23 個城市進(jìn)行測試,智能汽車專利 1237 項,位列全國第一。

AI開源的未來是如何發(fā)展的?看百度的做法(ai開源的未來是如何發(fā)展的-看百度的做法是什么-)

百度測試車隊行駛在長沙的街道上

在保定,百度智能交通信控系統(tǒng)幫助保定交通延誤時間減少 20%~30%。而在長沙“兩個 100 公里”項目建設(shè)中,百度 Apollo 參與 135 公里車路協(xié)同道路改造。據(jù)悉,該項目建成后可直接支持進(jìn)一步開展 Robotaxi 業(yè)務(wù),從而加速推進(jìn)自動駕駛規(guī)?;?、商業(yè)化的落地進(jìn)程。

此外,百度與重慶達(dá)成戰(zhàn)略合作,圍繞自動駕駛、智能城市、智能政務(wù)、區(qū)塊鏈等多層面達(dá)成合作。2019 年 9 月 12 日,百度 Apollo 來到“渤海之濱”獅城,與滄州市人民政府正式簽署戰(zhàn)略合作框架協(xié)議,雙方將自動駕駛、智能交通、電子政務(wù)等多個方面展開全面合作,共同打造“智能滄州”。

除了 Apollo 自動駕駛平臺,百度還在車聯(lián)網(wǎng)和車路協(xié)同領(lǐng)域不斷推出新產(chǎn)品。據(jù)了解,2019 年,百度 Apollo 在全球 97 個國家擁有 3.6 萬名開發(fā)者,是 2018 年的 2.4 倍。Apollo 目前共擁有 177 位生態(tài)合作伙伴,擁有 56 萬行開源代碼。Apollo 自動駕駛平臺已成為全球最強(qiáng)大、最開放、最活躍的自動駕駛平臺。

百度在 AI 和開源上的投入,有目共睹。

將 AI 開源進(jìn)行到底

據(jù)了解,谷歌開源 TensorFlow 的想法最初是由是其首席架構(gòu)師 Jeff Dean 提出的,他認(rèn)為常規(guī)的科學(xué)發(fā)展緩慢,阻礙了公司的創(chuàng)新。開源 TensorFlow 能夠加快研究人員與科學(xué)界的實時協(xié)作。谷歌之外的人才也能改善源代碼,通過更廣泛地分享機(jī)器學(xué)習(xí)技術(shù),還能為該領(lǐng)域培養(yǎng)更加專業(yè)的人才。

“我們決定開源后,代碼運(yùn)行更快了,可以做更多的事情,也更加便捷?!盩ensorFlow 團(tuán)隊負(fù)責(zé)人 Rajat Monga 說。

百度 CTO 王海峰也曾在多個場合提出開源開放對人工智能時代的重要價值。他認(rèn)為,一方面,人工智能技術(shù)的發(fā)展和突破需要所有人齊心協(xié)力、共同推動,因此開源、開放就尤為重要;另一方面,人工智能技術(shù)會賦能各行各業(yè),開源、開放讓各行各業(yè)可以便捷地使用人工智能,讓社會各界都受益。

在百度,很多人對開源文化頗有感觸。一位百度開源負(fù)責(zé)人曾在一篇文章中寫道,他所在的工程效率部門, 2017 年至今都在整體組織和推進(jìn)百度開源的工作,包括引入開源、內(nèi)部開源和對外開源。而他也看到,在開源世界里面,中國公司和中國人不再僅僅是以索取者的身份出現(xiàn),領(lǐng)先企業(yè)華為、阿里巴巴、百度、騰訊等在開源界的聲音也越來越大,投入和實際貢獻(xiàn)也越來越多。對開源的玩法越來越熟悉,玩得也越來越溜,在遵守社區(qū)規(guī)則、理解社區(qū)精神的前提下,慢慢走上了前臺和中心?!斑@是非常令人欣喜的變化?!?/p>

除了以上提到的飛槳和 Apollo 的開源,百度還有很多非常有代表性的開源項目,比如 2019 年春晚紅包中扛住超大用戶壓力、數(shù)次流量波峰的轉(zhuǎn)發(fā)引擎——百度的統(tǒng)一七層流量轉(zhuǎn)發(fā)平臺 BFE、中國首個開源的邊緣計算框架 BAETYL 等等。

此外,除了將重磅技術(shù)開源外,各大巨頭也通過收購的方式加緊自己的開源生態(tài)建設(shè)。2018 年 10 月,微軟以 75 億美元的價格收購 GitHub,這個舉措被認(rèn)為是微軟擁抱開源與布局企業(yè)市場的關(guān)鍵;2019 年 7 月,IBM 宣布以 340 億美元的價格收購紅帽(Red Hat),紅帽將成為 IBM 混合云部門的一部分。國內(nèi)對開源生態(tài)也表現(xiàn)出前所未有的重視。騰訊收購 Coding.net,推出騰訊云開發(fā)者平臺;阿里巴巴收購 Teambition,支持開發(fā)者團(tuán)隊溝通協(xié)作。

2019 年 12 月 6 日,開源中國獲得百度最新戰(zhàn)略投資。百度除了把飛槳入駐到 Gitee 之外,其他百度系優(yōu)秀的開源產(chǎn)品也將陸續(xù)入駐。

開源生態(tài)之爭,寸土寸金。云 AI 的行業(yè)背景之下,對于開發(fā)者生態(tài)的重視,讓開源事業(yè)迎來了春天。開源社區(qū)和代碼托管平臺是科技公司與開發(fā)者建立聯(lián)系的關(guān)鍵點,自然成為了必爭之地。“一流企業(yè)定標(biāo)準(zhǔn),二流企業(yè)做品牌,三流企業(yè)做產(chǎn)品”,想要在未來競爭的商業(yè)市場里占據(jù)話語權(quán),就需要加快產(chǎn)品的研發(fā)和迭代速度,讓產(chǎn)品被更多人喜歡和使用,并積極地參與開源組織和標(biāo)準(zhǔn)的制定。

寫在最后

當(dāng)下,越來越多的企業(yè)開始意識到開源的重要性,中國的互聯(lián)網(wǎng)企業(yè)也需要像百度一樣,給開發(fā)者足夠信任的時間和空間去做開源項目、維護(hù)開源項目,畢竟在開發(fā)者數(shù)量占絕對優(yōu)勢的背景下,我們需要讓世界看到中國的開源力量。

百度篤信于此,并時刻做好“領(lǐng)路人”的準(zhǔn)備。

相關(guān)新聞

聯(lián)系我們
聯(lián)系我們
公眾號
公眾號
在線咨詢
分享本頁
返回頂部