阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)
雷剛 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
阿里巴巴這份開源禮物,業(yè)內(nèi)期待已久。
近期,中國科技互聯(lián)網(wǎng)巨頭正式宣布將實時計算平臺Blink開源,該技術(shù)由開源的Flink改造而來,被廣泛應用在阿里眾多核心業(yè)務中。
比如淘寶天貓智能推薦系統(tǒng)、阿里媽媽廣告、高德地圖、城市大腦等,均有實時計算平臺Blink的支持。
這一技術(shù)甚至被認為是引領“下一代計算”的 “計算王牌”。
之前阿里透露開源意向時,就已經(jīng)在開源和開發(fā)者群體中引發(fā)期待。
實時計算
所謂實時計算,通俗來講,即能夠基于實時變化數(shù)據(jù)更新大數(shù)據(jù)處理的狀態(tài)和結(jié)果。
最典型的如天貓雙11搶購中,即便在萬千人同時涌入的第一分鐘,也能保證每個人點開App瞬間實現(xiàn)千人千面的智能推薦。
這背后正是阿里云實時計算平臺Blink保駕護航的結(jié)果。
此外,對于眾多AI項目來說,實時計算也關(guān)系到實時機器學習和實時測試的效果。
在阿里此前的探索中,歸納總結(jié)出三方面挑戰(zhàn):
- 業(yè)務龐大,場景多,大量的機器學習需求,這些因素一起導致了計算邏輯十分復雜;
- 數(shù)據(jù)量大,作業(yè)多,因此整個實時計算的機器規(guī)模十分巨大;
- 要保障低延遲和數(shù)據(jù)精確性,同時要滿足高吞吐量的需求。
Blink方案
為了應對上述挑戰(zhàn),阿里內(nèi)部在調(diào)研諸多計算框架后,最終選定了Flink。
首先,F(xiàn)link很好地引入和設計了State,基于State復雜的邏輯計算如join能得到很好的描述。
其次,F(xiàn)link引入了Chandy-Lamport 算法,在此算法的支撐下可以完美實現(xiàn)Exactly-Once,并能在低延遲下實現(xiàn)高吞吐量。
值得一提的是,為了解決Flink在State、Chandy-Lamport 算法等方面的缺陷,阿里進一步結(jié)合Improvement,打造了Blink項目。
該項目可以分為2大板塊:
1、BlinkRuntime
包括存儲、調(diào)度和計算,不同公司在使用Flink時,存儲、調(diào)度以及底層優(yōu)化等方面會有諸多不同,阿里巴巴的blink內(nèi)部也對Runtime做了諸多個性化的優(yōu)化。
2、Flink SQL
原生的Flink只有比較底層的DataStream API,用戶在使用時需要設計實現(xiàn)大量的代碼,此外DataStream本身也有設計上的缺陷。
為了方便用戶使用,阿里巴巴團隊設計了流計算的Flink SQL并推回了社區(qū),取名Flink SQL。
此外,作為開源版Blink,跟社區(qū)版本還有幾點差異:
第一是穩(wěn)定性方面,在某些場景會比社區(qū)版本更加穩(wěn)定,特別是在大規(guī)模場景;
另外Blink擁有全新的 Flink SQL 技術(shù)棧,它在功能上,特別是在批處理的功能上比社區(qū)版本強大很多。
它支持現(xiàn)在標準 SQL 幾乎所有的語法和語義,在性能上,無論是在流式 SQL 還是批 SQL,當前版本在性能上都有很大的優(yōu)勢。
特別是在批 SQL 的性能方面,當前 Blink 版本是社區(qū)版本性能的 10 倍以上,跟 Spark 相比,在 TPCDS 這樣的場景 Blink 的性能也能達到 3 倍以上。
阿里方面強調(diào),如果用戶對批處理或者對 SQL 有著比較強的需求,這個版本會用戶可以得到很多好處。
(更多詳細技術(shù)解析詳見傳送門)
實戰(zhàn)效果
阿里方面還介紹說,現(xiàn)在,阿里集團的全部核心業(yè)務已經(jīng)用上Blink。
除了技術(shù)大考雙11之外,ET城市大腦實時計算著杭州1300個信號燈路口、4500路視頻,保障著交通動脈的通暢;淘寶、天貓每天為數(shù)億用戶展現(xiàn)實時的“專屬”頁面。
未來,這項技術(shù)還會被應用到社會的各個場景:工廠設備的物聯(lián)網(wǎng)設備能實時分析數(shù)據(jù)、提高生產(chǎn)良品率;物流派送平臺能第一時間下單,把商品及時送到消費者手中;導航軟件時刻緊隨出行軌跡,不再錯過轉(zhuǎn)彎口……
而面向業(yè)界開源,更是能將更前沿的計算技術(shù)讓更多開發(fā)者受益其中。
傳送門
Blink on GitHub:
https://github.com/apache/flink/tree/blink
技術(shù)詳解:
一文揭秘阿里實時計算Blink核心技術(shù)
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關(guān)村。期待有才氣、有熱情的同學加入我們!相關(guān)細節(jié),請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)