阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)

雷剛 發(fā)自 凹非寺

量子位 報道 | 公眾號 QbitAI

阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)

阿里巴巴這份開源禮物,業(yè)內(nèi)期待已久。

近期,中國科技互聯(lián)網(wǎng)巨頭正式宣布將實時計算平臺Blink開源,該技術(shù)由開源的Flink改造而來,被廣泛應用在阿里眾多核心業(yè)務中。

比如淘寶天貓智能推薦系統(tǒng)、阿里媽媽廣告、高德地圖、城市大腦等,均有實時計算平臺Blink的支持。

這一技術(shù)甚至被認為是引領“下一代計算”的 “計算王牌”。

之前阿里透露開源意向時,就已經(jīng)在開源和開發(fā)者群體中引發(fā)期待。

實時計算

所謂實時計算,通俗來講,即能夠基于實時變化數(shù)據(jù)更新大數(shù)據(jù)處理的狀態(tài)和結(jié)果。

最典型的如天貓雙11搶購中,即便在萬千人同時涌入的第一分鐘,也能保證每個人點開App瞬間實現(xiàn)千人千面的智能推薦。

阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)

這背后正是阿里云實時計算平臺Blink保駕護航的結(jié)果。

此外,對于眾多AI項目來說,實時計算也關(guān)系到實時機器學習和實時測試的效果。

阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)

在阿里此前的探索中,歸納總結(jié)出三方面挑戰(zhàn):

  • 業(yè)務龐大,場景多,大量的機器學習需求,這些因素一起導致了計算邏輯十分復雜;
  • 數(shù)據(jù)量大,作業(yè)多,因此整個實時計算的機器規(guī)模十分巨大;
  • 要保障低延遲和數(shù)據(jù)精確性,同時要滿足高吞吐量的需求。

Blink方案

為了應對上述挑戰(zhàn),阿里內(nèi)部在調(diào)研諸多計算框架后,最終選定了Flink。

首先,F(xiàn)link很好地引入和設計了State,基于State復雜的邏輯計算如join能得到很好的描述。

其次,F(xiàn)link引入了Chandy-Lamport 算法,在此算法的支撐下可以完美實現(xiàn)Exactly-Once,并能在低延遲下實現(xiàn)高吞吐量。

值得一提的是,為了解決Flink在State、Chandy-Lamport 算法等方面的缺陷,阿里進一步結(jié)合Improvement,打造了Blink項目。

阿里開源實時計算平臺Blink,能讓計算延遲降至毫秒級|技術(shù)詳解(阿里實時計算開發(fā)平臺)

該項目可以分為2大板塊:

1、BlinkRuntime

包括存儲、調(diào)度和計算,不同公司在使用Flink時,存儲、調(diào)度以及底層優(yōu)化等方面會有諸多不同,阿里巴巴的blink內(nèi)部也對Runtime做了諸多個性化的優(yōu)化。

2、Flink SQL

原生的Flink只有比較底層的DataStream API,用戶在使用時需要設計實現(xiàn)大量的代碼,此外DataStream本身也有設計上的缺陷。

為了方便用戶使用,阿里巴巴團隊設計了流計算的Flink SQL并推回了社區(qū),取名Flink SQL。

此外,作為開源版Blink,跟社區(qū)版本還有幾點差異:

第一是穩(wěn)定性方面,在某些場景會比社區(qū)版本更加穩(wěn)定,特別是在大規(guī)模場景;

另外Blink擁有全新的 Flink SQL 技術(shù)棧,它在功能上,特別是在批處理的功能上比社區(qū)版本強大很多。

它支持現(xiàn)在標準 SQL 幾乎所有的語法和語義,在性能上,無論是在流式 SQL 還是批 SQL,當前版本在性能上都有很大的優(yōu)勢。

特別是在批 SQL 的性能方面,當前 Blink 版本是社區(qū)版本性能的 10 倍以上,跟 Spark 相比,在 TPCDS 這樣的場景 Blink 的性能也能達到 3 倍以上。

阿里方面強調(diào),如果用戶對批處理或者對 SQL 有著比較強的需求,這個版本會用戶可以得到很多好處。

(更多詳細技術(shù)解析詳見傳送門)

實戰(zhàn)效果

阿里方面還介紹說,現(xiàn)在,阿里集團的全部核心業(yè)務已經(jīng)用上Blink。

除了技術(shù)大考雙11之外,ET城市大腦實時計算著杭州1300個信號燈路口、4500路視頻,保障著交通動脈的通暢;淘寶、天貓每天為數(shù)億用戶展現(xiàn)實時的“專屬”頁面。

未來,這項技術(shù)還會被應用到社會的各個場景:工廠設備的物聯(lián)網(wǎng)設備能實時分析數(shù)據(jù)、提高生產(chǎn)良品率;物流派送平臺能第一時間下單,把商品及時送到消費者手中;導航軟件時刻緊隨出行軌跡,不再錯過轉(zhuǎn)彎口……

而面向業(yè)界開源,更是能將更前沿的計算技術(shù)讓更多開發(fā)者受益其中。

傳送門

Blink on GitHub:

https://github.com/apache/flink/tree/blink

技術(shù)詳解:

一文揭秘阿里實時計算Blink核心技術(shù)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關(guān)村。期待有才氣、有熱情的同學加入我們!相關(guān)細節(jié),請在量子位公眾號(QbitAI)對話界面,回復“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

?’?’ ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)

相關(guān)新聞

聯(lián)系我們
聯(lián)系我們
公眾號
公眾號
在線咨詢
分享本頁
返回頂部