- 論壇徽章:
- 146
|
回復(fù) 1# 王楠w_n
超級核心路由器演進
1介紹
現(xiàn)代網(wǎng)絡(luò)社會人們越來越依賴各種流媒體,社交和應(yīng)用工具,加上 Cloud 和 IOT 的蓬勃發(fā)展,每年 IP 數(shù)據(jù)流量會以指數(shù)級別增長。 IP 網(wǎng)絡(luò)基礎(chǔ)設(shè)施就像水,電,空氣一樣,已經(jīng)日益成為人們的基本需求,用戶總是期待更高帶寬,更高網(wǎng)絡(luò)可靠性,更加優(yōu)惠的網(wǎng)絡(luò)接入價格。
電信運營商網(wǎng)絡(luò)基礎(chǔ)設(shè)施面臨用戶,企業(yè)和云數(shù)據(jù)中心的連通性和移動性挑戰(zhàn)。同時 IP 網(wǎng)絡(luò)投資增長越來越緩慢,如何能優(yōu)化運營商核心網(wǎng)絡(luò),采用最新技術(shù),最新設(shè)備來應(yīng)對網(wǎng)絡(luò)的快速增
長,同時更好的保持運營商 IP 業(yè)務(wù)的投資和收益平衡,是每個運營商要解決的核心課題。
2000 年左右,現(xiàn)代核心路由器引入的控制和轉(zhuǎn)發(fā)分離的架構(gòu),并且采用最新的 ASIC/NP 技術(shù)來支持 2.5G/10G 級別的 Internet 骨干網(wǎng)。時間快進到 2016 年,網(wǎng)絡(luò)連接已經(jīng)采用
100G/200G/400G(雖然 400GE 接口技術(shù)還未成熟),互聯(lián)網(wǎng)出口也已經(jīng)增長到了 T 級別。
QQ截圖20180918152830.jpg (35.97 KB, 下載次數(shù): 444)
下載附件
2018-09-18 15:28 上傳
SDN/NFV 可以實現(xiàn)業(yè)務(wù)快速部署,并且虛擬化一些低速(<100G) 業(yè)務(wù),但是無法滿足互聯(lián)網(wǎng)骨干路由器帶寬增長需求。Juniper 在 2016 年推出最新一代 PTX 超級核心路由器,基于 1T 級別芯片, 采用最新路由查表算法,最新核心路由器架構(gòu),單機支持 24T 接口容量(2017 年會推出單機
60T)足以滿足全球骨干網(wǎng)流量在今后 5-10 年的流量增長。
本文討論核心路由器的基本架構(gòu)和技術(shù)演進,同時嘗試回答一些基本問題:
芯片技術(shù)如何應(yīng)對流量指數(shù)級別增長?
邊緣路由器能否和核心路由器融合?
多機箱架構(gòu)還是單機箱?哪一個是核心路由器的演進方向?
SDN/NFV Scale out 能否替代核心路由器, SDN 超級核心。
2路由器芯片創(chuàng)新
第一代路由器 采用集中轉(zhuǎn)發(fā) CPU 架構(gòu)發(fā)展而來,第二代采用分布式轉(zhuǎn)發(fā)和專用芯片技術(shù)。2000 年左右第三代路由器引入交換矩陣,采用最新設(shè)計的 Network Processor/ASIC 之后,M40/GSR,
CRS/T1600 等現(xiàn)代核心路由器基本成型。有人把 Multi-Chassis 多機箱稱為第四代核心路由器, 其實架構(gòu)方面基本也沒有很多變化。*【Nick Feamster Paper,2008】
深度解析-超級核心路由器演進1687.png (22.72 KB, 下載次數(shù): 439)
下載附件
2018-09-18 15:26 上傳
可以看到在三代核心路由器中架構(gòu)中,交換矩陣和轉(zhuǎn)發(fā)芯片,兩個芯片組起到?jīng)Q定性的作用。不 同路由器廠商在不同世代產(chǎn)品中采用了很多新技術(shù):
交換矩陣:
oCombine Input/Output Queue (CIOQ) /Virtual Output Queue/3 stage CLOS
轉(zhuǎn)發(fā)芯片:
o流水線型芯片 Pipeline,比較適合核心路由器
o微內(nèi)核 PPE,比較適合邊緣路由器 PE
近年 SDN/NFV 非常熱門,很多人提出用 CPU 來虛擬路由器功能,能否采用 scale out 的方式來構(gòu)建超大型路由器。對此 Juniper 創(chuàng)始人 Pradeep 先生指出,傳送 IP 報文的設(shè)備可以分為兩類轉(zhuǎn)發(fā):
深度解析-超級核心路由器演進2127.png (16.23 KB, 下載次數(shù): 449)
下載附件
2018-09-18 15:26 上傳
o有狀態(tài)轉(zhuǎn)發(fā) Stateful Forwarding,IP 報文會檢查 L4-L7 層信息,同時跟轉(zhuǎn)發(fā)流的順序和特征碼緊密相關(guān)。比如 基于 FPGA 和 CPU 防火墻和深度包檢測設(shè)備等。通常能夠支持很大的表項,比如 vRR 可以支持 80M 以上 RIB。
o無狀態(tài)轉(zhuǎn)發(fā) Stateless Forwarding, IP 報文只查看三/四層報文頭,跟轉(zhuǎn)發(fā)流的順序和特征碼無關(guān), 比如 juniper 2015/16 年發(fā)布了基于 28nm 技術(shù)的三款業(yè)界領(lǐng)先的芯片:
oFabric 交換: 單芯片 4T/2T, 160*25G Fabric,極小 On-chip buffer,極小 On-chip 表項
o邊緣路由器: 單芯片 800G/400G, 96 個 PPE 微內(nèi)核,超多 feature,超大轉(zhuǎn)發(fā)表
o核心路由器: 單芯片 1T/500G, Flex Pipeline,中等規(guī)模 feature,中等規(guī)模轉(zhuǎn)發(fā)表
QQ截圖20180918153431.jpg (19.72 KB, 下載次數(shù): 432)
下載附件
2018-09-18 15:34 上傳
現(xiàn)階段單 CPU Socket 性能局限于 20-50G(雙向)僅僅是高端路由器單芯片的 10~20 分之一。如果按照 1RU 機架的處理能力來比較,專用路由器芯片可以放至 5-6 片,轉(zhuǎn)發(fā)能力是 CPU 的 20-40
倍,可以采用 X86 CPU 進行一些控制層面的虛擬化,互聯(lián)網(wǎng)超級核心還需要專用芯片技術(shù)!
2.1核心路由器 All-in-One ExpressPlus 芯片
公欲善其事,必先利其器。由 Juniper 院士領(lǐng)銜的 200+人芯片研發(fā)團隊,從 2013 年開始,歷經(jīng)三年時間,率先采用很多創(chuàng)新技術(shù)和算法,打造了業(yè)界第一款基于 28nm 技術(shù)的 1Tbps 最強核心路由器轉(zhuǎn)發(fā)引擎(Forwarding Engine),首次實現(xiàn)了以下功能的 All-In-One 設(shè)計:
o報文轉(zhuǎn)發(fā)查表,根據(jù) L2/L3/L4 查找路由表,采用最新 BFA 算法,找到 IP 報文的下一跳
oVOQ/QoS 隊列管理功能,提供 384K 不同優(yōu)先級隊列,管理網(wǎng)絡(luò)緩存。
oFabric 適配功能,提供交換矩陣的報文封裝,切割,重組等功能。
深度解析-超級核心路由器演進3396.png (42.77 KB, 下載次數(shù): 430)
下載附件
2018-09-18 15:26 上傳
Figure 4: ExpressPlus 領(lǐng)先友商芯片設(shè)計理念
這種業(yè)界領(lǐng)先 All-In-One 芯片設(shè)計方案,在一個芯片中就實現(xiàn)了傳統(tǒng)路由器廠商多個定制專用功能芯片套件才能實現(xiàn)的功能, 帶來以下優(yōu)勢:
1.避免芯片之間通過 Serdes 互聯(lián),極大降低了報文延遲和芯片耗電量,提高單板卡密度
2.1Tbps 流量共享相同一份 FIB table 和 packet buffer,簡化報文邏輯,減少外部 RAM 表項
由于采用最新的 28nm 技術(shù),單個 ExpressPlus 芯片就可以實現(xiàn)路由轉(zhuǎn)發(fā)的所有功能,同樣的功能需要友商 5-8 個 40nm 芯片組才能提供。Juniper 業(yè)界第一引入 All-in-One 路由器芯片打造了全新
PTX。
|
|