掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
作者:爛豬皮 2021-09-02 10:37:53
架構(gòu)
分布式 本文是學(xué)習(xí)大型分布式網(wǎng)站架構(gòu)的技術(shù)總結(jié)。對架構(gòu)一個高性能、高可用、可伸縮及可擴展的分布式網(wǎng)站進行了概要性描述,并給出一個架構(gòu)參考。文中一部分為讀書筆記,一部分是個人經(jīng)驗總結(jié),對大型分布式網(wǎng)站架構(gòu)有較好的參考價值。

超過十多年行業(yè)經(jīng)驗,技術(shù)領(lǐng)先,服務(wù)至上的經(jīng)營模式,全靠網(wǎng)絡(luò)和口碑獲得客戶,為自己降低成本,也就是為客戶降低成本。到目前業(yè)務(wù)范圍包括了:成都網(wǎng)站設(shè)計、成都做網(wǎng)站,成都網(wǎng)站推廣,成都網(wǎng)站優(yōu)化,整體網(wǎng)絡(luò)托管,微信小程序開發(fā),微信開發(fā),手機APP定制開發(fā),同時也可以讓客戶的網(wǎng)站和網(wǎng)絡(luò)營銷和我們一樣獲得訂單和生意!
本文是學(xué)習(xí)大型分布式網(wǎng)站架構(gòu)的技術(shù)總結(jié)。對架構(gòu)一個高性能、高可用、可伸縮及可擴展的分布式網(wǎng)站進行了概要性描述,并給出一個架構(gòu)參考。文中一部分為讀書筆記,一部分是個人經(jīng)驗總結(jié),對大型分布式網(wǎng)站架構(gòu)有較好的參考價值。
以用戶為中心,提供快速的網(wǎng)頁訪問體驗。主要參數(shù)有較短的響應(yīng)時間、較大的并發(fā)處理能力、較高的吞吐量與穩(wěn)定的性能參數(shù)。
可分為前端優(yōu)化、應(yīng)用層優(yōu)化、代碼層優(yōu)化與存儲層優(yōu)化。
大型網(wǎng)站應(yīng)該在任何時候都可以正常訪問,正常提供對外服務(wù)。因為大型網(wǎng)站的復(fù)雜性,分布式,廉價服務(wù)器,開源數(shù)據(jù)庫,操作系統(tǒng)等特點,要保證高可用是很困難的,也就是說網(wǎng)站的故障是不可避免的。
如何提高可用性,就是需要迫切解決的問題。首先,需要從架構(gòu)級別考慮,在規(guī)劃的時候,就考慮可用性。行業(yè)內(nèi)一般用幾個9表示可用性指標(biāo),比如四個9(99.99),一年內(nèi)允許的不可用時間是53分鐘。
不同層級使用的策略不同,一般采用冗余備份和失效轉(zhuǎn)移解決高可用問題。
伸縮性是指在不改變原有架構(gòu)設(shè)計的基礎(chǔ)上,通過添加/減少硬件(服務(wù)器)的方式,提高/降低系統(tǒng)的處理能力。
可以方便地進行功能模塊的新增/移除,提供代碼/模塊級別良好的可擴展性。
對已知問題有有效的解決方案,對未知/潛在問題建立發(fā)現(xiàn)和防御機制。對于安全問題,首先要提高安全意識,建立一個安全的有效機制,從政策層面,組織層面進行保障,比如服務(wù)器密碼不能泄露,密碼每月更新,并且三次內(nèi)不能重復(fù);每周安全掃描等。以制度化的方式,加強安全體系的建設(shè)。同時,需要注意與安全有關(guān)的各個環(huán)節(jié)。安全問題不容忽視,包括基礎(chǔ)設(shè)施安全,應(yīng)用系統(tǒng)安全,數(shù)據(jù)保密安全等。
常用的加解密算法(單項散列加密[MD5、SHA],對稱加密[DES、3DES、RC]),非對稱加密[RSA]等。
網(wǎng)站的架構(gòu)設(shè)計,運維管理要適應(yīng)變化,提供高伸縮性,高擴展性。方便的應(yīng)對快速的業(yè)務(wù)發(fā)展,突增高流量訪問等要求。
除上面介紹的架構(gòu)要素外,還需要引入敏捷管理,敏捷開發(fā)的思想。使業(yè)務(wù),產(chǎn)品,技術(shù),運維統(tǒng)一起來,隨需應(yīng)變,快速響應(yīng)。
以上采用七層邏輯架構(gòu),第一層客戶層,第二層前端優(yōu)化層,第三層應(yīng)用層,第四層服務(wù)層,第五層數(shù)據(jù)存儲層,第六層大數(shù)據(jù)存儲層,第七層大數(shù)據(jù)處理層。
一個成熟的大型網(wǎng)站(如淘寶、天貓、騰訊等)的系統(tǒng)架構(gòu)并不是一開始設(shè)計時就具備完整的高性能、高可用、高伸縮等特性的,它是隨著用戶量的增加,業(yè)務(wù)功能的擴展逐漸演變完善的,在這個過程中,開發(fā)模式、技術(shù)架構(gòu)、設(shè)計思想也發(fā)生了很大的變化,就連技術(shù)人員也從幾個人發(fā)展到一個部門甚至一條產(chǎn)品線。
所以成熟的系統(tǒng)架構(gòu)是隨著業(yè)務(wù)的擴展而逐步完善的,并不是一蹴而就;不同業(yè)務(wù)特征的系統(tǒng),會有各自的側(cè)重點,例如淘寶,要解決海量的商品信息的搜索、下單、支付;例如騰訊,要解決數(shù)億用戶的實時消息傳輸;百度它要處理海量的搜索請求。
他們都有各自的業(yè)務(wù)特性,系統(tǒng)架構(gòu)也有所不同。盡管如此我們也可以從這些不同的網(wǎng)站背景中,找出其中共用的技術(shù),這些技術(shù)和手段廣泛運用在大型網(wǎng)站系統(tǒng)的架構(gòu)中,下面就通過介紹大型網(wǎng)站系統(tǒng)的演化過程,來認識這些技術(shù)和手段。
最初的架構(gòu),應(yīng)用程序、數(shù)據(jù)庫、文件都部署在一臺服務(wù)器上,如圖:
隨著業(yè)務(wù)的擴展,一臺服務(wù)器已經(jīng)不能滿足性能需求,故將應(yīng)用程序、數(shù)據(jù)庫、文件各自部署在獨立的服務(wù)器上,并且根據(jù)服務(wù)器的用途配置不同的硬件,達到最佳的性能效果。
在硬件優(yōu)化性能的同時,同時也通過軟件進行性能優(yōu)化,在大部分的網(wǎng)站系統(tǒng)中,都會利用緩存技術(shù)改善系統(tǒng)的性能,使用緩存主要源于熱點數(shù)據(jù)的存在,大部分網(wǎng)站訪問都遵循28原則(即80%的訪問請求,最終落在20%的數(shù)據(jù)上),所以我們可以對熱點數(shù)據(jù)進行緩存,減少這些數(shù)據(jù)的訪問路徑,提高用戶體驗。
緩存實現(xiàn)常見的方式是本地緩存、分布式緩存。當(dāng)然還有CDN、反向代理等,這個后面再講。本地緩存,顧名思義是將數(shù)據(jù)緩存在應(yīng)用服務(wù)器本地,可以存在內(nèi)存中,也可以存在文件,OSCache就是常用的本地緩存組件。本地緩存的特點是速度快,但因為本地空間有限所以緩存數(shù)據(jù)量也有限。分布式緩存的特點是,可以緩存海量的數(shù)據(jù),并且擴展非常容易,在門戶類網(wǎng)站中常常被使用,速度按理沒有本地緩存快,常用的分布式緩存是Memcached、Redis。
應(yīng)用服務(wù)器作為網(wǎng)站的入口,會承擔(dān)大量的請求,我們往往通過應(yīng)用服務(wù)器集群來分擔(dān)請求數(shù)。應(yīng)用服務(wù)器前面部署負載均衡服務(wù)器調(diào)度用戶請求,根據(jù)分發(fā)策略將請求分發(fā)到多個應(yīng)用服務(wù)器節(jié)點。
常用的負載均衡技術(shù)硬件的有F5,價格比較貴,軟件的有LVS、Nginx、HAProxy。LVS是四層負載均衡,根據(jù)目標(biāo)地址和端口選擇內(nèi)部服務(wù)器,Nginx和HAProxy是七層負載均衡,可以根據(jù)報文內(nèi)容選擇內(nèi)部服務(wù)器,因此LVS分發(fā)路徑優(yōu)于Nginx和HAProxy,性能要高些,而Nginx和HAProxy則更具配置性,如可以用來做動靜分離(根據(jù)請求報文特征,選擇靜態(tài)資源服務(wù)器還是應(yīng)用服務(wù)器)。
隨著用戶量的增加,數(shù)據(jù)庫成為最大的瓶頸,改善數(shù)據(jù)庫性能常用的手段是進行讀寫分離以及分庫分表,讀寫分離顧名思義就是將數(shù)據(jù)庫分為讀庫和寫庫,通過主備功能實現(xiàn)數(shù)據(jù)同步。分庫分表則分為水平切分和垂直切分,水平切分則是對一個數(shù)據(jù)庫特大的表進行拆分,例如用戶表。垂直切分則是根據(jù)業(yè)務(wù)的不同來切分,如用戶業(yè)務(wù)、商品業(yè)務(wù)相關(guān)的表放在不同的數(shù)據(jù)庫中。
假如我們的服務(wù)器都部署在成都的機房,對于四川的用戶來說訪問是較快的,而對于北京的用戶訪問是較慢的,這是由于四川和北京分別屬于電信和聯(lián)通的不同發(fā)達地區(qū),北京用戶訪問需要通過互聯(lián)路由器經(jīng)過較長的路徑才能訪問到成都的服務(wù)器,返回路徑也一樣,所以數(shù)據(jù)傳輸時間比較長。對于這種情況,常常使用CDN解決,CDN將數(shù)據(jù)內(nèi)容緩存到運營商的機房,用戶訪問時先從最近的運營商獲取數(shù)據(jù),這樣大大減少了網(wǎng)絡(luò)訪問的路徑。比較專業(yè)的CDN運營商有藍汛、網(wǎng)宿。
而反向代理,則是部署在網(wǎng)站的機房,當(dāng)用戶請求達到時首先訪問反向代理服務(wù)器,反向代理服務(wù)器將緩存的數(shù)據(jù)返回給用戶,如果沒有緩存數(shù)據(jù)才會繼續(xù)訪問應(yīng)用服務(wù)器獲取,這樣做減少了獲取數(shù)據(jù)的成本。反向代理有Squid、Nginx。
用戶一天天增加,業(yè)務(wù)量越來越大,產(chǎn)生的文件越來越多,單臺的文件服務(wù)器已經(jīng)不能滿足需求,這時就需要分布式文件系統(tǒng)的支撐。常用的分布式文件系統(tǒng)有GFS、HDFS、TFS。
對于海量數(shù)據(jù)的查詢和分析,我們使用NoSQL數(shù)據(jù)庫加上搜索引擎可以達到更好的性能。并不是所有的數(shù)據(jù)都要放在關(guān)系型數(shù)據(jù)中。常用的NoSQL有MongoDB、HBase、Redis,搜索引擎有Lucene、Solr、Elasticsearch。
隨著業(yè)務(wù)進一步擴展,應(yīng)用程序變得非常臃腫,這時我們需要將應(yīng)用程序進行業(yè)務(wù)拆分,如百度分為新聞、網(wǎng)頁、圖片等業(yè)務(wù)。每個業(yè)務(wù)應(yīng)用負責(zé)相對獨立的業(yè)務(wù)運作。業(yè)務(wù)之間通過消息進行通信或者共享數(shù)據(jù)庫來實現(xiàn)。
這時我們發(fā)現(xiàn)各個業(yè)務(wù)應(yīng)用都會使用到一些基本的業(yè)務(wù)服務(wù),例如用戶服務(wù)、訂單服務(wù)、支付服務(wù)、安全服務(wù),這些服務(wù)是支撐各業(yè)務(wù)應(yīng)用的基本要素。我們將這些服務(wù)抽取出來利用分部式服務(wù)框架搭建分布式服務(wù)。阿里的Dubbo是一個不錯的選擇。
分布式大型網(wǎng)站,目前看主要有幾類:
大型門戶一般是新聞類信息,可以使用CDN,靜態(tài)化等方式優(yōu)化,開心網(wǎng)等交互性比較多,可能會引入更多的NoSQL,分布式緩存,使用高性能的通信框架等。電商網(wǎng)站具備以上兩類的特點,比如產(chǎn)品詳情可以采用CDN,靜態(tài)化,交互性高的需要采用NoSQL等技術(shù)。因此,我們采用電商網(wǎng)站作為案例,進行分析。
客戶需求:
客戶就是客戶,不會告訴你具體要什么,只會告訴你他想要什么,我們很多時候要引導(dǎo),挖掘客戶的需求。好在提供了明確的參考網(wǎng)站。因此,下一步要進行大量的分析,結(jié)合行業(yè),以及參考網(wǎng)站,給客戶提供方案。
需求功能矩陣
需求管理傳統(tǒng)的做法,會使用用例圖或模塊圖(需求列表)進行需求的描述。這樣做常常忽視掉一個很重要的需求(非功能需求),因此推薦大家使用需求功能矩陣,進行需求描述。
本電商網(wǎng)站的需求矩陣如下:
一般網(wǎng)站,剛開始的做法,是三臺服務(wù)器,一臺部署應(yīng)用,一臺部署數(shù)據(jù)庫,一臺部署NFS文件系統(tǒng)。
這是前幾年比較傳統(tǒng)的做法,之前見到一個網(wǎng)站10萬多會員,垂直服裝設(shè)計門戶,N多圖片。使用了一臺服務(wù)器部署了應(yīng)用,數(shù)據(jù)庫以及圖片存儲。出現(xiàn)了很多性能問題。
如下圖:
但是,目前主流的網(wǎng)站架構(gòu)已經(jīng)發(fā)生了翻天覆地的變化。一般都會采用集群的方式,進行高可用設(shè)計。至少是下面這個樣子:
預(yù)估步驟:
根據(jù)客戶需求:3~5年用戶數(shù)達到1000萬注冊用戶,可以做每秒并發(fā)數(shù)預(yù)估:
沒好好學(xué)數(shù)學(xué)后悔了吧?!(不知道以上算是否有錯誤,呵呵~~)
服務(wù)器預(yù)估:(以tomcat服務(wù)器舉例)
按一臺web服務(wù)器,支持每秒300個并發(fā)計算。平常需要10臺服務(wù)器(約等于);[tomcat默認配置是150],高峰期需要30臺服務(wù)器;
容量預(yù)估:70/90原則
系統(tǒng)CPU一般維持在70%左右的水平,高峰期達到90%的水平,是不浪費資源,并比較穩(wěn)定的。內(nèi)存,IO類似。
以上預(yù)估僅供參考,因為服務(wù)器配置,業(yè)務(wù)邏輯復(fù)雜度等都有影響。在此CPU,硬盤,網(wǎng)絡(luò)等不再進行評估。
根據(jù)以上預(yù)估,有幾個問題:
大型網(wǎng)站一般需要做以下架構(gòu)優(yōu)化(優(yōu)化是架構(gòu)設(shè)計時,就要考慮的,一般從架構(gòu)/代碼級別解決,調(diào)優(yōu)主要是簡單參數(shù)的調(diào)整,比如JVM調(diào)優(yōu);如果調(diào)優(yōu)涉及大量代碼改造,就不是調(diào)優(yōu)了,屬于重構(gòu)):
根據(jù)業(yè)務(wù)屬性進行垂直切分,劃分為產(chǎn)品子系統(tǒng),購物子系統(tǒng),支付子系統(tǒng),評論子系統(tǒng),客服子系統(tǒng),接口子系統(tǒng)(對接如進銷存,短信等外部系統(tǒng))。
根據(jù)業(yè)務(wù)子系統(tǒng)進行等級定義,可分為核心系統(tǒng)和非核心系統(tǒng)。核心系統(tǒng):產(chǎn)品子系統(tǒng),購物子系統(tǒng),支付子系統(tǒng);非核心:評論子系統(tǒng),客服子系統(tǒng),接口子系統(tǒng)。
業(yè)務(wù)拆分作用:提升為子系統(tǒng)可由專門的團隊和部門負責(zé),專業(yè)的人做專業(yè)的事,解決模塊之間耦合以及擴展性問題;每個子系統(tǒng)單獨部署,避免集中部署導(dǎo)致一個應(yīng)用掛了,全部應(yīng)用不可用的問題。
等級定義作用:用于流量突發(fā)時,對關(guān)鍵應(yīng)用進行保護,實現(xiàn)優(yōu)雅降級;保護關(guān)鍵應(yīng)用不受到影響。
拆分后的架構(gòu)圖:
參考部署方案2
如上圖每個應(yīng)用單獨部署,核心系統(tǒng)和非核心系統(tǒng)組合部署
集群部署后架構(gòu)圖:
緩存按照存放的位置一般可分為兩類本地緩存和分布式緩存。本案例采用二級緩存的方式,進行緩存的設(shè)計。一級緩存為本地緩存,二級緩存為分布式緩存。(還有頁面緩存,片段緩存等,那是更細粒度的劃分)
一級緩存,緩存數(shù)據(jù)字典,和常用熱點數(shù)據(jù)等基本不可變/有規(guī)則變化的信息,二級緩存緩存需要的所有緩存。當(dāng)一級緩存過期或不可用時,訪問二級緩存的數(shù)據(jù)。如果二級緩存也沒有,則訪問數(shù)據(jù)庫。
緩存的比例,一般1:4,即可考慮使用緩存。(理論上是1:2即可)。
根據(jù)業(yè)務(wù)特性可使用以下緩存過期策略:
系統(tǒng)分割為多個子系統(tǒng),獨立部署后,不可避免的會遇到會話管理的問題。一般可采用Session同步,Cookies,分布式Session方式。電商網(wǎng)站一般采用分布式Session實現(xiàn)。
再進一步可以根據(jù)分布式Session,建立完善的單點登錄或賬戶管理系統(tǒng)。
流程說明
大型網(wǎng)站需要存儲海量的數(shù)據(jù),為達到海量數(shù)據(jù)存儲,高可用,高性能一般采用冗余的方式進行系統(tǒng)設(shè)計。一般有兩種方式讀寫分離和分庫分表。
讀寫分離:一般解決讀比例遠大于寫比例的場景,可采用一主一備,一主多備或多主多備方式。
本案例在業(yè)務(wù)拆分的基礎(chǔ)上,結(jié)合分庫分表和讀寫分離。如下圖:
相關(guān)中間件可參考Cobar(阿里,目前已不在維護),TDDL(阿里),Atlas(奇虎360),MyCat。
分庫分表后序列的問題,JOIN,事務(wù)的問題,會在分庫分表主題分享中,介紹。
將多個子系統(tǒng)公用的功能/模塊,進行抽取,作為公用服務(wù)使用。比如本案例的會員子系統(tǒng)就可以抽取為公用的服務(wù)。
消息隊列可以解決子系統(tǒng)/模塊之間的耦合,實現(xiàn)異步,高可用,高性能的系統(tǒng)。是分布式系統(tǒng)的標(biāo)準(zhǔn)配置。本案例中,消息隊列主要應(yīng)用在購物,配送環(huán)節(jié)。
目前使用較多的MQ有Active MQ、Rabbit MQ、Zero MQ、MS MQ等,需要根據(jù)具體的業(yè)務(wù)場景進行選擇。建議可以研究下Rabbit MQ。
除了以上介紹的業(yè)務(wù)拆分,應(yīng)用集群,多級緩存,單點登錄,數(shù)據(jù)庫集群,服務(wù)化,消息隊列外。還有CDN,反向代理,分布式文件系統(tǒng),大數(shù)據(jù)處理等系統(tǒng)。
此處不詳細介紹,大家可以問度娘/Google,有機會的話也可以分享給大家。
大型網(wǎng)站的架構(gòu)是根據(jù)業(yè)務(wù)需求不斷完善的,根據(jù)不同的業(yè)務(wù)特征會做特定的設(shè)計和考慮,本文只是講述一個常規(guī)大型網(wǎng)站會涉及的一些技術(shù)和手段,希望能給大家?guī)韱l(fā)。
作者介紹
爛豬皮,十余年工作經(jīng)驗,曾在 Google 等外企工作過幾年,精通 Java、分布式架構(gòu)、微服務(wù)架構(gòu)以及數(shù)據(jù)庫,最近正在研究大數(shù)據(jù)以及區(qū)塊鏈,希望能突破到更高的境界。

我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流