掃二維碼與項(xiàng)目經(jīng)理溝通
我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
[[313105]]

前言
高并發(fā)經(jīng)常會(huì)發(fā)生在有大活躍用戶量,用戶高聚集的業(yè)務(wù)場景中,如:秒殺活動(dòng),定時(shí)領(lǐng)取紅包等。
為了讓業(yè)務(wù)可以流暢的運(yùn)行并且給用戶一個(gè)好的交互體驗(yàn),我們需要根據(jù)業(yè)務(wù)場景預(yù)估達(dá)到的并發(fā)量等因素,來設(shè)計(jì)適合自己業(yè)務(wù)場景的高并發(fā)處理方案。
在電商相關(guān)產(chǎn)品開發(fā)的這些年,我有幸的遇到了并發(fā)下的各種坑,這一路摸爬滾打過來有著不少的血淚史,這里進(jìn)行的總結(jié),作為自己的歸檔記錄,同時(shí)分享給大家。
服務(wù)器架構(gòu)
業(yè)務(wù)從發(fā)展的初期到逐漸成熟,服務(wù)器架構(gòu)也是從相對(duì)單一到集群,再到分布式服務(wù)。
一個(gè)可以支持高并發(fā)的服務(wù)少不了好的服務(wù)器架構(gòu),需要有均衡負(fù)載,數(shù)據(jù)庫需要主從集群,nosql緩存需要主從集群,靜態(tài)文件需要上傳cdn,這些都是能讓業(yè)務(wù)程序流暢運(yùn)行的強(qiáng)大后盾。
服務(wù)器這塊多是需要運(yùn)維人員來配合搭建,具體我就不多說了,點(diǎn)到為止。
大致需要用到的服務(wù)器架構(gòu)如下:
并發(fā)測試
高并發(fā)相關(guān)的業(yè)務(wù),需要進(jìn)行并發(fā)的測試,通過大量的數(shù)據(jù)分析評(píng)估出整個(gè)架構(gòu)可以支撐的并發(fā)量。
測試高并發(fā)可以使用第三方服務(wù)器或者自己測試服務(wù)器,利用測試工具進(jìn)行并發(fā)請(qǐng)求測試,分析測試數(shù)據(jù)得到可以支撐并發(fā)數(shù)量的評(píng)估,這個(gè)可以作為一個(gè)預(yù)警參考,俗話說知己自彼百戰(zhàn)不殆。
第三方服務(wù):
阿里云性能測試
并發(fā)測試工具:
實(shí)戰(zhàn)方案
通用方案
日用戶流量大,但是比較分散,偶爾會(huì)有用戶高聚的情況;
場景: 用戶簽到,用戶中心,用戶訂單,等
服務(wù)器架構(gòu)圖:
說明:
場景中的這些業(yè)務(wù)基本是用戶進(jìn)入APP后會(huì)操作到的,除了活動(dòng)日(618,雙11,等),這些業(yè)務(wù)的用戶量都不會(huì)高聚集,同時(shí)這些業(yè)務(wù)相關(guān)的表都是大數(shù)據(jù)表,業(yè)務(wù)多是查詢操作,所以我們需要減少用戶直接命中DB的查詢;優(yōu)先查詢緩存,如果緩存不存在,再進(jìn)行DB查詢,將查詢結(jié)果緩存起來。
更新用戶相關(guān)緩存需要分布式存儲(chǔ),比如使用用戶ID進(jìn)行hash分組,把用戶分布到不同的緩存中,這樣一個(gè)緩存集合的總量不會(huì)很大,不會(huì)影響查詢效率。
方案如:
以上例子是一個(gè)相對(duì)簡單的高并發(fā)架構(gòu),并發(fā)量不是很高的情況可以很好的支撐,但是隨著業(yè)務(wù)的壯大,用戶并發(fā)量增加,我們的架構(gòu)也會(huì)進(jìn)行不斷的優(yōu)化和演變,比如對(duì)業(yè)務(wù)進(jìn)行服務(wù)化,每個(gè)服務(wù)有自己的并發(fā)架構(gòu),自己的均衡服務(wù)器,分布式數(shù)據(jù)庫,nosql主從集群,如:用戶服務(wù)、訂單服務(wù);
消息隊(duì)列
秒殺、秒搶等活動(dòng)業(yè)務(wù),用戶在瞬間涌入產(chǎn)生高并發(fā)請(qǐng)求
場景:定時(shí)領(lǐng)取紅包,等
服務(wù)器架構(gòu)圖:
說明:
場景中的定時(shí)領(lǐng)取是一個(gè)高并發(fā)的業(yè)務(wù),像秒殺活動(dòng)用戶會(huì)在到點(diǎn)的時(shí)間涌入,DB瞬間就接受到一記暴擊,hold不住就會(huì)宕機(jī),然后影響整個(gè)業(yè)務(wù);
像這種不是只有查詢的操作并且會(huì)有高并發(fā)的插入或者更新數(shù)據(jù)的業(yè)務(wù),前面提到的通用方案就無法支撐,并發(fā)的時(shí)候都是直接命中DB;
設(shè)計(jì)這塊業(yè)務(wù)的時(shí)候就會(huì)使用消息隊(duì)列的,可以將參與用戶的信息添加到消息隊(duì)列中,然后再寫個(gè)多線程程序去消耗隊(duì)列,給隊(duì)列中的用戶發(fā)放紅包;
方案如:
附加:
通過消息隊(duì)列可以做很多的服務(wù)。
如:定時(shí)短信發(fā)送服務(wù),使用sset(sorted set),發(fā)送時(shí)間戳作為排序依據(jù),短信數(shù)據(jù)隊(duì)列根據(jù)時(shí)間升序,然后寫個(gè)程序定時(shí)循環(huán)去讀取sset隊(duì)列中的第一條,當(dāng)前時(shí)間是否超過發(fā)送時(shí)間,如果超過就進(jìn)行短信發(fā)送。
一級(jí)緩存
高并發(fā)請(qǐng)求連接緩存服務(wù)器超出服務(wù)器能夠接收的請(qǐng)求連接量,部分用戶出現(xiàn)建立連接超時(shí)無法讀取到數(shù)據(jù)的問題;
因此需要有個(gè)方案當(dāng)高并發(fā)時(shí)候時(shí)候可以減少命中緩存服務(wù)器;
這時(shí)候就出現(xiàn)了一級(jí)緩存的方案,一級(jí)緩存就是使用站點(diǎn)服務(wù)器緩存去存儲(chǔ)數(shù)據(jù),注意只存儲(chǔ)部分請(qǐng)求量大的數(shù)據(jù),并且緩存的數(shù)據(jù)量要控制,不能過分的使用站點(diǎn)服務(wù)器的內(nèi)存而影響了站點(diǎn)應(yīng)用程序的正常運(yùn)行,一級(jí)緩存需要設(shè)置秒單位的過期時(shí)間,具體時(shí)間根據(jù)業(yè)務(wù)場景設(shè)定,目的是當(dāng)有高并發(fā)請(qǐng)求的時(shí)候可以讓數(shù)據(jù)的獲取命中到一級(jí)緩存,而不用連接緩存nosql數(shù)據(jù)服務(wù)器,減少nosql數(shù)據(jù)服務(wù)器的壓力
比如APP首屏商品數(shù)據(jù)接口,這些數(shù)據(jù)是公共的不會(huì)針對(duì)用戶自定義,而且這些數(shù)據(jù)不會(huì)頻繁的更新,像這種接口的請(qǐng)求量比較大就可以加入一級(jí)緩存;
服務(wù)器架構(gòu)圖:
合理的規(guī)范和使用nosql緩存數(shù)據(jù)庫,根據(jù)業(yè)務(wù)拆分緩存數(shù)據(jù)庫的集群,這樣基本可以很好支持業(yè)務(wù),一級(jí)緩存畢竟是使用站點(diǎn)服務(wù)器緩存所以還是要善用。
靜態(tài)化數(shù)據(jù)
高并發(fā)請(qǐng)求數(shù)據(jù)不變化的情況下如果可以不請(qǐng)求自己的服務(wù)器獲取數(shù)據(jù)那就可以減少服務(wù)器的資源壓力。
對(duì)于更新頻繁度不高,并且數(shù)據(jù)允許短時(shí)間內(nèi)的延遲,可以通過數(shù)據(jù)靜態(tài)化成JSON,XML,HTML等數(shù)據(jù)文件上傳CDN,在拉取數(shù)據(jù)的時(shí)候優(yōu)先到CDN拉取,如果沒有獲取到數(shù)據(jù)再從緩存,數(shù)據(jù)庫中獲取,當(dāng)管理人員操作后臺(tái)編輯數(shù)據(jù)再重新生成靜態(tài)文件上傳同步到CDN,這樣在高并發(fā)的時(shí)候可以使數(shù)據(jù)的獲取命中在CDN服務(wù)器上。
CDN節(jié)點(diǎn)同步有一定的延遲性,所以找一個(gè)靠譜的CDN服務(wù)器商也很重要
其他方案
對(duì)于更新頻繁度不高的數(shù)據(jù),APP,PC瀏覽器,可以緩存數(shù)據(jù)到本地,然后每次請(qǐng)求接口的時(shí)候上傳當(dāng)前緩存數(shù)據(jù)的版本號(hào),服務(wù)端接收到版本號(hào)判斷版本號(hào)與最新數(shù)據(jù)版本號(hào)是否一致,如果不一樣就進(jìn)行最新數(shù)據(jù)的查詢并返回最新數(shù)據(jù)和最新版本號(hào),如果一樣就返回狀態(tài)碼告知數(shù)據(jù)已經(jīng)是最新。減少服務(wù)器壓力:資源、帶寬等.
分層,分割,分布式
大型網(wǎng)站要很好支撐高并發(fā),這是需要長期的規(guī)劃設(shè)計(jì)
在初期就需要把系統(tǒng)進(jìn)行分層,在發(fā)展過程中把核心業(yè)務(wù)進(jìn)行拆分成模塊單元,根據(jù)需求進(jìn)行分布式部署,可以進(jìn)行獨(dú)立團(tuán)隊(duì)維護(hù)開發(fā)。
網(wǎng)站分層-圖1
集群
對(duì)于用戶訪問集中的業(yè)務(wù)獨(dú)立部署服務(wù)器,應(yīng)用服務(wù)器,數(shù)據(jù)庫,nosql數(shù)據(jù)庫。 核心業(yè)務(wù)基本上需要搭建集群,即多臺(tái)服務(wù)器部署相同的應(yīng)用構(gòu)成一個(gè)集群,通過負(fù)載均衡設(shè)備共同對(duì)外提供服務(wù), 服務(wù)器集群能夠?yàn)橄嗤姆?wù)提供更多的并發(fā)支持,因此當(dāng)有更多的用戶訪問時(shí),只需要向集群中加入新的機(jī)器即可, 另外可以實(shí)現(xiàn)當(dāng)其中的某臺(tái)服務(wù)器發(fā)生故障時(shí),可以通過負(fù)載均衡的失效轉(zhuǎn)移機(jī)制將請(qǐng)求轉(zhuǎn)移至集群中其他的服務(wù)器上,因此可以提高系統(tǒng)的可用性
通過反向代理均衡負(fù)載-圖2來自網(wǎng)絡(luò)
異步
在高并發(fā)業(yè)務(wù)中如果涉及到數(shù)據(jù)庫操作,主要壓力都是在數(shù)據(jù)庫服務(wù)器上面,雖然使用主從分離,但是數(shù)據(jù)庫操作都是在主庫上操作,單臺(tái)數(shù)據(jù)庫服務(wù)器連接池允許的最大連接數(shù)量是有限的
當(dāng)連接數(shù)量達(dá)到最大值的時(shí)候,其他需要連接數(shù)據(jù)操作的請(qǐng)求就需要等待有空閑的連接,這樣高并發(fā)的時(shí)候很多請(qǐng)求就會(huì)出現(xiàn)connection time out 的情況
那么像這種高并發(fā)業(yè)務(wù)我們要如何設(shè)計(jì)開發(fā)方案可以降低數(shù)據(jù)庫服務(wù)器的壓力呢?
緩存
高并發(fā)業(yè)務(wù)接口多數(shù)都是進(jìn)行業(yè)務(wù)數(shù)據(jù)的查詢,如:商品列表,商品信息,用戶信息,紅包信息等,這些數(shù)據(jù)都是不會(huì)經(jīng)常變化,并且持久化在數(shù)據(jù)庫中
高并發(fā)的情況下直接連接從庫做查詢操作,多臺(tái)從庫服務(wù)器也抗不住這么大量的連接請(qǐng)求數(shù)(前面說過,單臺(tái)數(shù)據(jù)庫服務(wù)器允許的最大連接數(shù)量是有限的)
那么我們?cè)谶@種高并發(fā)的業(yè)務(wù)接口要如何設(shè)計(jì)呢?
面向服務(wù)
使用服務(wù)化思維,將核心業(yè)務(wù)或者通用的業(yè)務(wù)功能抽離成服務(wù)獨(dú)立部署,對(duì)外提供接口的方式提供功能。
最理想化的設(shè)計(jì)是可以把一個(gè)復(fù)雜的系統(tǒng)抽離成多個(gè)服務(wù),共同組成系統(tǒng)的業(yè)務(wù),優(yōu)點(diǎn):松耦合,高可用性,高伸縮性,易維護(hù)。
通過面向服務(wù)化設(shè)計(jì),獨(dú)立服務(wù)器部署,均衡負(fù)載,數(shù)據(jù)庫集群,可以讓服務(wù)支撐更高的并發(fā)
冗余,自動(dòng)化
當(dāng)高并發(fā)業(yè)務(wù)所在的服務(wù)器出現(xiàn)宕機(jī)的時(shí)候,需要有備用服務(wù)器進(jìn)行快速的替代,在應(yīng)用服務(wù)器壓力大的時(shí)候可以快速添加機(jī)器到集群中,所以我們就需要有備用機(jī)器可以隨時(shí)待命。 最理想的方式是可以通過自動(dòng)化監(jiān)控服務(wù)器資源消耗來進(jìn)行報(bào)警,自動(dòng)切換降級(jí)方案,自動(dòng)的進(jìn)行服務(wù)器替換和添加操作等,通過自動(dòng)化可以減少人工的操作的成本,而且可以快速操作,避免人為操作上面的失誤。
通過GitLab事件,我們應(yīng)該反思,做了備份數(shù)據(jù)并不代表就萬無一失了,我們需要保證高可用性,首先備份是否正常進(jìn)行,備份數(shù)據(jù)是否可用,需要我們進(jìn)行定期的檢查,或者自動(dòng)化監(jiān)控, 還有包括如何避免人為上的操作失誤問題。(不過事件中g(shù)itlab的開放性姿態(tài),積極的處理方式還是值得學(xué)習(xí)的)

我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流