一個支撐千萬級PV的網(wǎng)站是非??简炓粋€架構是否成熟、健壯(本文不涉及軟件架構的層面,有興趣也可以討論)?,F(xiàn)拋出一個系統(tǒng)層面的架構,不保證是最優(yōu)的方案,但也許適合你。理由是再優(yōu)秀的架構都不具備通用性,需要根據(jù)每種應用特點針對性來設計。
架構說明:
1)架構中直接引入軟件名稱的模塊,是個人推薦使用的,如Haproxy、Hadoop等;
2)關于全局負載均衡,看成本投入情況,可以使用商業(yè)的產(chǎn)品,如F5-GTM,開源方案便是自搭智能DNS;
3)本地負載均衡方案,可以考慮F5-LTM或成熟的開源解決方案LVS;
4)代理層為什么推薦大家使用Haproxy?Haproxy是一個非常優(yōu)秀的反向代理軟件,十分高效、穩(wěn)定。國內(nèi)top 10的互聯(lián)網(wǎng)公司都有在使用;
5)緩存層可以使用Squid或Varnish,個人更傾向Varnish。配置靈活、運行穩(wěn)定,提供非常便利的管理接口。為啥在緩存層前面加一層代理?優(yōu)點非常多,列舉如下:
- 根據(jù)應用配置URI路由規(guī)則,集中熱點來提高后端緩存的命中率;
- 輕松劃分網(wǎng)站頻道、版塊,更好對應用進步組織、規(guī)劃;
- 對URI進行一般性安全過濾,抵御注入攻擊;
- 彈性調(diào)配硬件資源,應對突發(fā)事件產(chǎn)生大流量;
- 可回收寶貴的公網(wǎng)IP資源;
6)應用層開源技術方案非常多且成熟,在此不詳細描述;
7)數(shù)據(jù)庫層主流開源解決方案Mysql是首選,主從復制(一主對多從)是目前比較靠譜的模式;
8)關于Nosql,應用場景不多說,redis、memcached等作為熱點數(shù)據(jù)存儲、數(shù)據(jù)庫緩存都非常理想;
9)內(nèi)網(wǎng)DNS扮演的角色非常重要,一定要消滅code中出現(xiàn)的內(nèi)網(wǎng)IP地址,很大程度減少因IP變更、服務器故障而修改源碼的情況,同時也便于維護;
10)內(nèi)網(wǎng)LB適用在內(nèi)部WEB接口、多臺數(shù)據(jù)庫Slave、多臺Nosql Slave、公共服務等應用的負載均衡,可以使用LVS、Haproxy來實現(xiàn),可用性要求不高的應用可行直接使用Localhost DNS輪詢;
11)hadoop適合海量數(shù)據(jù)的存儲與處理,如做網(wǎng)站日志分析、用戶數(shù)據(jù)挖掘等;
12)管理集群,平臺的核心,運維的陣地;
以上粗略介紹了架構的幾個組成部分