`

淘宝网技术架构的发展过程

 
阅读更多

   淘宝网从2003年开始创办到今,已经成为了个快速发展,海量数据交易的大型网站,截止2011年,在线商品数达到了6.8亿,pv(用户浏览量,在一定程度上能代表网站的承载量)达到了30亿,uv达到8500万,用户数达到5.5亿,活跃用户数达到一亿,成交额从2008年的999亿达到了2011年的6300亿,并每年继续以很快的额速度增长。这些巨大数字的背后是伴随着网站的发展技术的变迁。

    版本1.0:这是一个淘宝网最初开发的版本,当时采用的是LAMP:(linux apache mysql php)的架构。这也是当时流行的web框架,其低层的存储数据库采用mySQL读写分离的方式,采用主库备库的方式,备库是主库的镜像拷贝,主要负责读数据的操作,主库则进行最新数据的读写操作,并把最新的数据更新到备库,保持数据的实时性。主备分离有几个好处:1.能便于异地容灾,主库挂了,备库能快速应用起来,介绍的down机器的时间。2. 主库一般进行增删改的操作,从库进行读操作,这样就介绍了主库的压力,能够起到负载均衡的作用。 3.能进行数据的集中分发。

      但是mySQL数据库引擎有一个特点,每读一条数据时都要全表锁住,这样就造成性能的损失,因此开始考虑把mySQL数据库转换成oracle数据库。但是这样又出现了一个新的问题,php和oracle是很不兼容搭配的,oracle数据库有;连接池的概念,而且连接数量也很少。曾经的易贝遇到这个问题时引入BEA中间件解决这个问题,但是价格很高,这对于刚发展起来的淘宝网是一个不能忍受的问题。这时,淘宝内部的架构师就在php和数据库之间加了一个中间层SQL relay,但是这个中间层的一个致命的缺点是容易出现死机的问题。

   2004.2--2005.3,v2.0版本出来了,这个版本与前一版本的主要不同主要体现在下面几个方面:

   A: 从php开发语言转化成了java语言,由于遇到了抓换语言高学习成本的问你,当时就外包给了发明java语言的sun公司的员工的人,一是考虑到了他们能保证转换语言的速度,另一个原因也许就是他们也曾经帮助易贝解决过类似的问题,这样能从那边挖掘到更多的信息和经验。

  B: 自己做了一个mvc的框架webx,但是虽然struct的框架很流行,但是由于其低层封装太死难以控制。

  C:项目的管理工具应用了Antx。

  D:引入了搜索引擎ISearch。这样就可以在数据库中建立索引,能把节点索引数据dump到数据库中。提高查询效率。

不过,当时的web部署服务器采用的是BEA公司的weblogic,虽然淘宝业务的扩大,服务器已经增加到了1000来台,而EBA公司需要进行每年一个cpu一千美金的收费。这样不得不又要变化其他的部署服务器,一个在很久以前就有架构师试验的一个部署到的jboss的论坛系统的基础,使得采用jboss服务器部署毋庸置疑,而且也有好的经验积累的。

 

。。。待续

分享到:
评论

相关推荐

    大型网站技术架构:核心原理与案例分析

    9 淘宝网的架构演化案例分析 10 维基百科的高性能架构设计分析 11 海量分布式存储系统Doris的高可用架构设计分析 12 网购秒杀系统架构设计案例分析 13 大型网站典型故障案例分析 第4篇 架构师 14 架构师领导...

    中国知名网站架构剖析-淘宝网

    中国知名网站架构剖析-淘宝网 从淘宝网的成长到壮大,一步步剖析,向我们展示了淘宝网的技术发展历程。

    淘宝技术这十年

    它在发展过程中会遇到各种各样的问题和业务带来的压力。正是这些问题和压力推动着技术的进步和发展,而技术的发展反过来又会促进业务的更大提升。如今淘宝网的流量排名已是全球前15名、国内前3名,其系统服务器也从...

    淘宝技术这十年.pdf

    如今淘宝网的流量排名已是全球前15名、国内前3名,其系统服务器也从一台发展到万台以上。 《淘宝技术这十年》从工程师的角度讲述淘宝这个超大规模互联网系统的成长历程,及其所有主动和被动的技术变革的前因后果。...

    淘宝技术这十年 高清

    它在发展过程中会遇到各种各样的问题和业务带来的压力。正是这些问题和压力推动着技术的进步和发展,而技术的发展反过来又会促进业务的更大提升。如今淘宝网的流量排名已是全球前 15 名、国内前 3 名,其系统服务器...

    淘宝技术这十年,完整最终确认版

    它在发展过程中会遇到各种各样的问题和业务带来的压力。正是这些问题和压力推动着技术的进步和发展,而技术的发展反过来又会促进业务的更大提升。如今淘宝网的流量排名已是全球前15名、国内前3名,其系统服务器也从...

    淘宝技术这十年 完整版 带批注

    它在发展过程中会遇到各种各样的问题和业务带来的压力。正是这些问题和压力推动着技术的进步和发展,而技术的发展反过来又会促进业务的更大提升。如今淘宝网的流量排名已是全球前15名、国内前3名,其系统服务器也从...

    淘宝技术嘉年华峰会上的7月10日全部PPT下载

    【13:30 - 14:30】 淘宝海量数据产品的技术架构 张轩丞/朋春(淘宝网) 【14:45 - 15:45】 可视化与可视分析-从数据拥有者到数据用户的桥梁 袁晓如(北京大学信息科学技术学院 ) 【15:45 - 16:45】 下一代推荐引擎...

    淘宝网Nginx应用、定制与开发实战.pdf[书签版]

    淘宝网使用Nginx的过程 淘宝网应用Nginx的收益 2、应用案例分析 Web接入层 大用户群消息推送 发布与A/B Testing 日志收集不统计系统 RESTful接口层 分布式防攻击系统 TMD系统架构图 3、开发不定制 组合JavaScript和...

Global site tag (gtag.js) - Google Analytics