乐迷社区 和乐迷做兄弟 与乐迷共进步
乐迷社区»版 块 超级电视 乐视盒子 乐视的网站运维人员学着点吧,7件你们根本没考虑的事情 ...
2013-1-21 12:04:17 13736 跳转到指定楼层
今天看到乐视这抢购
真是一出悲剧
我有接近10年的互联网运维经验
简直是都看不下去了
如果不是你们故意的
只能说你们负责这块的是初学者

1.网上商城来说
我就没看过预订量超过13w的还敢用ecshop这种标准化的第三方网上商城程序的
这种程序都是做网页制作的公司
改改模版以几万到十几万(看销售忽悠能力)卖给从来没做过互联网销售的公司的
预计这种程序的成交量每秒不过几十到上百笔
你有13w的预定(假定是真的)
页面响应速度你们到底按照多少秒来算的?
就算10s.这量也是能估算出来的.

2.没有做负载均衡
一般到这么大量.肯定是要前端做负载均衡
按照目前情况来看
一直都是报文件出错
这就是一台php服务器压力太大导致文件响应不及出现的
如果做了.至少在某一个零星时刻会有用户完成业务
目前看到都是挤在一台服务器上.一个挂大家统统挂

3.即便不做负载均衡.双机热备也是肯定要做的
做不了负载均衡,那肯定是程序方面问题
(按照乐视来看应该不会是硬件关系,CDN这么多怎么可能不知道负载均衡)
就算ezshop的程序很难部署到多台服务器上
那么双机热备总要做的
多台服务器部署一样的环境
如果一台宕机应该快速利用lvs或者f1之类的负载均衡设备手工切换到另外一台
这样至少能保证问题不会一直拖延着
而目前看到即便过了1个半小时
服务器还没有恢复
在访问量已经过了高峰这么久.如果有备机怎么可能出现需要修1个多小时的事情?

4.你们不做压力测试么?
一般做服务器规划的时候都要预计用户访问量
访问量包括平均访问量以及高峰访问量
一般用平均访问量和高峰访问量的平均数来计算服务器负载
包括结合前面提到的用户平均响应时间来算带宽负载
而你们在昨天统计到13w预定的情况下
昨晚上居然没有加班通宵做压力测试?!
真是难以想象你们的技术负责人在做什么?陪老板开香槟?!

5.PHP和MYSQL分开了么?!
估计根本没有
你们这次出错都是前端PHP服务器挂了.都没看到过MYSQL链接超数量等等真正压力大的问题
如果你们做了压力测试.可以很明显的知道是PHP服务器压力过大
多部署点PHP前端服务器就行了
结果是一个前端挂了.就没有任何人能访问了.

6.PHP服务器根本没优化
各种报错
这种报错还透露给用户看到
我就敢肯定你们连php.ini文件都没优化过
都是默认值

6.安全一塌糊涂
有哪怕一点点运维经验的人
都知道PHP报错是绝对不能让别人看到的
因为这样很可能暴露服务器相关信息以及连接信息和程序信息
你们这么明白明的报错.
任何一个scriptkids去底下网站找找ezshop的漏洞都可能拿到你们的root权限

7.完全就没有紧急预案
你们有PLAN B么?
完全没有!
从一个网站崩溃要用2小时来修
并且没有预留的无法访问页面来看
看得出你们连一点准备都没!!!
如果是一个刚做电子商务的小公司可以原谅
如果是PHP开发顺便管服务器运维可以原谅
但是你们是一个上市公司.
一个有13w预订量的商城
一个访问压力太大的问题.需要2小时来修复
我们以前一台服务器硬盘挂了从备份恢复到上线也不过4小时,还是带安装系统时间的
如果有空闲部署好环境的备机
从数据恢复到上线不过30分钟
如果和你们一样有预先的访问量预计
最差环境下也会在压力过大的时候挂出改版的404页面.
哪会就赤裸裸的把服务器各种出错展示给大家?

最后我只能说乐视从根本上就不重视真正的用户体验
需要的就是市场部的那些假大空
把乐视的气球吹大.然后把股票弄上去
至于真正要做的事情.根本不在意



2013-1-21 12:10:40
他们只在乎股票价格能不能涨
关心这个做什么
2013-1-21 12:10:55
专业答案!
2013-1-21 12:12:53
一句话:营销可以打80分,运维完全不及格。
作为新传媒可能由此一战成名,作为互联网公司将由此一败涂地。
2013-1-21 12:14:20
这个要顶
2013-1-21 12:17:24
鄙人邀月  楼主,感谢你的专业建议。我们反馈给我们的技术员。第一次还请谅解!



应该直接反馈给你们副总。
2013-1-21 12:18:27
乐视今天是该庆祝呢还是会乐极生悲?今天这种火爆不一定是好事,除非乐视能正视问题
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表