|
|
|
|
好看簿第一次技术危机
说技术危机有些夸张,其实就是架构中的一个组件出了问题,调试过程比较辛苦。
通俗一点讲,好看簿的魔法师会召唤出166只辛勤的小白兔,这些小白兔会回答好看簿的图片在哪里这个问题,因为某种神秘的原因,回答超过100次后,这些小白兔就开始发呆,然后会有更多地小白兔自动生成,当小白兔的数量达到211只时,并且开始全部发呆,邪恶的红叉叉就统治了好看簿,这是一个周期性的过程,时间间隔约16分钟。
目前蚂蚁找到的最有效地解决方案就是当每只小白兔回答100次后,让其退休,把劳动机会让给新人,至此测试阶段,好看簿的图片服务器已经成功运行12小时。
以下为技术细节:
蚂蚁在遭遇这个问题时的第一个反应是写一个脚本和crontab job,每10分钟重启一次scgi服务器,这就让大家每10分钟遭遇大约1分钟的服务不可用状态,而且如果这个间隔之间scgi server停止工作,也会有间断时间。
之后蚂蚁开始在休假中疯狂调试app server,从app code到django code再到flup code,增加了很多log信息,试图找到悬挂点,最后企图失败,之后就写了一个脚本判断app server的可用状态,只有确实死掉后才重启scgi server。
在有些绝望中蚂蚁开始重整旗鼓,列出所有可能的组件:perlbal, lighttpd, django, mogilefs, mysql和它们之间的接口等,并静下心思考。
最终开始从lighttpd的debug开始专心调试,期间与多站点errorlog搏斗,最终确认了问题根源仍然在scgi server,然后就注意到scgi的maxrequests参数,将其切换到1,问题消失,之后又尝试了10000,1000,500,最终锁定了100为合适的数值。
这就是一个搏斗历程,记下来作为未来的参考。
最后感谢strace和google等作出强有力支持的义士。
|
天很冷
大同最低的气温-24摄氏度。。。
放在车里的3瓶水冻在车门上了。。。
|
Coral CDN
峰值下降1/2,带宽压力下降3/5,但不够稳定,放弃还是继续,这是个问题~
|
Disk usage for top dirs
du -hs *
|
新发现
在大学时代英语咖啡,这里环境不错。有可以演示PPT的会议室。
|
Big Database Before: /dev/sda1 73742752 6654036 63342764 10% / After: /dev/sda1 73742752 8542964 61453836 13% /
About 1.4G dump file...
|
sed tip: remove all files list in a text file
rm `sed 's/^/\/path\/to\/files\//' filelist`
|
都都输液了
北京儿童医院,内科监护室. 都都被确诊为轮状病毒,也就是俗称的秋季腹泻,因为脱水和酸中毒,除了抗病毒的一瓶,还需要三瓶补液调节电解质.
快十点了吧,希望在十二点能输完,都都也因此能慢慢恢复健康.
|
新的开始
把ThinkPad R60的整个硬盘格掉,安装了Ubuntu 8.10.
彻底在俺的电脑上抛弃Windows。
都都又开始呕吐腹泻,愁。
有什么问题没来得及回答,大家体谅下俺。。。
|
又中招了
这次Windows系统彻底进不去了,该蠕虫病毒甚至毁坏了Thinkpad的一键恢复.
非常想彻底抛弃Windows...
|
MySQL的奇怪问题
expire_logs_days似乎没起作用。。。
mysql> purge master logs to ...; Query OK, 0 rows affected (43.48 sec)
50G -> 3.1G
|
Create Index
Query OK, 1695629 rows affected (21 min 12.29 sec) Records: 1695629 Duplicates: 0 Warnings: 0
|
似乎食物中毒了
刚才趴在马桶上吐了一通,好久没吐过了,吐的过程很难受,吐完了还是很舒服的。。。
最近怎么这么倒霉呢。。。
|
都都的二三事
前天早上我正在喝粥,都都仰着头对我说:“爸爸喝粥呢”,很惊喜,一岁半的都都第一次说出一句完整的话。
昨天晚上开始,都都多次呕吐,腹泻。一次直接吐在我肩膀上,连喝的水也吐了。
去医院看基本上没什么用,大夫就像过流水线一样,开药交钱走人。
消化不良,要注意防止脱水。这是我第一次看到都都病到没有精神,希望他快些好起来。
|
How to clear postfix queue
postsuper -d ALL
|
How to block one ip address
iptables -A INPUT -i eth1 -s 61.135.163.107 -j DROP
Which ate our 6M bandwidth.
|
matplotlib中文字体
修改/etc/matplotlibrc
verbose.level : debug # one of silent, helpful, debug, debug-annoying backend : GTK font.sans-serif : YaHei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif
打开ipython from pylab import *
font search path ['/usr/share/matplotlib/mpl-data/fonts/ttf', '/usr/share/matplotlib/mpl-data/fonts/afm']
sudo cp /home/ant/Desktop/MSYH.TTF /usr/share/matplotlib/mpl-data/fonts/ttf/msyh.ttf
|
电话快递
有4本书要快递给两个同事,同一地址,两个接收人,选了2家快递公司做比较.
顺丰速运,直接接通,询问称呼,地址,答应1小时内接件,明天送到.
宅急送,座席忙,然后1分钟内接通,询问称呼,然后根据我的电话发现以前我留下的姓名和地址信息,和我确认,答应1~2小时内接件,明天送到.
俺主动问的问题.
17:23左右,顺丰接件人到,着顺丰统一服装,填单,手持终端录入系统,确认短信通知,大信封封装,收费10元.
Update: 宅急送昨天没有来,中午1点左右俺再次电话,下午16点来接件。统一着装,填单走人。
Update2: 中午1点左右,同事来电话,宅急送的快件竟然还没有收到。打了客服电话,答应15分钟后给我回电告知具体送达时间。
|
|
|