1

蚂蚁 活跃等级: 3

活跃等级
3

编辑推荐
31

精品故事
4

注册时间
2007年7月1日

查看信息
故事
日记
最新动态

快捷操作
加为联系人
发小纸条

   

蚂蚁 活跃等级: 3 的好看簿

上传照片 发起活动
好看簿和印客网联合推出好看簿印客通个性化印刷服务,点击了解详情 »
好看簿第一次技术危机

说技术危机有些夸张,其实就是架构中的一个组件出了问题,调试过程比较辛苦。

通俗一点讲,好看簿的魔法师会召唤出166只辛勤的小白兔,这些小白兔会回答好看簿的图片在哪里这个问题,因为某种神秘的原因,回答超过100次后,这些小白兔就开始发呆,然后会有更多地小白兔自动生成,当小白兔的数量达到211只时,并且开始全部发呆,邪恶的红叉叉就统治了好看簿,这是一个周期性的过程,时间间隔约16分钟。

目前蚂蚁找到的最有效地解决方案就是当每只小白兔回答100次后,让其退休,把劳动机会让给新人,至此测试阶段,好看簿的图片服务器已经成功运行12小时。

以下为技术细节:

蚂蚁在遭遇这个问题时的第一个反应是写一个脚本和crontab job,每10分钟重启一次scgi服务器,这就让大家每10分钟遭遇大约1分钟的服务不可用状态,而且如果这个间隔之间scgi server停止工作,也会有间断时间。

之后蚂蚁开始在休假中疯狂调试app server,从app code到django code再到flup code,增加了很多log信息,试图找到悬挂点,最后企图失败,之后就写了一个脚本判断app server的可用状态,只有确实死掉后才重启scgi server。

在有些绝望中蚂蚁开始重整旗鼓,列出所有可能的组件:perlbal, lighttpd, django, mogilefs, mysql和它们之间的接口等,并静下心思考。

最终开始从lighttpd的debug开始专心调试,期间与多站点errorlog搏斗,最终确认了问题根源仍然在scgi server,然后就注意到scgi的maxrequests参数,将其切换到1,问题消失,之后又尝试了10000,1000,500,最终锁定了100为合适的数值。

这就是一个搏斗历程,记下来作为未来的参考。

最后感谢strace和google等作出强有力支持的义士。
天很冷

大同最低的气温-24摄氏度。。。

放在车里的3瓶水冻在车门上了。。。
心有余而力不足

生存还是灭亡,这是个问题。
django scgi

600-700?
Coral CDN

峰值下降1/2,带宽压力下降3/5,但不够稳定,放弃还是继续,这是个问题~
Disk usage for top dirs

du -hs *
新发现

在大学时代英语咖啡,这里环境不错。有可以演示PPT的会议室。
Big Database
Before:
/dev/sda1 73742752 6654036 63342764 10% /
After:
/dev/sda1 73742752 8542964 61453836 13% /

About 1.4G dump file...
sed tip: remove all files list in a text file

rm `sed 's/^/\/path\/to\/files\//' filelist`
都都输液了

北京儿童医院,内科监护室.
都都被确诊为轮状病毒,也就是俗称的秋季腹泻,因为脱水和酸中毒,除了抗病毒的一瓶,还需要三瓶补液调节电解质.

快十点了吧,希望在十二点能输完,都都也因此能慢慢恢复健康.
新的开始

把ThinkPad R60的整个硬盘格掉,安装了Ubuntu 8.10.

彻底在俺的电脑上抛弃Windows。

都都又开始呕吐腹泻,愁。

有什么问题没来得及回答,大家体谅下俺。。。
又中招了

这次Windows系统彻底进不去了,该蠕虫病毒甚至毁坏了Thinkpad的一键恢复.

非常想彻底抛弃Windows...
MySQL的奇怪问题

expire_logs_days似乎没起作用。。。

mysql> purge master logs to ...;
Query OK, 0 rows affected (43.48 sec)

50G -> 3.1G
Create Index

Query OK, 1695629 rows affected (21 min 12.29 sec)
Records: 1695629 Duplicates: 0 Warnings: 0
似乎食物中毒了

刚才趴在马桶上吐了一通,好久没吐过了,吐的过程很难受,吐完了还是很舒服的。。。

最近怎么这么倒霉呢。。。
都都的二三事

前天早上我正在喝粥,都都仰着头对我说:“爸爸喝粥呢”,很惊喜,一岁半的都都第一次说出一句完整的话。

昨天晚上开始,都都多次呕吐,腹泻。一次直接吐在我肩膀上,连喝的水也吐了。

去医院看基本上没什么用,大夫就像过流水线一样,开药交钱走人。

消化不良,要注意防止脱水。这是我第一次看到都都病到没有精神,希望他快些好起来。
How to clear postfix queue

postsuper -d ALL
How to block one ip address

iptables -A INPUT -i eth1 -s 61.135.163.107 -j DROP

Which ate our 6M bandwidth.
matplotlib中文字体

修改/etc/matplotlibrc

verbose.level : debug # one of silent, helpful, debug, debug-annoying
backend : GTK
font.sans-serif : YaHei, Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid, Arial, Helvetica, Avant Garde, sans-serif


打开ipython
from pylab import *

font search path ['/usr/share/matplotlib/mpl-data/fonts/ttf', '/usr/share/matplotlib/mpl-data/fonts/afm']

sudo cp /home/ant/Desktop/MSYH.TTF /usr/share/matplotlib/mpl-data/fonts/ttf/msyh.ttf

电话快递

有4本书要快递给两个同事,同一地址,两个接收人,选了2家快递公司做比较.

顺丰速运,直接接通,询问称呼,地址,答应1小时内接件,明天送到.

宅急送,座席忙,然后1分钟内接通,询问称呼,然后根据我的电话发现以前我留下的姓名和地址信息,和我确认,答应1~2小时内接件,明天送到.

俺主动问的问题.

17:23左右,顺丰接件人到,着顺丰统一服装,填单,手持终端录入系统,确认短信通知,大信封封装,收费10元.

Update:
宅急送昨天没有来,中午1点左右俺再次电话,下午16点来接件。统一着装,填单走人。

Update2:
中午1点左右,同事来电话,宅急送的快件竟然还没有收到。打了客服电话,答应15分钟后给我回电告知具体送达时间。


您的IE浏览器的版本过低,低版本的浏览器在处理javascript文件时存在问题,无法支持Ajax功能,全面使用好看簿,IE浏览器的版本至少为6.0SP2,请使用更高版本的IE浏览器