买花记

2012/04/15 · life

我在肇家浜路上径直的走着,目的地是一个盆栽花店,却不知道应该在哪个路口左拐。

两个星期前,我跟朋友一起去过这家店,当时他们要帮另一个朋友买盆花,说一定要来这里买。到了之后,我立即觉得这确实是一个好地方。

想给朋友打电话问是在哪条路,结果是关机,我便继续往前走,凭感觉在陕西南路拐了进去。

这条路有市中心街区特有的生气勃勃,不宽的马路两旁散着有些年头的大树,贴着行人道的,时而是一家特色衣店,时而是一条老弄堂,冷不丁的,一扇黑色的大门突然向内打开,一辆车子缓缓挤出来。打扮入时的上海老太迈着铿锵的步子,拎着大大小小的袋子挤上公交车;衣装笔挺的中年大叔,行色匆匆的迎面冲来;自信时尚的情侣则面无表情,仿佛模特走在T台上;三三两两的老外,有的驻足在画廊前盯着橱窗里的展品,有的听着音乐绕街慢跑。

前面出现一抹绿,应该是到了,看来没有走错路。店门口摆着几盆不同的花,左右两边挂着吊兰,远远望去,像是一道拱门。门很窄,里面是露天的,围墙围出一块十来平米的地方,应该是由房子的后院改造而来。地上湿漉漉的,摆满了大大小小的盆栽,有的放在架子上,有的放在生锈了的旧式铁架椅子上,更多的是直接摆在地上,留出一个勉强能站开两个人宽的小道。空气中弥漫着各种花香混合的味道,淡淡的,混合着泥土的湿气,很提神。

我进去时老板正在整理地上的一盆花,我冲老板微笑,点头致意,老板笑着停顿了一下,说:“你是昨天那个吗?”我说:“不是,不过之前跟朋友来过一次。”我还没想好要买什么,便挤到里面,一个个的看过来。

老板是个中年大叔,瘦瘦的,说话声音不高,语速比较快,不太笑,但笑起来很真实,奇怪的是我觉得他跟王小波长得有点像。就像朋友所说,看的出来他是爱花的人,这么多花他都养的很好,而且对每种花都很了解。上次我来的时候他手里拿着烟,烟味把所有花香都掩盖了,而我却一反常态的没有任何厌恶的感觉。

“我从来没养过花,第一次养,很怕给养死了。”我跟老板说。

“你试下这个,这个很好养的……”他给我指了指拐角处的一个迷你的小盆栽。

“我想养在阳台上,这个小了点……这个不错,是什么花?”我指着一排三盆开的花小巧玲珑的。

“这是四季海棠,一年四季都开花的。”

“哦。”我把目光继续向前移。

“这个长寿花也很不错。”老板推荐道。

我扫了一眼前面的花,回头说:“我选好了,就要这个,四季海棠,一眼就看中它了。”

“选好了哦?”老板把花拿起来,放在手上端详了一会儿,“漂亮,这个真漂亮。”仿佛很不舍得。

我让老板帮我把花装起来,顺便问道:“你还记得之前有个人给了钱之后又要回了五块钱吗?说自己经常来买花,是附近复旦读书的学生。我上次跟他们一起来的。”

老板似乎想起来了,微笑道:“他是复旦的么?”

“当然是,我们又不会说谎的。”

“我送你一个垫子吧,放在花盆下面,可以接着点水。”他转身拿了一块垫子放在袋子底,问我有没有毕业,我说我已经毕业快三年了,他说看不出来,说我看起来像九零后,我笑着说哪里有。我怕万一遇到什么问题,可以咨询下他,便问他要了手机号,他笑我拿出的手机用的破成那样,也不换新的。我说很多年了,用习惯了。

道谢之后,我从花店出来,拎着这么个小东西,心里想这下家里终于有个念想。

泡芙女孩

2012/04/14 · life · fairy tale

我听说从前有个男孩,很喜欢吃泡芙,有一次调皮,在睡前小心翼翼的只把泡芙里的奶油吃掉,留下一个壳子,第二天竟然发现泡芙里有一个小女孩,便问她叫什么名字,女孩说不能说出自己的名字,一旦说出就会变回原型,不能待在这里了。男孩问会变成什么,女孩答这也不能说。

就这样男孩有了玩伴,他让妈妈把每件上衣都缝一个口袋在前面,这样把女孩放在里面,可以一起吹风。男孩带着女孩跑遍了城市的每个角落,每到一个地方,他们总是开心的说笑,所有人都觉得男孩奇怪,因为他们只看到他一个人。

小男孩慢慢长大了,一天早上忽然发现女孩不见了,他非常着急,翻箱倒柜,中间差点把泡芙小屋打破,可最终还是没有找到,他很伤心,呆坐床边,捧着空空的泡芙小屋。

这时门铃响了,男孩开门发现一个跟他差不多年纪的女孩站在外面,微笑着看着他。这感觉似曾相识,然后他猛然明白过来,一把把女孩抱进来,知道他找到了他的泡芙女孩。

Python中计算字符宽度

2012/04/13 · python

最近在用python写一个CLI小程序,其中涉及到计算字符宽度,目标是以友好的方式将一个长字符串截取为等宽的片段。

对于unicode字符,python的len函数可以准确的计算其中所包含的字符个数,但是个数并不代表宽度,如:

>>>len(u'你好a')
3

因此无法简单的使用这种方式来计算宽度。

GBK decode

首先我想到GBK编码,00–7F范围内的字符是一字节编码,其余是双字节编码,正好与字符的宽度大体一致,于是有了这样的投机取巧的办法(假设取8个宽度):

>>> a = u'hello你好'
>>> b=a.encode('gbk')
>>> try:
...   print b[:8].decode('gbk')
... except:
...   print b[:7].decode('gbk')
... 
hello你

如代码所示,首先将unicode的字符串进行GBK编码,然后截取8个字节的宽度后尝试用GBK解码,若解码失败,则少截取一个宽度,截取7个字节后使用GBK解码。

虽然初步解决了问题,但是这样做的硬伤很明显。首先代码不优雅,以试错的方式运行;其次GBK所能表示的字符有限,对于大量GBK编码以外的字符无法支持。

East_Asian_Width

徘徊很久之后,偶然发现 Unicode Character Database标准中有East_Asian_Width 属性,并有以下可能值:

# East_Asian_Width (ea)

ea ; A         ; Ambiguous    不确定
ea ; F         ; Fullwidth    全宽
ea ; H         ; Halfwidth    半宽
ea ; N         ; Neutral      中性
ea ; Na        ; Narrow       窄
ea ; W         ; Wide         宽

其中除A不确定外,F/H/N/Na/W都能很明确的知道宽度,如果保守起见,将A视为宽度为2的话,则很容易给出单个字符的宽度:

>>> import unicodedata
>>> def chr_width(c):
...   if (unicodedata.east_asian_width(c) in ('F','W','A')):
...     return 2
...   else:
...     return 1
>>> chr_width(u'你')
2
>>> chr_width(u'a')
1

到现在似乎已经可以满足要求了,但是实际使用中发现属性为A的字符真不少见,最典型的就是中文的双引号:

>>> chr_width(u'”')
2

在大多数等宽字体中,中文双引号都是只占一位宽的,如果一行里有多个中文双引号,则累加的误判宽度将会使截取效果大打折扣,无疑这也不是最好的办法。

urwid的解决方案

urwid是一个成熟的python终端UI库,它在curses的基础之上包装了类似HTML的控件用以显示文本内容,如果有这方面的开发需求,非常推荐此库,比直接使用curses库方便很多,非常棒的是它对unicode的文本宽度截取非常准确,让我大为惊讶,于是翻开它的源码一探究竟,文本宽度计算方面其核心代码如下:

widths = [
    (126,    1), (159,    0), (687,     1), (710,   0), (711,   1), 
    (727,    0), (733,    1), (879,     0), (1154,  1), (1161,  0), 
    (4347,   1), (4447,   2), (7467,    1), (7521,  0), (8369,  1), 
    (8426,   0), (9000,   1), (9002,    2), (11021, 1), (12350, 2), 
    (12351,  1), (12438,  2), (12442,   0), (19893, 2), (19967, 1),
    (55203,  2), (63743,  1), (64106,   2), (65039, 1), (65059, 0),
    (65131,  2), (65279,  1), (65376,   2), (65500, 1), (65510, 2),
    (120831, 1), (262141, 2), (1114109, 1),
]

def get_width( o ):
    """Return the screen column width for unicode ordinal o."""
    global widths
    if o == 0xe or o == 0xf:
        return 0
    for num, wid in widths:
        if o <= num:
            return wid
    return 1

如代码所示,首先根据unicode的官方EastAsianWidth文档整理出字符宽度的范围表,然后使用unicode代码查表。使用之前的例子测试:

>>> get_width(ord(u'a'))
1
>>> get_width(ord(u'你'))
2
>>> get_width(ord(u'”'))
1

完全准确,而且在实际应用中的表现也比较好,是一个理想的解决方案,更多技巧请查阅urwid的old_str_util.py源码。

我有一扇窗

2012/04/12 · life

我有一扇窗,早晨醒来,可以享受温暖的太阳;

我有一扇窗,斜倚在窗口,可以看见夜晚的霓虹灯光;

我有一扇窗,在这四月天,可以闻到桃花的清香;

我有一扇窗,满载着世界,静静流淌。

两片树叶

2012/04/12 · life

有两片树叶,离的很近,但不在一枝上。

刚发芽的时候,都对这个世界充满了好奇,微风吹过,细雨滑过,阳光,均匀的撒过。

慢慢的,身子都舒展了开来,学会了随风摇曳,也注意到了旁边的那一片。却都默不做声。

一天,起了大风,树叶们左摇右晃,几乎要离开树干,忽然,两片被风吹到了一起,划过的那一刻,发出沙的一声……很奇妙,两个都笑了,笑的哗哗的。

秋天到了。

“我可能要先下去了”,一片说,“希望落的不远”。

大风又起。它纵身一跃,翻转在忽左忽右的风中……

树上的另一片借着风向转身,努力搜寻着地面,“看见你了……”,可惜地上的它听不到。

一个午后,“刚才你在空中真美”一片对另一片说。