Greylight's profileMast in the MistPhotosBlogLists Tools Help

Blog


    6/25/2009

    我的大学.Chapter9.广院你好,广院再见~!

      毕业的时候,想送给师弟师妹们一份小礼物。于是,在p2p上上传了一个软件,该软件利用教务处网站的一个缺陷,为那些喜欢偷窥的孩子们提供了一个查看他人隐私的门径。就像我后来在网络中心主管前装孙子时说的——“其他的信息在学校的网站上都能查到,重要的是成绩单和相片……”。
      两年前发现了学校网站的漏洞,两个月前用C#写出了软件,昨天上午传到p2p和ftp上,中午得知捅出了篓子(几乎要报警),下午毕业典礼后便向网络中心的老师道歉、聆听教诲。俗话说的好“做人莫装逼,装逼遭雷劈”,还要补上下半句“遭了雷劈还要装孙子”——OMG,晚上的检讨信,数易其稿,感觉写得还行……
      ps: 去核桃林上看了同学们的讨论,总体而言似乎对软件怨言不大。其实我最愧疚的,是这个200k的软件导致p2p和ftp停摆,连教务处也登不进去……同学们把p2p因为涉及政治、色情而导致当机的行为称为“抽风”。这回抽风,恐怕又得好几天了……

    软件的默认头像是芥川龙之介,以此表达我对先生的尊敬
    cuc
     
    上帝保佑,毕业证和学位证都保住了
    ——丫的,我也是有证的人了!
    1
    今晚离开广院,离开首都
    爱你,恨你,一言难尽
    临走之前,也算装了一回逼,四年无憾
    最后,向广院道个别
    向广院道别,就是向43号楼道别
    亲爱的43号楼,只居住着广院不到十分之一的女生
    但是,所有我欣赏过、喜欢过、追求过的女生都来自这里
    所以,把这嚣张送给亲爱的43号楼
    ——国传的小师妹们,别嫌现在住得苦
    等师哥发达了,一定捐一座楼,命名“清海阁”
    静思苑的大叔大婶会嫉妒死你们
    不用感谢师哥,师哥只是传说
    要谢,就谢谢你们的师姐吧~!
    3
    5/4/2009

    别对我撒谎~

      4月24号的《康熙来了》,请来了赴台湾宣传电影的小泽玛莉亚作为嘉宾,同来的还有电影中的男主角张睿家。
      我极少看《康熙》,更不用说从内网拖下全篇,从头到尾欣赏了。不过这一期节目我看了两遍,第一遍自然是因为小泽玛莉亚的魅力,第二遍……因为张睿家……
      
      这段时间不仅追《豪斯》,还追《lie to me》,喜欢玩测谎的把戏。这集《康熙》里正好有许多可供分析的素材——比起康永、小S、吴大维这些老油条,以及面若死灰的小泽女士,张睿家最腼腆、最有研究价值了。
      分析的视频素材为一个RMVB文件,体积302m,哈希值为A708A0D0F02ABE4420CB5BAEC75A556C(汗)
      场景1(3:54 ):问——导演告诉你,你要与小泽配戏,而你却没看过她的作品,你有立刻去补课么?答——没有。
      表现:眼睛向下看,害羞/内疚(他一定是想起了什么,很不好意思)
     
      场景2(4:41):问女配角——知道小泽的大名以后,有什么动作?答——上网查询了一下。
      表现:抿嘴坏笑(图片的效果没有视频清楚;他到底知不知道什么内情?)
     
      场景3(9:43):问——上网看了以后有何感想?答——详细描述了经过……
      表现:一连串的手势,真实的叙述、回忆;最后的笑容很真诚;但是左下角那幅图,搓手臂的动作,相当之可疑。
     
      场景4(22:40):问——剧组带小泽逛街夜市的时候,知道被别人偷拍么?答——不知道
      表现:眉头紧锁,惊讶/厌恶的表情持续良久(当然,录节目前他就知道了),一般是假装的。不过这是在作节目……
     
      场景5(22:52):问——去夜市的时候,描述一下注意到你们的观众。答——……都是那种,怪老头
      表现:掏耳朵,不自信的表现。这里在编。
     
      场景6(23:02):问——大家对小泽的认知度是不是比你高?答——点头
      表现:全场唯一一次无声的回答。有的时候,沉默比说话更可信。
     
      场景7(23:31):问——你愿意跟小泽这样的女性交往么?答——也还好啦……
      表现:撇嘴、皱眉、摸脖子。回答是撒谎,可能还有鄙视的感情。尤其是最后一幅图,摸自己的脖子,表示不自信——如果是用中指的话,就直接表现出厌恶了。
     
      场景8(33:23):问——你有觉得小泽的演出方法与别的女演员不同么?答——比如说……
      表现:挠头,对自己的话不自信。明知故问——当然,这里谁都能看出来……
     
      场景9(40:38):问——听说你在拍戏时中邪了?答——有啊
      表现:一个很典型的抿嘴表情,但是这代表什么呢?从下文看,没有撒谎的痕迹,尴尬也说不通……
     
      场景10(41:17):叙述在片场中邪的经过
      表现:无数的肢体语言,如假包换
      水平有限,发现的“内涵”场面只有十几个——这里贴出来十个场景——其中有些尽管觉得“内涵”,可是参不透表情/动作下面的内容。
      不过,最令我印象深刻的,是张睿家在场景7里的爆发。“你愿意跟小泽这样的女性交往么”——怎么可能愿意?那是个AV啊!尽管嘴上说“那还好啦”,可使表情与举止,处处显露出反感和厌恶。作为一个新人,张睿家撒谎的功夫,毕竟嫩了。
      在镜头前隐藏心中的真实感情,以博取观众的支持与好感,这就是娱乐圈中人的悲哀啊。
    2/6/2009

    暂时庆祝一下

      拿到第一个AD了,算是保底的吧。不管怎么样,心里的大石头已经放下,大学的最后一个学期也可以按部就班了。
      放下大石头这样快乐的事,值得在封space期间暂时解冻,庆祝一下,hoho!  
      但愿这只是第一个,不是最后一个。我要ad,我更要offer!
      继续封。
      ps:晓航,哥爱你。也祝你有人要啊。
      ps2:珑琥,你这个眼神太TM帅了,如果还有更好的学校要我,就证明你是我的福星——我考虑升你为男一号哦。
    11/23/2008

    Neural Net.Chapter3

      十万火急地去抢项目,除了担心别人先行一步,还为了骗老美。
      无论是ps,sp,还是cv,上面不写几行研究经历之类,实在拿不出手。自己在这方面一片空白,一半归咎于不曾尽力争取,另一半多少是环境使然。毕竟在这个学校,你可以很容易地参加各种文艺活动、拍片、采访,诸如此类,但是想认认真真泡在试验室里做项目,除非有很高的觉悟才行。我就缺少这种觉悟。
      想在十二月之前把第一批材料寄出去,务必尽早填上这些空白。在我看来,对美国人而言,多少三好学生和奖学金都不如一个项目有分量,尽管在中国情况似乎完全相反。于是乎,周一敲定毕设的题目,卸下了心里一块大石头。

      周三又去答疑,岂料巩老师居然买一赠一:
      “我有一个211的国家项目,要连着做三年——09年,10年,01年——也不指望你们本科生来帮忙了。不过我想你申请可能需要这些东西,这个项目多报几个人也没什么影响,我就把你的名字加上了。不用你干活。”
      “这我哪好意思呢……”
      这个号称211国家项目的干活美其名曰“网络重要信息的分析与动态监测”,跟我的毕设异曲同工。可能我的部分偏向分析,而它更偏向网络。无论如何,简历上增加一个研究背景总不是坏事,更何况这只是把一个项目拆成两种说法而已。不过,滴水之恩当涌泉相报,巩老师让我吃白食,我就务必我自己分内的事做到最好。
      分内的事,那不就是语义的分析与学习么。

      又看了几天书。周六的时候给Beta打电话,Beta是计算机小天才,一年前参与开发了一个利用神经网络分析股票走势的系统。Beta拥有顶尖的计算机头脑,同时自称深谙经济学理论,然而他似乎完全不懂得一个简单的道理:仅从股票走势的历史数据来“预测”其涨跌,与买彩票无异。人们可以很容易地从交易量的记录中读出“这是庄家在清盘”“这是在抄底”之类的信息,然而那些都已成为历史;如果要预测的话,顶尖的高手确实可以先于普通人察觉天灾人祸对市场的影响,《货币战争》中记载的罗思柴尔德借滑铁卢战役发迹的例子便是范例(很好的例子,但是我不信,不是这个故事不可信,是《货币》完全不可信。关于这本书又可以写十篇文章了)。可顶尖高手的大脑,岂是如今的计算机技术可以比拟的?
      我就不用拆Beta和他参与的那个破项目的台了。这轮由次贷危机掀起的全球金融风暴,把中国的金融从业者都整成傻B。今天沪深齐跌7%,明天又其涨6%(这还是在中国有停板制度的情况下)。各中悬机,不知道他们设计的神经网络参透了没有?
      不过必须承认,Beta在某些方面极端幼稚,在另一些方面毕竟天赋异凛(牛顿和埃因斯坦不也是如此)。我社交不广,然而天赋异凛的人很多,Beta是最有代表性的。

      “宝宝,这次是说正经事(以前都不是正经事),神经网络的问题……”
      “你扯淡吧,这都是80年代的技术?那最新的是什么?”
      “你们当时是怎么把网上的文字信息变成样本的?(有一个企业专门的软件包)……能不能把那个库给我啊?(有知识产权)……扯淡,你就没用过盗版?(这要把我告死)”(括号里的是Beta答复的概要
      “好吧,把你那个论文发我邮箱。我提炼一下放在statemant of purpose里,以后去了麻省我罩你(等我娶了章子怡你当伴郎)。”

      一席电话,收获颇多,失望更多。原来神经网络已经过时了(用另一种说法是“成熟”——Beta语),现在流行的是免疫系统。Beta的论文就是关于免疫系统的,还没发表,拿给我参考。他还问我“你是不是要把它翻成英文寄过去啊”,我臭他“有篇论文有啥不起?哪有人申请还寄论文的?你真牛X了发表在核心期刊上,人家一搜就搜到,还要你寄过去?”。
      我不否认这可能是一篇很有前途的论文,有没有前途不是我能判断的。但是我不能助长Beta的自满心理,我爱他,所以我要鞭策他。
      不过,肚子里有些货了,骗起老美来底气更足。到现在为止我还是外行,但是我一定要装得很内行“……In my opinion, the future of AI will probably point at Immune System. Firstly……”。当然,这很假,反正我在recommendation都把自己吹得跟国士无双一样,我还在乎这个?

    cool hit counter
    11/22/2008

    Neural Net.Chapter2

      我去要项目的时候,开门见山说“神经网络”,然后巩老师把“网络重要信息的分析与研究”给了我。课题名称以“网络”开头,实则着重“信息的分析与研究”,与网络几无关联。
      但是,不知情的人会发现,项目列表上除了标明“题目”“导师”外,对项目细节、开发环境等境况只字不提。模糊不清、本末倒置的情况还有很多,这算比较典型的例子。

      我看了两天书,周三下午去答疑。进了办公室发现二班的班长也在,原来她也和巩老师事先联系过,约好周三下午面谈。
      一般而言,选择毕设项目,或者依据导师来选,或者依据项目来选,或者兼而有之。我找巩老师是奔着神经网络去,与我是否对她有一载之恩、或者在她的课程中表现如何关系不大——这应该偏向于第一种情况。而在同巩老师的对话里,二班班长干脆说出“其实您让我做什么都行”的话来,那就明显属于第二种了。巩老师跟二班班长似乎交情不错,考虑到班长正忙于考研,便把一个难度不大却蛮实用的项目给了她。从她们的对话中我还了解到,在我周一讨得项目的第二天,不仅二班班长和老师联系过,另外还有一个女生曾经上门拜访。起初,班长和那个女生一听到“网络重要信息的分析与研究”这个美妙的名字,都迫不及待想拿下来,没想到却被我捷足先登。不过,巩老师在无奈于僧多肉少的同时,还安慰她们两点:这个项目跟网络没什么关系;这个项目很难。
      所以这两位女生在正式开始报名之前就为我让了路。周三晚上,学院把选题列表的excel文件发到班级邮箱里以后,又有一些还来不及内定、尚不知情的同学被拒之门外。我过意不去,安慰自己“那个项目很难”“项目的名字很有前途,可那是骗人的”……却掩饰不自己跑过关系的事实。然而换一个角度考虑,假如我没有去跑关系,仅通过这份列表去选择,就根本不可能想到它与人工智能有关。即使产生了怀疑,继而去找老师咨询,届时也会被告知“这个项目已经有人报了”……
      周四,各方面小道消息纷至沓来。这时我方才了解,原来在周三晚上的那份列表上,好一点的项目都已经被先期瓜分干净。“内定”的角色,远远不止我一个。
      不过客观的说,我的项目并非真正意义上的好项目。难度大是其一,其次,虽然我个人觉得它很有前途,多数人还是根据导师去选项目。在性格宽厚(人品好)的导师手下干活,得到的指导多,做起来相对容易,有时甚至可以把相对困难的项目改得简单些;更重要的是,学院允许老师增报项目,于是每一届都有这样的情况:一个“人品”好的老师带着六七个学生做毕设(通常只会带三个);而那些人品差(严格)或者项目比较难的老师,往往形单影只,甚至无人问津。
      
      想到这里,不禁要插几句。在我们学校,你可以把计算机系的毕业生划分为“想借此谋生的”和“不想借此谋生的”。对于前者,大体有考研、就业、保研和出国四类,而在这四类中,无论他(她)都多热爱计算机,也只有后两种人会全心头入到毕设中(理由无须解释);对于后者,不用分类,他们都不会认真去做的。私以为,这正是中国高等教育的无数悲哀之一。

    cool hit counter
    11/21/2008

    Neural Net.Chapter1

      三年多来,小说(读和写),英语,美女(单相思),是我大学生活最重要的三个组成部分。临毕业的时候,情况有所改变,原先榜上无名的“计算机”傲然跃居榜首——要开始做毕设了。
      毕设题目属于人工智能的神经网络范畴,它有一个很好听的名英文字:Research on analysis of important network information。我对这个题目感兴趣,受到了浦泽直树的漫画《Pluto》绝大的影响——这在以前写的小说《地狱纪行》中已见端倪;想竭尽全力把这个项目做到最好,而不是像某些人那样敷衍了事,因为我打算用它做敲门砖——这与我学英语殊途同归;最后,单相思的人,在某种程度上是我最重要的动力——相比“伟大理想”“崇高事业”,她(们)毕竟就在眼前。

      话说回来,争取到这个项目,我感到骄傲而侥幸。

      上周日晚上和冬瓜聊天,谈到下周开始的毕设选题,对“因为潘老师人好,所以在历届毕业生中都是红人(此潘老师乃潘石屹的妹妹)”之类的逸事品头论足。当我提到希望自己做人工智能、尤其是神经网络时,冬瓜忽然想起上届有师哥做过类似的项目,指导老师是带过我们数据结构的巩薇。
      听到是巩老师,我异常欣喜,去年有一次她脚崴了,傍晚时分是坐在本人的自行车的后座上离开学校的(不过推车的是她爱人,我只是作为车主在后面跟着)。大学以来自己只用这辆二轮悍马带过两位异性,人各一次:一位是巩老师,另一个就当我忘了。
      于是,周一上午我就找到巩老师,劈头便问:听说你有一个神经网络的项目,我想……一路晓之以理,动之以情,在加上当年的一载之恩(如果她还记得),十几分钟拿下。自己一向随遇而安惯了,很少如此坚决地争取某样东西,而且是鬼鬼祟祟去争取——当时毕设的报名还没有开始,我不仅咨询,还把课题定了下来,其实与内定无异。不过现在想来,这一步赢得很悬,很紧,很让人骄傲。
      当天下午,我按着老师开的书单借了参考书,在图书馆里就啃起来。当时的打算是现在能看一点是一点,周三下午去找老师谈谈想法(学院在周三下午开工作会议,届时所有平常行踪诡异的老师都会出席,因而那也成为约定俗成的答疑时间),再加一层保险。就在大多数人还没有选题的时候,我不仅把生米煮成熟饭,而且已经加足马力启动。人们常说笨鸟先飞,我不认为自己是笨鸟,我要做一只狡猾的鸟。
      两天半的学习里,我发现神经网络实在是个伟大的东西,自己赌中了。后来我看到了所有毕设项目的列表,良莠不齐,霄壤相别。如果下手晚了,真不知道会摊到怎样的题目,而且更可怕的是,这些毕设的题目其实极具欺骗性。

      写到这里,又想起《地狱纪行》。中途搁笔,原因有二:一是思想幼稚,水平所限,既然是与芥川先生对话,不达到一定高度便不够尊重;二,在小说里我是一个人工智能的学者,身居其位,现在就构思、思考那些专精的东西还为时过早。

    cool hit counter
    7/7/2007

    世界

    绽放在大麦哲伦星系的璀璨星云
     

      蚂蚁在铁丝围成的圆环上周而复始地爬行,空间对它而言只有一维的概念。圆环长度有限却没有边际,如果铁丝足够长,比如有地球的圆周一样长,那么在蚂蚁的眼里,铁丝就是无限。

      麦哲伦完成环球航行以前,有人已经知道地球是圆的,更多的人相信地球是平的。二维球面无疑是一个有限无边的空间,然而一直没有人能够证明地球就是这样一个球面。向西,向西,再向西,最后从东方返航——亚里士多德通过观察月食所做的推论,终于在将近两千年后被证实了。

      现在,我以为宇宙是一个三维(或者更高维)的有限无边的空间。虽然自己根本无法想象这个空间的结构,不过我始终相信,有朝一日,一艘掌翘曲跳跃技术的太空船一路向西、向西,多年以后(也许是0.01年,也许是一百年),它会贯穿整个宇宙,就像环绕了地球的维多利亚号一样,从太阳升起的地方回来。

    cool hit counter
    6/4/2007

    贪吃蛇·SnakeEater

      昨天花大半天时间写完了java2游戏编程的随堂作业,一个贪吃蛇的程序。很激动。
      有了笔记本就是爽啊,在自习室写日志,在自习室写代码,在自习室上不限流量的龟网(虽然免费,可是速度实在太慢),累了就抬起头,看看前后左右的美女,yy一下——像现在,离我七八米远处有一个遥远的背影mm坐在第一排,端庄就两个字……
      不能再看了,再看就郁闷了。
      我把这个贪吃蛇的主类起名为SnakeEater,合金装备3的副标题,译成中文是“食蛇者”的意思——贪吃蛇和食蛇者正好本末倒置了吧?没关系,名头够响就行。
      除了主类,还有表示砖块的Brick,表示蛇头的head,表示蛇骨的bone三个类。蛇头是主类之外最重要的类,通过一个collide函数做撞击判定,撞墙,撞砖头,撞上自己的身子有不同的效果。brick类很简单,基本上没什么复杂变化。bone类也很简单,可我认为这个类设定得很有创意。
      无数蛇骨组成了蛇身,每一节蛇骨都尾随着前一节蛇骨游弋,第一节蛇骨与蛇头相连,就构成了完整的蛇。玩过贪吃蛇的人一定会问:这种创意没什么了不起的啊,你写出来也不过是描述了贪吃蛇的游戏规则罢了。没错,只是描述了规则罢了。
      自己觉得有创意,因为在写蛇骨代码的时候,或者说在萌发出构造蛇骨这个类的念头的时候,脑海里浮现的是合金装备3的开场动画——一条没有肉和皮的,只露出骨头的蛇在画面中往复穿梭。更有创意的是,耳畔仿佛想起了主题曲SnakeEater激情四溢的歌声:
      I am still in a dream, Snake Eater~~~
      蛇骨啊蛇骨,就像一具被从坟墓里扒出来的尸体阴魂不散。世界上最古老的蛇,不正是圣经中诱惑夏娃的那条蛇么?A Farewell  to Arms里,Rinaldi对男主角说:"I am the snake. I am the snake of reason."
      "You're getting it mixed. The apple was reason."
      "No, it was the snake."
      这段对话太刺激了,蛇不仅是世界上最早的间谍、被剥皮后的撒旦,还是reason!(不知道怎么翻,是真理,还是真理之果?)
      说了这么多,我的创意在哪里呢?其实没什么创意,就是觉得把这个类起名为bone很浪漫。我写代码的时候脑子里浮现的不是0101而是过场动画、音乐、圣经、《永别了,武器》,这分明是个软件诗人么!
      是的是的,不仅是写代码,解物理题、写思修论文、踢球、吵架、追女生追不到*-*……无论做什么都要摆出诗人的姿态,浪漫一点,再浪漫一点……


      谨以此文,庆祝我的第一个游戏程序,贪吃蛇,又名SnakeEater。

    cool hit counter
    4/5/2007

    人工智能.Chapter2.从象棋和围棋展望新世纪的人工智能(三)

     
    最后一部分,丢出来拉倒。

        《天龙八部》中“珍珑棋局”的故事非常有名:面对一盘长龙被围、几乎毫无生机的“死局”,数十年来无人可解,倒是完全不通棋路的虚竹信手落下一子,绝了自己的“气”,于是死子尽数提去,局面重归海阔天空,有了周旋的余地。
     
        珍珑的故事完全是金庸杜撰的,棋史上从未有过。有围棋友人特意研究了这种“自杀”走法,认为“置之死地而后生”在理论上是成立的,不过与其把珍珑作为行棋的策略,不如把它当作一个寓言故事。对于人工智能来说,这则寓言有两点寓意:“自我否定”和“犯错”。
     
        珍珑的解法是自掘坟墓,置之死地而后生——在思维层面上否定先前的所有工作,把一切推倒重来。在计算机求解的过程中,即使如前文所言,拥有了“宏观推测,假设验证”和“强制中断”的能力,依然摆脱不了“行尸走肉”的形态,只有当它懂得“自我否定”时,它才具备了“意识”,拥有了“灵魂”。举例言之,编制程序让计算机求尺规二等分角的方法,计算机可以否定方法:不是角不可以二等分,而是尺规作图办不到。让计算机求出素数的个数(当然求不出来),一台无法自我否定的计算机会一直计算下去;一台能够“伪”自我否定的计算机——人工把《几何原本》的数据入库,电脑自行调出欧几里得的定理——会立刻否定结论;一台“纯粹”自我否定的计算机,即使没有数据库,也可以自行演绎出“素数无限”的结论。当然,纯粹意义上的自我否定是不存在的(没有前人的“数据库”,后人对那些不能证明有解,也不能证明无解的问题只能当作“哥德巴赫猜想”束之高阁),更现实些的自我否定属于“准自我否定”,它拥有高度的自我否定机能、庞大数据库、智能化搜索、以及基本的演绎推理能力。最重要的原则是,它不会盲目服从。
     
        举解数学证明题为例:我们在解一道错题之初并不会考虑“题目是否有错”,而是在一路解下去无法证明的时候产生疑义“有没有可能是题出错了?”——于是相互讨论、查询资料、咨询导师——最终得出“题目有误”的结论。可以自我否定的人工智能并不需要时刻关注“能否自我否定”(过于消耗机能),但它具备自我否定的意识,在“意识到不对劲”的时候懂得启动自我否定。
     
        最后,我想提出人工智能的最后一层:犯错。
     
        人是会犯错的生物(所有生物都会犯错)。由生至死,从卵细胞受精时遗传密码子的组合和复制,到最终细胞功能的衰竭和病变,生理机能的错误贯穿一生,与此同时,“三七二十二”之类的思维错误更是不可计数。生命的进化源自火炬传递时的错误,文明的进步源自探索世界时的错误,如果人类永远不犯错,就不可能演化为今天的“高等生物”——同样的道理,不会犯错的人工智能,永远摘不去“人工”二字。
     
        机器犯错的问题,与其说是技术课题,倒不如说是哲学问题。毫无疑问,机器的思维来自程序输入,程序是绝对健康的,机器便不会产生任何错误(在硬件正常工作的情况下)。于是产生了悖论:越完美的人工智能越是精确无误,可精确无误的人工智能永远不能称为“完美”。如何解决这个悖论,恐怕是个连思路都无从提出的问题。
     
        于是,我不妨暂时停止思考,把问题放在这里,用几句话来结束这篇冗长的空想文字:
     
        计算机已经可以再向其中达到、超越人类中顶尖棋手的水平,在围棋上却也许几十年内都显得遥不可及。差距所在,是计算机缺少“取势”的“宏观推测,假设验证”能力、“脱先”的“强制中断”能力,以及应对“珍珑”的“自我否定”能力——而最终、最完美的人工智能,不仅应当拥有以上的机能,还应当能够“非程序性犯错”。具有“犯错”机能的机器人,在一定程度上等于实现了“进化”,而能够进化的“人工智能”,便是真正意义上的“智能”。
    cool hit counter
    3/29/2007

    人工智能.Chapter2.从象棋和围棋展望新世纪的人工智能(二)

     
        上周三,在校园里骑车经过某处路口时,突然发现眼前貌似有位尤物,于是仔细看了她一眼——不是我不想多看几眼,是因为骑车骑的太快了,由不得我多看几眼——在短短的不到一秒钟的时间里……
        那是怎样一位尤物啊!与身边的女伴谈笑风生中,她侧过脸颊,只能看见一只月牙般弯过的明眸。不到一秒钟,来不及细细欣赏,我就只看见她那只明眸,恍如闪烁在白昼里的星光。骑车经过,我扭过头,背影远去,只看见她怡然地走着,高挑的身材披着黑色的长衣,仿佛是一位女王。
        整整一周,我都不安地思忖:一秒钟,可以记住一个人么?脑海里只有那只眼睛,我拼命回忆着,不愿让它淡去。
        八天后的今天,走在往《工程制图》教室的路上,我居然又看见了那只眼睛。我想起来了,现在我没有忘记,以后也不会再怀疑:似乎是相同的长衣,依然是白昼里的星星。
     
    ps:一会早一,一会早二,一会荷兰语,现在又多出个路口之花(flower on the cross),貌似我已经犯了众怒,被同学戴上“暗恋狂”的帽子。但事实不是这样的,疯狂暗恋实乃学习压力太大之故。每天早上6:20爬起来早读,而早读一号(morning reading flower、女神、早读之花)已经十几天没见到人影了,我知道早晚都有这么一天,但终于到来时仍不免寂寞;早二有男友了;荷兰语大三就出国——而我呢?四级考成这样,“世界的十字路口”与我渐行渐远;计算机就像个无底洞,不知道应该做什么、不知道应该怎么做;因为一部漫画,下决心学习人工智能,但那足以支撑我的未来么;最近在读《世界是平的》,又看了NHK的纪录片《崛起中的印度》,不禁因为惧怕这只“头脑立国”的怪物惴惴不安、为面对将来数以百万计的印度同行的竞争把自己绷得更紧……
        学院建院五周年,上面让我们写论文,我交的就是这篇《从象棋和围棋展望新世纪的人工智能》。不是出于自愿写的,自己很不满意,但毕竟是自己用了心写的,弃之可惜(交给学院就等于丢了)。那就分三部分贴在日志上,凑数吧。

        卡斯帕罗夫、克拉姆尼克无疑是国际象棋的稀世高手,若让他们学习中国象棋,相信段时间内就能取得一定成就。同样,让胡荣华、许银川转行国际象棋,进步同样神速——不只是象棋之间,跳棋、军棋、将棋,就算法而言可以说殊途同归:以某种固定的套路起步,遍历计算下一步的各种可能(对手的变化,自己的变化)取最优解。软件上的进步,无非是在算法上对棋路的计算更深、更快;对权的判定更合理;并非总是急于进攻,学会出缓着,懂得以静制动;再聪明些的还能布置陷阱,设饵钓鱼……活人的思路也不过尔尔,活人设计的软件,不得不如此思考。
        然而,用计算机代码解释下围棋的思路,可谓难如登天。
        首先,围棋的规则比象棋简单,变化却远比象棋复杂。棋子数量、棋盘大小的差异自不必说,一局象棋的往来平均在六七十回合,而围棋却经常纠缠到一百个回合以上。同时,象棋一步棋的变化通常只局限在少数几个子的几种走法(比如说开局没有人会上帅、出车),而围棋从第一步开始直到收关前都是海阔天空(有人说开局是有定式的,但首创“天元”开局的吴清源先生不会如此认为)——因为以上两点,遍历围棋的变化只存在理论上的可能性。其次,计算的困难并不是天堑,可以通过硬件技术的发展来克服,人脑与电脑间真正的鸿沟,在于权的判定,也即:即使我已经想到了这步棋,我怎样判断它是好棋还是臭棋,好有多好,臭有多臭?
        在此我提出三个围棋术语:势、脱先、珍珑。这三个词五个字,任何一个会下围棋的人都理解,也仅仅是“人”才能理解。我们说棋风有“人性化”和“非人性化”,人性化的棋风体现在象棋上是“等着”“兑子”“弃子”等,体现在围棋上,就是人性化的围棋有势、脱先、珍珑。
        围棋讲究“取势”,崇尚大局观。这大局观主要体现在开局和中盘,战场空间广阔、双方短兵相接前排兵布阵的阶段。选手为取势而走棋时,考虑的往往不是一步两步,而是至少在为十步以后的局面作铺垫,与其说是凭计算走棋,不如说是凭经验、凭直觉、凭灵感。有大局观的棋手,并非每一步棋都有“杀棋”“围空”的明确目的,他知道围棋的规则是“占山为王”,他更清楚围棋切忌目光短浅、因小失大。电脑精于计算,却因为精于计算而锱铢必较,反倒成了负担。在人脑看,两枚棋子在角上成犄角之势,现在是一目空都没有,几十回合后就是一片实地,而在电脑看来那两枚子完全毫无意义:他算(猜)不到几十回合后的情况——除非工程师把棋谱输入数据库——但那样一来不仅失去了人工智能“自我思考”的意义,而且所需输入的数据实量在太大,并不现实。人的逻辑门会“理所当然”的从可能性最高或最低的开始判断,而机器对“与”“或”的认识永远按部就班、承着顺序来;人有一种“跳跃性思维”,一种“感觉”(尽管出错的概率相当高),可以大胆提出假设,根据假设进行验证,而机器却只能循规蹈矩,很难迈出“先假设,再验证”这一步。在我看来,让机器理解“什么是势”“如何取势”——凭借感觉和推测,而不是通过计算来模拟未来的局面——大概是围棋算法最困难的部分,也是让机器由“业余水准”向“专业水准”挺进的最关键环节。
        “脱先”遵循的原则是“服从大局”。大局观是区分业余棋手和专业棋手的决定性标准(还有计算能力),而在专业棋手间,对脱先的运用不仅是棋力微妙差距的度量衡,更是一门艺术。
        其实,对于采用遍历算法、并且拥有清晰“权”概念的计算机而言,根本不存在脱先一说:他在任何时候都能从全局视角出发求解。但因为遍历只存在理论上的可能,现实中的计算机程序只能优先计算“局部”,再借助“棋谱”考虑大势——这基本上也是人的思维模式。下棋者、观棋者常常说“妙手”“妙手”,妙手有两种:一是在局部战斗中计算精妙、一子当千的好棋;二是在局部战争外凿空拓荒、拨云见日的好棋。对于前者,精于计算的机器当然不在话下,对于后者,又分为两种情况:局部战斗已经结束,先手开辟了新战场;局部战斗尚未结束,可是先手选择了脱先。处理第一种情况,拥有了大局观的机器依然不遑多让;至于第二种情况,人都很难做到,更不用说机器了。人脑的逻辑门,长于用最简捷的思路判断真值,而且可以不用穷尽所有情况,凭“直觉”(尽管也不是很准)“猜”出结果(强制中断)。如前文所言,局部战斗中人脑和电脑的算法都是遍历生成树。围棋的特征之一是:局部交战愈久,棋子愈多,它的全局价值越少。顶尖棋手可以在交战结束、全局价值减少到最低之前适时中断,从树枝回到树根,脱先寻找新的战机——遍历局部是机器的强项,人对“势”的理解更加透彻,可是在局部与全局间往来自如,也只有人类智慧中的佼佼者可以做到。总而言之,脱先的艺术,是强行中断的产物,是跳跃思维的体现,更是“人性化”的最重要特征之一。
    cool hit counter
    3/20/2007

    人工智能.Chapter2.从象棋和围棋展望新世纪的人工智能(一)

        1958年,“思考”成为第一台能同人下棋的计算机,每秒计算200步。
        1988年,“深思”(每秒计算75万步)击败丹麦特级大师拉尔森。
        1989年,“深思”升级版(每秒计算200万步),以0比2负于世界冠军卡斯帕罗夫。
        1993年,“深思”第三代击败丹麦国家队和小波尔加。
        1995年,“深蓝”更新程序,新的集成电路可以让其每秒计算能力达到300万步。
        1996年,“深蓝”2比4不敌卡斯帕罗夫。
        1997年,“更深的蓝”以3.5比2.5击败卡斯帕罗夫。
        2001年,“深弗里茨”击败了除克拉姆尼克之外的所有排名世界前十位的棋手。
        2002年,“深弗里茨”(每秒计算600万步)以4比4战平世界棋王克拉姆尼克。
        2003年,“深青年”以3比3战平卡斯帕罗夫。
        2005年,“九头鸟”以5.5比0.5大胜英国棋王亚当斯。

        不久前听一位密码学专家说:当今世界上速度最快的计算机,都用作破译密码了。于是不免有些怀疑:近几年来不断与国际象棋大师过招,并且互有胜负的计算机们是否代表了当时最先进的计算机技术。自己对国际象棋几乎一窍不通,对我来说,同样是象棋,还是中国象棋比较亲切些。
        2006年8月,云集了多名中国象棋顶级高手参战的首届浪潮杯中国象棋人机大战的现场可谓星光璀璨,然而最终成为赛事主角的,则是那部高2米、重300公斤,在两场战役中保持不败的电脑浪潮天梭。8月上旬,“浪潮天梭”以11比9的总比分战胜由柳大华等五位象棋大师组成的大师联队;8月15日,等级分排名全国第一的许银川与超级计算机“浪潮天梭”两战两和。赛后,人称“少年姜太公”的象棋特级大师许银川在面对记者的采访中,有一句话令人印象异常深刻。
        “……‘炮一平二’更是出乎我的意料,从这步棋看来,它已经拥有了人类的智慧了。”
        计算机的棋艺高低,无非取决于硬件和软件。硬件决定计算的速度和深度,软件决定计算的思维回路。所谓“人机大战”,听起来是以“每秒计算XX步”为卖点,其实在当今的技术条件下,胜负的关键还在于人工智能的成熟程度。计算机领域里,“瓶颈”一词使用的尤其普遍,在摩尔定律已经只能通过“增核”的手段勉强维持的今天,电脑棋手棋艺的瓶颈并不在于CPU的技能,而是掌控其“思维”的软件。我不知道联想的工程师是如何为“天梭”设计算法的,只能猜测是为每一步走法设定了一个“权”,除去开局、残局、杀棋及一些不可选择的应对外,其他局面混乱、厮杀正酣的情况下,吃一个卒有多少全,吃一个车有多少权,叫将有多少权……不仅计算眼前的一步,其后的几步也计算;不仅计算自己的走法,对方的走法也计算——最终选择最优权的最优解行棋。
        然而让“少年姜太公”大呼“出乎意料”的棋,并非走得如何精妙,恰恰相反,那一步走得简单,走得平庸——是一步“等着”。“它好像有了人的思维,等对方出招。一般来说,计算机下棋攻击性强,反应迅速,这招以静制动让我非常意外。”没有好棋可走时用“等招”来等候机会,这本是人类棋手的做法。没想到这招,“天梭”也会。
        可机器毕竟是机器,偶尔走出人性化的棋,绝大多数情况下仍然摆脱不了程式化的思路。赛后许银川一面称赞对手精于计算、算无遗策,一面也道出了它的缺陷:缺乏大局观;创造性较差;不轻易弃子,思维形式单一;算法较贪吃,特别是容易在残局时因贪吃下出软招(第一局许在不利条件下逼得和局,就是因为电脑贪吃了一个卒)。
        中国象棋历史上的第一轮人机大战结束后,有记者写道:“10年前,电脑战胜世界最顶级的国际象棋棋手。现在,电脑在中国象棋的领域达到大师水平。但全世界最好的机器配上最先进的软件,在围棋的水平上却依然仅仅相当于一个初级的业余棋手。原因在于,围棋的复杂程度远远大于国际象棋和中国象棋。”在我看来,这句中肯的评价流露着自豪、无奈,意味深长,的确,也许在十年之内,人类在包括国际象棋和中国象棋在内的诸多智力竞技领域的阵地都将相继失守,但是至少围棋——这一至今依然流行的历史最悠久的对弈游戏——将坚守到最后一刻。可以断言,如果有朝一日某台计算机达到了相当于围棋职业九段的境界,那么届时人工智能的成熟程度,也许已经“学会”“进化”了。
     
    cool hit counter
    3/17/2007

    人工智能.Chapter1

      所谓的“高达一代”,意为日本一批二十世纪六十年代生人。上世纪六七十年代,在那段以“世界的进步与调和”为主题的岁月里,苏联与美国用东方号的首次载人航天飞行和阿波罗登月揭开了人类“大航天时代”的帷幕。在日本,随着战后的日本经济以神话般的速度发展,在不远的将来统治了半个世界的动漫产业也迅速崛起。以手冢治虫——他无情剥夺了所有其他日本漫画家被封为“漫画之神”的可能——为代表的一批动漫工作者,本着对科学的无上崇敬,以及对未来的美好憧憬,创造出包括《铁人28号》《铁臂阿童木》在内的一大批机器人动漫作品,也为这一类型的后续作品奠定了科技、太空、未来世界的永恒主题。时光流迁至1979年,堪称丰碑之作《机动战士高达0079》终于横空出世。于是可以说,1980以前是机器人动画孕育和成长的青少年时期,而“一年战争”为它行了冠礼,此后,《变形金刚》《超时空要塞》《新世纪福音战士》,加之《高达》的后继系列……成熟优秀的作品层出不穷。
      当中国的80一代饥饿地睁大了眼睛,狼吞虎咽那些在改革开放后潮水般涌入中国的日式动漫时,日本那些看着机器人动漫长大的60一代已经早已步入社会。他们当中最有代表性的一群,有的进入索尼、松下等企业,开始了对尖端技术的追求与创造;有的投身动漫和游戏产业,把自己儿时梦想的火炬传递给下一代;还有的终于无法分清现实与虚幻,迷失在空虚中不能自拔。在日本的这批“高达一代”中,我最尊敬,也是对我影响最大的一位,是缔造了《Metal Gear Solid》系列的小岛秀夫(虽然他也是《心跳回忆》之父……无视……)。尊敬他,三分是欣赏他的游戏,七分是欣赏他的哲学(单以游戏论,我更崇拜马利奥之父宫本茂和《生化》之父三上真司)。
      作为一个游戏制所者、工程师,在“三分的游戏”方面,小岛和他领导的KONAMI旗下的“小岛组”在图像技术和人工智能两个方面都走在行业的最前端。1997年《MGS1》诞生时所产生的轰动,自己因为当时根本不接触电视游戏而一无所知,但面对2001年《MGS2》君临E3的王者之风,却通过《电脑报》上的消息,几乎在第一时间就被波及。《MGS2》在2000年E3上推出的不过是一部长度不到十分钟的预告片,可就是这样一部在KONAMI展台前每一小时播放一次的预告片,却夺走了当场所有的风骚。“在E3展示期间,小岛每个小时都要在展棚的墙壁上播放一遍9分钟的预告片。观众提前15分钟就会拥挤在一旁,以致于E3的工作人员开始担心这么多的人挤在一起会发生危险。甚至人群的中开发人员也反复地观看这段预告片,而且不敢相信他们在屏幕上看到的一切。 ”——我没有去过现场,2000年当时也没法看到预告视频,只能从报纸上的模糊的黑白照片里想象当时的情况。两年后我从同学的DVD里终于一睹Solid Snake在2000年的真容时,那五体投地、顶礼膜拜之情……无论是用“电影化的游戏”来形容贴切些,还是用“游戏化的电影”来比喻更合适,《MGS2》的动画在画面、配乐、剪辑上都是好莱坞巨片级的(其实游戏本身就大量模仿了《THE ROCK》——勇闯夺命岛)。而在游戏本身的素质上,高自由度和高AI所产生的带入感秉承了一代的光荣传统,配合PS2“次世代”级的硬件性能,真正意义上创造出了一个“虚拟世界”。
      “七分的哲学”——小岛是一个哲学家。他在MGS三部曲中分别探讨了基因、信息、时局。探讨“遗传基因对人的影响”的一代的被公认是“20世纪最优秀的剧情”,探讨的“人总是被时代左右”的三代则被大多数玩家称赞“最为感人至深”——然而在我看来,也许出于先入为主的心理,引领我进入小岛的世界观的《合金装备2:自由之子》才是最具哲思的新世纪史诗。
      如前文所言,“小岛组”用高自由度与高AI创造了一个“虚拟世界”。在这个世界里,游戏主人公生活在一个现实与虚拟相结合的环境中。对主人公Radien而言,这个世界真实的一面是曼哈顿、自由女神、国会议事堂等一切看得见、摸得着的“东西”;虚拟的一面,则是他的长官、他的任务、他所获得的一切“信息”。就像制作人在游戏最后,借Radien的“司令官”、一台具有可怕人工智能的计算机之口传递了如下思想:在这个信息过剩的时代,我们需要制定一套规则去处理信息的冗余,剔除坏的、留下好的,剔除假的、留下真的,剔除无价值的、留下有意义的;但是在某些情况下,为了人类的进步(进化),我们可以刻意扭曲、创造出一些信息。拿破仑说:你怎么可能统治一个没有宗教信仰的国家?当一个人即将死于饥饿,可他身边另一个人却因为暴饮暴食而患病时,他绝不可能顺从如此的不公——除非有一个权威的声音告诉他:这是神的旨意。Religion is excellent stuff for keeping people quite(这句话实在不好翻译)!

    ps:写这篇文字的时候思路很乱,写着写着竟发现文章的结构和原先的想法已经出入很大了。这一周被三件事左右了心情,一是“早一早二荷兰语”像走马灯一样点缀着枯燥的校园生活;二是发现《远大前程》这本书写得太好了,大有相见恨晚的遗憾和欣喜;第三件事比较重要:因为许多因素莫名其妙交织在一起,发生了化学反应,导致自己对人工智能产生了莫大的兴趣,甚至大有把前途压在上面的想法。归根到底,还是浦泽直树和他的《pluto》干的好事——但愿这股冲动可以挟着我一路走下去。
    cool hit counter
    11/12/2006

    垃圾,垃圾

          很久没更新了,其中考试的缘故……
          离散和电分都没话说,大物就是个垃圾。没听说要带计算器,结果一道填空让人开2.XX的三次方,最后一道大题答案是18.44(约等于),算出来要处理几个八位数,Shit!我在卷子上这么写的:“数据太复杂,没有计算器,我只能到此为止。我把算式都列出来,给多少分您看着办吧。”
          前面一道填空题我也作了批注。这道题居然要求分别写出开尔文和克劳修斯对热力学定律的表述。Shit!难点不在于如何解释,在于对号入座……鬼还记得哪句话是哪个人说的!
          我注的是“这种题,对大学生来说毫无意义……”
          都二十岁的人了,还背这些鸟玩艺,垃圾!!!
          最郁闷的是,大物考试前两个小时,我还以为考试是“半开卷”,能带一张纸进考场……
          当然这是我的问题……
          ps:区人大代表选举的时候,我在“其他候选人”栏,填了“丁贝莉”
    cool hit counter
    9/7/2006

    物理是上帝的法律,数学是上帝的语言

            物理是上帝的法律,数学是上帝的语言——我不知道如此牛X的话是谁说的,但我对这位狂人的观点坚信不疑,而且变本加厉的以为:这法律是最公平的法律,这语言是最精确的语言。红衣主教问伽利略:为什么上帝让地球以圆形的轨道公转,而不是其他型状——伽利略回答,上帝会选择最易让人类思维理解的形状,如果他选择了其他形状,他也会选择人类的思维。
            God很难翻译,有时候它是上帝、是耶和华,有时候它泛指神、冥冥中的造物主。“上帝的语言,上帝的法律”这话是别人照英文翻的,原文想必是God,私以为在这里应当翻译成神。我不信上帝,可我笃信神。
            高数学得不好,与付出的时间不成正比,我要把责任推卸给我的高数老师:用《石头》的话说,他逼良为娼。回想梦辉先生,虽然其人风评不佳,自负、色狼云云,可我对他身为敬佩:他自己感受着、并让我感受到物理是美的。当时他把F=G*[m1*m2/(r*r)]F=K*[q1*q2/(r*r)]写在黑板上,盛赞两者默契如斯、天作之合,于是我想:物理真TM是门艺术……物理学得不好是因为不够聪明,但至少我已经爱上了她,无怨无悔。
            哥白尼和伽利略用纸笔计算日月轮转,牛顿与卡文迪许以尺镜量度星球重量,爱因斯坦在瞑目深思中与光同行,多年后一行公式化两枚炸弹掠十万性命……物理是这样浩浩荡荡的铺陈在历史中,那数学呢?
            可叹我这位高数老师(以及课本编纂者),他们竟就这样交差了。
            克莱茵认为,欧拉公式无疑是最美丽的数学公式,其特例“e+1=0”将数学中最重要的数e、i、π、1、0,用简约到极限的笔触联系在一起,就好像“烟锁池塘柳”一样——蕴含金木水火土五行偏旁——后者是千古绝对,前者堪称千古公式。试想有一位对数学懵懂未开的少年,一日读史至此(数学史话),那将如何感叹造物主的匠心独具:有且只有神才会有此等美感,为我们编汇数学这门最美的语言。我的高数老师呢?讲授欧拉公式时他居然一笔带过,只叫我们记下来、做题会用,诸如此类。天哪!上过他的课,欧拉一定会被气得从坟墓里跳出来——你可以想象一个语文老师教《滕王阁序》时只让学生背课文、记翻译,说“这句考试要默写的……”如此敷衍了事么?周星驰会告诉你:“雄州雾列,俊采星驰”,我妈就是这样给我起名字的。啊!?《滕王阁序》的精华所在,又岂止“落霞与孤鹜齐飞,秋水共长天一色” 一处?
            十年前黄集伟采访王小波,问如果把小波流放到荒岛上,只许携一本书随身,当做何选择。小波说既然流放荒岛,理应带一本可以消磨时间的书,那就带吉米诺维奇的《数学分析》吧。可笑黄集伟文科出身,一时没听清竟把《数分》错当成棋谱,闹了个大笑话(如今黄集伟在《经济观察报》上有一个阅读笔记专栏,字里行间还是重文轻理)。小波说他是个浪漫诗人,哪怕写软件仍是个软件诗人——理工科出生同写作并不矛盾嘛!他嘲讽着,调侃着这个世界,用科学的思维想入非非,将数字与文字美妙的柔和。只可惜,小波这样的软件诗人太少了。
            Falcon说他们的数学老师酷爱数学,曾指着满屏板书感叹:它们(这些数字)是我的孩子!一个奔放的山姆大姐!如果…那么…多好啊……
    cool hit counter