English
首页 > 通知公告
第10届BNU实验科学锦标赛题目发布(下)
2018-09-12
陈清华、周锡饮

(5) 选举中的外国干涉

 

波兰的案例

早在18世纪,波兰就拥有了最民主的政府体制。所有的贵族都可以参加有权设立新法的立法会议。在这个会议上,每个参与者都拥有否决权,这意味着除非所有成员都同意,否则不能通过任何新法律[1]。毋庸置疑,对于波兰的三个强大邻国,即奥地利、德国和俄国来说,干扰立法变得很容易。每次即将通过可以使波兰国力更强大的法律时,总会遭到一位被邻国贿赂的贵族的反对。这导致了政治的无能。最终,波兰于1780年被分裂为三个部分,以至接下来的140年国家的独立性不复存在。南部被奥地利吞并,西部被德国吞并,东部被俄国吞并。

相同的政治体制同样解释了欧盟为何存在政治无能的问题。因为对美国来说,贿赂其中一个成员国就像当初贿赂波兰贵族那样简单。这个体制不仅导致欧盟没有作为,它同样绑定每一个成员国,使它们均无能为力。与“团结就是力量”相反,这是一个令人遗憾的联盟无效的例子。

 

领跑候选人的淘汰

人们一般会想到,选举当天发生的是至关重要的。事实上,选举日之前发生的同样重要甚至更重要。其中一个关键就是候选人的选举。

在过去几十年中,在法国有两个非常著名的例子,是关于两位领跑候选人被淘汰的故事。让我们简要介绍一下它们。

2012年法国大选  2011年时任法国总统的是尼古拉斯·萨科齐,他亲美并且促使法国加入北约组织(NATO,北大西洋公约组织,一个由美国四星将军领导的军事组织)。但是,他的5年执政使他非常不受欢迎。如果反对党派找到一个好的候选人,那么这个人一定能够当选。在这方面,时任国际货币基金组织领导者的施特劳斯·卡恩是一个理想的候选人。但是,2011514日,他被纽约方面逮捕,指控他曾经性侵一名酒店女服务员。他于201171日被释放;823日,法官正式撤销所有指控。但是,这件事仍毁掉了他的声誉,并迫使他辞去了IMF的领导职位和法国候选人身份。

简要来说,最有挑战性的候选人被淘汰,尼古拉斯·萨科齐的连任道路更一帆风顺。

2017年法国大选  20175月选举之前的几个月中,总统候选人之一的伊曼纽尔·马克龙,在巴黎会议中会见达赖喇嘛,以表明自己是一名杰出的亲美分子。当时最著名的调查结果显示,这次大选最有可能胜出的是弗朗索瓦·菲永。但不久之后,20172月,媒体指控他曾经从用于失业、低保的公共支出中挪用数十万欧元给妻子和孩子。尽管对他的法庭审理已经进入日程,但直到今天(20187月),该项审判仍未执行。在施特劳斯·卡恩名誉尽毁事件中的故事,同样发生在了马卡龙胜利的这次选举。

 

预选举的人为操纵

在一些国家(如美国、法国等),各党派的总统候选人先是通过预选举产生。这种选举非常容易被人为操控,因为投票人相对较少。组织良好的团体能够拥有对候选者决定性的影响。

 

如何开始研究

还有其他一些手段能够操控选举。这次项目的目的就是通过详细的例子来描述它们。通常,从一些有非常明显人为操控的例子开始会比较好。当选举发生在军政控制的国家中时,公平选举是很难实现的。在一些政府通过军事政变上台的国家(比如1961年韩国政变,1973年智利政变,以及1976年阿根廷政变)中,政变后的选举同样不可能公平公正。

一旦对操纵选举的主要方法有所了解后,你可以对一些隐性操纵的例子进行分析。

军事占领国的案例

当一个国家A被国家M军事占领后,A国的选举将一定被确保是由M国倾向的候选人当选。这可以由下面这些例子进行研究。

l  日本被美国占领时期发生的选举。

l  韩国1948年的选举。

l  阿富汗2001年被入侵后的选举。

l  伊拉克2003年被入侵后的选举。

M国真正有挑战性的是如何将这种干预弄得与自己尽可能的不相干。例如,在以上选举中,有争取独立的政治期望的候选人都不允许参选,但是这常常被众多党派和独立候选人所掩盖。

第二步就是如何分析更多偏见的隐藏形式,例如选举的组织方式。

 

有偏见的组织规则

你可能听说过,2016年美国大选中,希拉里·克林顿获得了48.2%的选票,而唐纳德·特朗普只得到了46.15的选票。在其他国家,2.1%的差额足够赢得选举,但是由于美国特殊的选举制度,最终特朗普当选总统。

事实上,还有一种偏见形式经常被忽视,但是它却非常严重。除了希拉里·克林顿和特朗普之外,还有其他4位候选人收到了5.7%100-48.2+46.1=5.7)的选票,平均每个人约1.4%的选票。他们为什么获得了如此少的选票。原因非常明显。在一轮选举(简单多数制,与两轮选举相对)中,只有一个人能够获胜,那些给得票数少的候选人投票的人提前知道他们的选票将会被“浪费”。简而言之,不管选民的真实意愿是什么,在这个体制中,只有两大主要党派的候选人才能够当选。

双轮选举(法国所使用的)就更好吗?某些程度上是的。但是,需要注意的是,在议会选举中,一个党派,例如“法国国民阵线”,通常能获得16%的选票,却只有不到1%的选席。这种技巧是如何实现的?你能从网络上轻松找到答案。

 

任务的目标

之前的例子充分说明,选举是一个非常复杂的过程,能够被国内或者国外势力通过多种方式进行扭曲。这次的任务将给你一个机会去发现那些选举的暗面。通过描述那些经常被使用的手段,你能够建立一个分类目录,将选举操纵的不同方式进行归纳。

西方媒体在负责选举报道时有非常矛盾的态度。发展中国家是盟友的,其候选人通常被认为是“不完美但是振奋人心的”,但是对于白俄罗斯、伊朗、俄罗斯、叙利亚或者委内瑞拉的候选人,常常被报道为“有缺陷的”。有时候,这些标签甚至会随着时间变化。例如,当埃及总统穆巴拉克还在受美国照顾时,他被称为是“振奋人心的”;然而,当他失宠后,相同的选举中却被印上“有缺陷的”标签。

 


6) 创建和修改维基百科文章

为了节省时间团队中最好有人创建过维基百科的文章。

 

关于维基百科的理念有两种说法:

1.第一种理念是(同时也是由维基百科创始人所推广的理念),维基百科是一个国际的项目,欢迎每一位贡献者。

2.第二种理念,维基百科最初是一个美国的项目,它的发展主要是由美国赞助商赞助,因此它的目的终究在于传播和促进美国的世界观。

该项目的目标之一就是去找出哪个才是真相。

研究这个问题有两种方式,一种是论证与抗辩,一种是做实验,在这个项目中我们提倡用第二种方式。

该项目基于以下的想法:

诚然每个人都能在一定程度上修改维基百科的文章,以下面的文章为例:

https://en.wikipedia.org/wiki/Symmetry_breaking_of_escaping_ants

在这篇文章最初的版本中提到了北师大一支团队完成的一个实验,这个团队中包括当时系统科学院在读博士生李耕(Li Geng)。然而由于论文的参考文献并不是完全正确,所以由Li Geng编辑的维基百科的文章变成了你现在看到的版本。如果你想知道更多相关细节可以通过下面的地址联系Li博士: moralmarket@126.com

因此这个项目的第一步就是去创建一篇(比如关于中国某个不错但是不知名的地方)维基百科文章(中文和英文)

我们前面提到过维基百科的文章在一定程度上能够被修改,那这意味着什么呢?

在开头提到的第二种理念中我们期望得到“对于那些重要的观点维基百科希望美国的版本流行”这样的结论。的确,如果你阅读维基百科上关于美国占领冰岛、朝鲜或者日本,又或者中国1960-1961年的粮食危机的文章,你将会看到这些文章在很多方面歪曲了事实,这些文章经常遵循美国国务院或国防部的历史学家设定的版本[2]

是否有可能创建一篇出维基百科文章彻底改变了之前对某个主题的描述呢?在这个实验中最好先从文章的中文版本开始,在中文版本被接受之后再将它的英文译文添加上去。这将是一个具有启发性的实验,实验的结果也许会引起中国乃至世界的关注。


7)翻译和解释产生于编程语言的错误信息

请注意,这个项目是设计给使用LINNX操作系统的学生,了解bash编程语言(和LINUX有紧密的联系)和其编程语言,比如C语言,Python或者Fortran。下面是非Windows-Microsoft操作系统的指引。

 

错误信息界面友好为什么那么重要?

这里有两个可能的编程概念:

1.  狭义的编程概念是编程是专业的编程人员编写的。

2.  广义的概念,编程是一个可以运用于多种活动的工具。音乐家希望用Python来编写一个可以发出特殊声音序列的剧本。历史学家可能需要用Java来编写一个可以用来检索他需要的资源的个人搜索引擎的程序。每个人都可以列举出许多其他例子。

用音乐作为例子可以让我们更容易理解。在狭义的音乐概念里,音乐只会涉及专业的音乐家,而在广义的概念里,许多人会为了和朋友们玩乐器而学习音乐,或者仅是为了自娱。

在美国,广义的编程概念被人们所接受,而在欧洲,则流行狭义的编程概念。最明显的结果就是经过几十年的发展,欧洲已经落后了。现在,毫不夸张地说,几乎所有欧洲使用的软件工具都是美国创造的。

中国希望跟随那条路呢?这个重要的问题目前还没有明确的回答。如果中国希望走欧洲道路,则不需要担心使错误信息界面更友好。相反地,如果中国希望采用广义的概念,呈现编程(在更普遍的意义上,包括计算机科学的各个方面)的一致化和友好化是至关重要的。

许多教编程的教授已经注意到理解编译器产生的错误信息对大多数学生来说是一个很大的阻碍,这是一个许多学生根本没有能力去解决的障碍。因此,在他们一生中,他们将会觉得编程是很困难和深奥的东西。显而易见的后果是在他们自己的活动中,学生们没有任何兴趣使用编程。相反,如果可以使错误的信息更加界面友好,甚至不打算成为专业程序员的同学都会记住编程这个神奇、有趣、有用的东西(像音乐一样)!无论任何时候需要,他们都会毫不犹豫投入时间来学习可以帮助他们的编程语言。

 

怎样使错误信息更加界面友好?

错误信息界面友好的第一步当然是把他们从英文翻译成中文。你们可能会发现,几乎所有编程代码使用的都是英文。然而,代码和错误信息之间有巨大的差别。代码只有有限的单词,很容易学,而错误的信息却有很成千上万的英文单词。

更糟糕的是错误信息使用的单词一点都不是学生们在英语课堂上学的,举个例子,看看下面这个错误的信息:Unary operator expected,这三个单词中,只有“expected”是标准英语单词,而“Operator”是比较平常的单词,但是这是一个数学用语,在英语课上不会学到。“Unary”是一个即使是英语母语者也可能不知道的非常罕见的单词。

再一次用音乐来类比,如果学习音乐之前的就首先要学讲英语,这无疑地会增加额外的困难。

 

翻译和解释

在这个项目中,我们希望可以自动地把编程语言错误信息的英语单词翻译成中文,并解释这些不容易理解的单词。一个主要的任务是去建立一个包括所有错误信息单词的翻译和解释的词库。

如果你对这个项目感兴趣,注意在你的团队中添加一或两个不会编程的同学。事实上,如果你想测试你的翻译和解释是否精确的,唯一现实的方法是看看其他同学能否理解他们。记住并不是你可以解释自己写的东西,别人就可以跟你一样可以理解。

更多细节的解释和用bash编写的代码可以在Roehner (2015)找到。

 

参考文献

Roehner (B.) 2015: Translation into any natural language of the error messages generated by any computer program.可以在arXiv网页找到全文:http://arxiv.org/abs/1508.04936

 

 


8)城市感知:通话模式与出行模式间的关系

人类的出行行为与模式对于城市研究有着重要的影响,知晓城市中居民的出行需求量与时空分布与特征,对于城市规划、交通优化(例如公交线路的优化)、共享单车的调度、应急事件处置、流行病传播预测等问题都有重要的意义,对提升城市效率 [1]、降低能耗有着重要的指导作用。

然而我们对于城市中人群的出行行为的感知能力直到十几年前都是非常局限的。十多年前,当科学家们想要研究人类的移动行为特征时,都只能创造性地借助于接近50万张钞票的流通距离[3]统计特征作为近似,因为毕竟是人的移动导致了钞票的移动;这一刊发在《自然》上的重要工作发现人类移动距离的分布是幂律形式,也就是说大部分出行的距离并不很远,但长距离出行出现的概率仍然会比正态分布或者泊松分布大很多 [2]

近年来随着通讯技术的发展和移动终端的普及,我们现在可以获取到大量的手机记录数据,每当我们使用手机时,无论是通话、短信抑或使用数据流量,都会出于记账目的产生相应的记录,而且这类数据会记录我们的大致位置(它很可能是一个三角定位的位置,抑或与手机通讯的机站的位置),从某种程度上来说,手机可以看作人类活动的传感器,这些数据使得我们能够在更为细致的层面上研究人类行为 [2]。研究者发现人类的出行距离分布是一个幂律形式加一个指数截尾,而且人类的出行有很强的自相似性特征 [3]

但是手机数据也有它自身的问题,它本身有很多的噪声,当离我们最近的机站特别繁忙时,我们的信号很可能会被连接到一个更远的机站,而这样的问题便是,用户本身是没有发生物理移动的,但从记录的信号上来看却发生了移动。研究者们发展了一系列算法来处理手机数据当中的噪声 [4],经过这样的处理之后我们能够得到更为准确的数据。我们会为大家提供经过去噪之后的匿名化手机数据,这些数据可以告诉大家用户在何时何处进行了停留,经过了哪些地点等等。

但一个非常基础而且重要的问题是如何衡量人类出行行为的特征。所以我们非常鼓励大家在阅读参考文献之前自己先思考一下都可能可以从哪些角度来定量化地描述人类的出行特征。

更进一步,一个可能的有趣话题是,通过用户通话情况的时空特征(例如其全天的通话时长分布,参见参考文献[1]中的图3)是否能够推断一个人的移动特征?当深入分析数据后,大家或许会发现通话行为的活跃时间很可能也是各不不同,一些人或许是白天活跃的上班族,而另一些人则可能是晚上异常兴奋的夜猫子,而且他们的出行特征也很可能有很强的特点;如果能够将这样两个维度连接起来,将会是一个非常有趣的工作。

 

 

参考文献

[1] Population-weighted efficiency in transportation networks. Scientific Reports, 2016, 6: 26377.

[2] The scaling laws of human travel. Nature, 2006, 439: 04292.

[3] Understanding individual human mobility patterns. Nature, 2008, 453: 06958.

[4] Origin–destination trips by purpose and time of day inferred from mobile phone data. Transportation research part c: emerging technologies, 2015, 58: 240-50

 

 

如有问题也可以直接与出题者李睿琪老师联系:lir@mail.buct.edu.cn


9)中国科学家在大学间的流动问题

 

在这个研究中,我们将收集不同学科科学家的博士毕业高校以及任教的高校。通过这个数据,我们可以建立起中国高校间毕业生流动网络。一个大学聘用其他大学的毕业生,可以认为这个大学对其他大学教育质量的认可。因此,博士毕业生在大学间的流动网络可以揭示大学教育质量的排名。另外,我们可以对每个学科建立起这样的网络,从而对比不同学科的各高校排名。

 

实际上,这个问题已经在2015年有过类似的分析,发表在Science Advance杂志 (Systematic inequality and hierarchy in faculty hiring networks, 2015)。然而当时的分析主要是针对美国科学家在高校内的流动数据分析,集中在历史学,商务科学,计算机科学三个学科。这次咱们的数据,可以使这次研究包括中美对比,从而揭示在科学家流动方面,中美两国是否有本质上的差别。

 

1,美国各高校博士毕业生就业流动情况的网络,以及对于高校教育质量的排名。

如有问题也可以直接与出题者曾安老师联系:anzeng@bnu.edu.cn@bnu.edu.cn



[1] 目前,欧盟也存在类似的制度。只有28个国家全部通过才能做出重大决定。其中,拥有58万人口的卢森堡拥有和德国具有一样的权利,即使后者为前者人口的100倍还多(德国人口82百万)。

[2] 可以通过以下网站得到更加可靠的报道:http://www.lpthe.jussieu.fr/~roehner.occupation.html

http://www.lpthe.jussieu.fr/~roehner.biodemo.html(Appendix of last article).

 

[3] www.wheresgeorge.com


学院论坛       会议室查询

北京师范大学系统科学学院  版权所有
邮箱:sss@bnu.edu.cn  邮编:100875  地址:北京市海淀区新街口外大街19号  电话:58804138

  • 微信
    公号
  • 科普
    平台