将技术分析进行到底
提供专业的程序化交易解决方案

《数学之美》第19章:谈谈数学模型的重要性

本文转自网络。来源:吴军博士所著《数学之美》一书的第19章。感兴趣的朋友可购买正版图书进行更深入研究。

亚马逊购书链接:《数学之美》


吴军著

一直关注“数学之美”系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,2006年7月我在Google中国内部讲授搜索基本原理,一共只有30学时的课程,却用了整整两个学时来讲数学模型。2010年我到腾讯后,第一次内部技术讲座也是讲述同样的内容。

在包括哥白尼、伽利略和牛顿在内的所有天文学家中,我最佩服的是地心说的提出者托勒密(Claude Ptolemy,公元90-168年)。

 

6001

 

天文学起源于古埃及。由于尼罗河洪水每年泛滥一次,尼罗河下游有着十分肥沃而且灌溉方便的土地,因此孕育出人类最早的农业文明。每当洪水过后,埃及人就在退洪的土地上耕作,然后便可获得很好的收成。这样生产方式一直延续到20世纪60年代,直到尼罗河上的阿斯旺大坝修成,尼罗河下游再也没有洪水可以灌溉土地为止。(埃及延续了几千年的农业也因此被破坏殆尽。)为了准确预测洪水到来和退去的时间,6000年前的埃及人发明了天文学家。和我们想象的不同,古埃及人是根据天狼星和太阳在一起的位置来判断一年中的时间和节气。在古埃及的历法中没有闰年,它的一个“季度”也非常长:长达365*4+1=1461天,因为每隔这么多天,太阳和天狼星一起升起。(因此,古埃及的日历是一个周期很长的日历。)事实证明,以天狼星和太阳同时出现参照系比仅以太阳做参照系更准确些。古埃及人可以准确判断洪水能到达的边界和时间。

 

到了人类文明的第二个中心美索不达米亚兴起的时候,那里的古巴比伦人对天文学有了进一步的发展,他们的历法中有了月和四季的概念。同时他们观测到了五大行星(金、木、水、火、土,肉眼看不到天王星和海王星)运行的轨迹不是简单地围绕地球转,而是波浪形地运动。西方语言中行星(Planet)一词的意义就是漂移的星球。他们还观测到行星在近日点运动比远日点快。(下图是在地球上看到的金星的轨迹,看过《达芬奇密码》一书的读者都知道,金星大约四年在天上画一个五角星。)

 

6001.2

 

但是真正创立了天文学,并且计算出诸多天体运行轨迹的是两千年前古罗马时代的克劳第斯·托勒密。虽然今天我们可能会嘲笑托勒密犯的简单错误,但是真正了解托勒密贡献的人都会对他肃然起敬。在过去几十年里,因为政治的需要,托勒密在中国总是被作为错误理论的代表受到批判,以至于中国人基本上不知道他在人类天文学上无以伦比的贡献。我本人也是在美国读了些科学史的书籍才了解到他的伟大之处。作为数学家和天文学家的托勒密,他有很多发明和贡献,其中任何一项都足以让他在科学史上占有重要的一席之地。托勒密发明了球坐标(我们今天还在用),定义了包括赤道和零度经线在内的经纬线(今天地图就是这么划的),他提出了黄道,还发明了弧度制(中学生学习的时候可能还会感觉有点抽象)。

 

当然,他最大也是最有争议的发明是地心说。虽然我们知道地球是围绕太阳运动的,但是在当时,从人们的观测出发,很容易得到地球是宇宙中心的结论。中国古代著名天文学家张衡提出的浑天说,其实就是地心说,但是张衡没有能定量的进行描述。从下面两张图中可以看出两者非常相似。只不过因为张衡是中国人的骄傲,在历史书中从来是正面宣传,而托勒密在中国却成为唯心主义的代表。其实,托勒密在天文学上的地位堪比欧几里德之于几何学,牛顿之于物理学。

 

6001.3

 

当然从地球上看,行星的运动轨迹是不规则的,托勒密的伟大之处是用40-60个小圆套大圆的方法,精确地计算出了所有行星运动的轨迹,如图所示。托勒密继承了毕达格拉斯的一些思想,他也认为圆是最完美的几何图形,因此用圆来来描述行星运行的规律。

 

托勒密模型的精度之高,让后来所有的科学家都惊叹不已。即使今天,我们在计算机的帮助下,也很难解出40个套在一起的圆的方程。每每想到这里,我都由衷地佩服托勒密。根据托勒密的计算,制定了儒略历,即每年365天,每4年增加一个闰年,多一天。1500年来,人们根据他的计算决定农时。但是,经过了1500年,托勒密对太阳运动的累积误差,还是多出了10天。由于这十天的差别,欧洲的农民从事农业生产差出几乎一个节气,很影响农业。1582年,教皇格利高里十三世在日历上取消掉10天,然后将每一个世纪最后一年的润年改为平年,然后每400年再插回一个闰年,这就是我们今天用的日历,这个日历几乎没有误差。为了纪念格利高里十三世,我们今天的日历也叫格利高里日历。

 

虽然格利高里十三世“凑出了”准确的历法,即每400年比儒略历减去三个闰年。但是教皇并没有从理论上找出原因,因此这种“凑”的做法很难举一反三。格利高里的历法非常准地反映了地球的运动周期,但是对其他行星的运动规律起不到任何帮助。而纠正地心说错误不能是靠在托勒密40个圆的模型上再多套上几个圆,而是要进一步探索真理。波兰天文学家哥白尼发现,如果以太阳为中心来描述星体的运行,只需要8-10个圆,就能计算出一个行星的运动轨迹,他因此提出了日心说。很遗憾的事,哥白尼正确的假设并没有得到比托勒密更好的结果,他的模型的误差比托勒密模型的误差要大不少。哥白尼生前怕他的日心说惹怒教会,迟迟不敢发表他的学说,直到临终前才发表。而教会初期对这个新的学说的革命性也认识不足,并没有禁止。但是后来当教会发现这个新的学说有可能挑战上帝创世纪的说法时,便开始禁止它了。而哥白尼日心说的不准确性,也是教会和当时的人们认为哥白尼的学说是邪说的另一个重要原因。所以日心说要想让人心服口服地接受,就得更准确地描述行星运动。

 

完成这一使命的是约翰内斯·开普勒。开普勒在所有一流的天文学家中,资质较差,一生中犯了无数低级的错误。但是他有两样别人没有的东西,首先是从他的老师第谷手中继承的大量的、在当时最精确的观测数据,其次是运气。开普勒很幸运地发现了行星围绕太阳运转的轨道实际上是椭圆形的,这样不需要用多个小圆套大圆,而只要用一个椭圆就能将星体运动规律描述清楚了。开普勒为此提出了三个定律,形式都非常简单,就是三句话。只是开普勒的知识水平不足以解释为什么行星的轨迹是椭圆形的。

 

解释行星运动的轨道为什么是椭圆形这个光荣而艰巨的任务,最后由伟大的科学家牛顿用万有引力定律解释得清清楚楚。

 

故事到这里似乎可以结束了。但是,许多年后,又有了个小的波澜。1821年法国天文学家布瓦尔(Alexis Bouvard)发现,天王星的实际轨迹和用椭圆模型算出来的不太符合。当然,偷懒的办法是接着用小圆套大圆的方法修正,但是一些严肃的科学家在努力寻找真正的原因。英国的亚当斯(John Couch Adams)和法国的维内尔(Urbain Le Verrier)在1861-1862年间各自独立地发现了吸引天王星偏离轨道的海王星。

 

讲座结束时,我给Google中国和腾讯的工程师们总结了下面几个结论:

  • 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。)
  • 一个正确的模型一开始可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。)
  • 大量准确的数据对研发很重要。(有机会单独详细介绍。)
  • 正确的模型也可能受噪音干扰,而显得不准确;这时不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大发现。

 

在网络搜索的研发中,我们在前面提到的单文本词频/逆文本频率指数(TF-IDF) 和网页排名(PageRank)可以看作是网络搜索中的“椭圆模型”,它们都很简单易懂。

 

 

 

赞(0)
未经允许不得转载:文华程序化 » 《数学之美》第19章:谈谈数学模型的重要性
分享到: (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

横冲直撞 一直到最远方