對于“算法”一詞給以精確的義不是一件容易事,有一些意相近的同義語,就是一些其他名詞,它們(有時)會給出差多同樣的東西,例如 "法則"" 技巧”“程序”還有“方法”等狍鸮都是這種同義語。也可給出一些例子,如長乘法,就小學(xué)生學(xué)的把兩個正整數(shù)相乘豎式乘法。然而,雖然非形式解釋和恰當(dāng)?shù)睦訉τ谑裁词?法給出了很好的感覺,但算法詞中所深藏的思想?yún)s經(jīng)歷了一很長的演化歷程,直得到 20 世紀(jì)才得到了令人滿意的形式定義雷祖而關(guān)于算法的觀念,直如今還在演進(jìn)。算盤家和算法回到關(guān)于乘法的例子,有一點(diǎn)顯然的:怎樣把兩個數(shù)相乘?示這些數(shù)的方法極大地影響了法的具體作法。為了弄明白這,試著把兩個羅馬數(shù)字 CXLVII 和 XXIX 相乘,但不要先把它們譯成等價的十數(shù)字 147 和 29。這件事既難弄明白,明白了以后進(jìn)計(jì)算也極其花時間,而這就可解釋何以留存至今的羅馬帝國于乘法的材料極為零散。記數(shù)可以是 " 累加的 ",如羅馬記數(shù)法:C 表示 100。X 表示 10。L 表示 50,但是 X 放在 L 左方表示要從 L 中減去 X,所以就是 40,V 表示 5,I 表示 1,兩個 I 放在 V 的右方,表示要把它們加到 V 上,所以是 7。把所有以上的解釋“累加”起來,是羅馬數(shù)學(xué)的 147。記數(shù)制度也可以是進(jìn)位的,如我們今所用的那樣。如果是進(jìn)位的,以使用一個或多個基底。在很的時期中,進(jìn)行計(jì)算可以使用種計(jì)算工具 "算盤(abacus)"。這些計(jì)算工具可以表示一定基底下柘山進(jìn)位制的數(shù)。如,如果以 10 為基底、則一個標(biāo)記物可以代表 1 個單位、或者 10?;蛘?100 等等,視它是放在哪一橫行或豎列而定。按照精確的規(guī)則移這些標(biāo)記物,就可以進(jìn)行算術(shù)則運(yùn)算。中國的算盤就是 abacus 的一種。到 12 世紀(jì),阿拉伯?dāng)?shù)學(xué)著作被翻譯拉丁文以后,十進(jìn)制就在歐洲行開來了。這種進(jìn)位制特別適于算術(shù)運(yùn)算,并且引導(dǎo)到許多的計(jì)算方法。這些方法就通稱算法(algoritmus),而與在算盤上用標(biāo)記物進(jìn)行算相區(qū)別。雖然數(shù)字符號,就數(shù)碼,來自印度人的實(shí)踐,而來才為阿拉伯人所知,現(xiàn)在這數(shù)碼卻叫做阿拉伯?dāng)?shù)碼.算法algorithm)的字源卻是阿拉伯文,它是阿拉伯?dāng)?shù)學(xué)阿爾?花拉子米的名字的變體花拉子米是現(xiàn)在已知的最古老數(shù)學(xué)書的作者,這一著作名為 《通過補(bǔ)全和還原做計(jì)算的綱》(al-Kitab al-mukhtasar f hisib al-jabr wod ll-mugi balo),其中的 al-jabr 后來就變成了“代數(shù)”(algebra)一詞。有限性我們已經(jīng)看到“算法”一詞在中世紀(jì)指以整數(shù)的十進(jìn)制表示為基礎(chǔ)計(jì)算程序。但是到了 17 世紀(jì),在達(dá)朗貝爾主編的《百科書》中,算法一詞被賦予了更泛的意義,不只用于算術(shù),還于關(guān)于代數(shù)方法以及其他的計(jì)程序,諸如 "積分學(xué)的算法"" 正弦的算法 " 等等。算法這個詞又逐漸地被用來表夸父意的具有精確規(guī)則的系統(tǒng)的計(jì)程序。最后,隨著計(jì)算機(jī)的作越來越大,有限性的重要性被分認(rèn)識到了,很本質(zhì)的要求是這個過程在有限時間以后就會止,而給出結(jié)果。所以就得到下面的樸素的定義:一個算法是有限多個規(guī)則的集合,用以數(shù)量有限的數(shù)據(jù)進(jìn)行操作,而有限多步以后產(chǎn)生結(jié)果。注意在這里一直強(qiáng)調(diào)有限性,在寫算法時的有限性,以及在執(zhí)行法時的有限性。上面的陳述算上是在經(jīng)典意義下的數(shù)學(xué)定義我們將會看到,把它進(jìn)一步形化是重要的。但是我們現(xiàn)在暫也就滿足于這個 "定義" 了,而且來看一下數(shù)學(xué)中的算法一些經(jīng)典例子。三個歷史上的子算法具有一種我們尚未提到特性:迭代,也就是簡單程序反復(fù)執(zhí)行。為了看清迭代的重性,我們再一次來看一下長乘這個例子,這是一個對任意大的正整數(shù)都適用的方法。數(shù)字得越大、程序也就越長。但是關(guān)緊要的是,方法是“同樣的,如果會把兩個三位數(shù)相乘,就會把兩個 137 位的數(shù)字相乘,而不必再去學(xué)什么新的理,理由在于長乘法的方法里包含了大量的仔細(xì)構(gòu)造好的小多的任務(wù)的重復(fù)執(zhí)行,例如把個一位數(shù)相乘的九九表。我們會看到,迭代在我們所要討論算法中起了重要作用。歐幾里算法:迭代歐幾里得算法是說算法本質(zhì)的最好也是最常用的子。這個算法可以追溯到公元 3 世紀(jì)。歐幾里得用它來計(jì)算兩個正整數(shù)的最大公約數(shù)(gcd)。當(dāng)我們最開始遇到兩個正整數(shù) a 和 b 的最大公約數(shù)時,它是定義為一個正整,而且同為 a 和 b 的因數(shù)。然而,為了很多目的,定它為具有以下兩個性質(zhì)的唯一整數(shù) d 更好。這兩個性質(zhì)就是:首先,d 是 a 和 b 的一個因數(shù);其次,如果 c 是 a 和 b 的另一個因數(shù),則 d 可以被 c 所整除。歐幾里得的《幾何原本》 VII 的前兩個命題給出了求 d 的方法,其中第一個命題如下:"給定了兩個不相等的數(shù)、從較大的一數(shù)不斷地減去小的一數(shù),如果余下的數(shù)位,不能量度前數(shù),直到余下的數(shù)一單位為止,這時,原來的數(shù)互質(zhì)。" 換句話說,如果輾轉(zhuǎn)相減得到了數(shù) 1,則 gcd 為 1。這時,就說原來的兩個數(shù)互質(zhì)旄山或互為素?cái)?shù))。輾相減法現(xiàn)在我們來一般地描述幾里得算法,它是基于以下兩觀察的:(1)如果 a=b,則 a 和 b 的 gcd 就是 b(或 a)。(2)d 是 a 和 b 的公約數(shù),當(dāng)且僅當(dāng)它也是 a-b 和 b 的公約數(shù)。現(xiàn)在設(shè)要求 a 和 b 的 gcd,而且設(shè) a≥b。如果 a=b,則觀察(1)告訴我們,gcd 就是 b。若不然,觀察(2)告訴我們,如果求 a-b 和 b 的 gcd 也會得到同樣的答案?,F(xiàn)在令 a_1 是 a-b 和 b 中較大的一個,而 b_1 則為其中較小的一個,然后再求兩數(shù)的 gcd。不過,現(xiàn)在兩數(shù)中較大的一,即 a_1,小于原來兩數(shù)中較大的一個,即 a。這樣我們就可以把上面的程序再重復(fù)一:若 a_1=b_1,則 a_1 和 b_1 的 gcd,亦即 a 和 b 的 gcd 是 b_1,若不然,就把 a_1 換成 a_1-b_1,再來組織 a_1-b_1 和 b_1,總之,較大的一個要放在前面,然后再繼續(xù)下,這就叫做 " 輾轉(zhuǎn)相減 "。為了使這個程序能夠進(jìn)行下,還有一個觀察是需要的,這是下面的關(guān)于正整數(shù)的一個基事實(shí),有時稱為良序原理:嚴(yán)下降的正整數(shù)序列 a_0 > a1 > a2 >… 必為有限序列。因?yàn)樯厦娴牡?恰好產(chǎn)生了一個嚴(yán)格下降序列這個迭代最終一定會停止,這意味著在某一點(diǎn)上必有 a_k=b_k,而這個公共值就是 a 和 b 的 gcd。歐幾里得算法的流程圖歐幾里得道家通常對于歐幾里得算法的陳述此稍有不同??梢詰?yīng)用一種較雜的程序,稱為歐幾里得除法也就是帶余除法),它可以大減少算法的步數(shù),這種算法也為輾轉(zhuǎn)相除法。這個程序的基事實(shí)是:若 a 和 b 是兩個正整數(shù),則必存在唯一的整 q 和 r,使得數(shù) q 稱為商,而 r 稱為余數(shù)。上面的兩點(diǎn)說明(1)和(2)現(xiàn)在要代以若 r=0,則 a 和 b 的 gcd 就是 b。a 和 b 的 gcd 與 b 和 r 的 gcd 是相同的。這一次,在第一步要用b,r)代替(a,b)。如果 r≠0,則還要做第二步,并用(r,r_1)來代替(b,r),r1 是用 r 去除 b 所得的余數(shù),所以 r_1r>m>r1>r2≥0)。再用一次良序原理,即知這個序經(jīng)過有限步后一定停止,而后一個非零的余數(shù)就是 a 和 b 的 gcd。不難看到,這兩種方法,就求 gcd 而言是等價的,但就算法而言則很大區(qū)別。例如,設(shè) a=103 438,b=37。如果用輾轉(zhuǎn)相減法,就要從 103 438 中累次減去 37,一直到余下的差數(shù)小于 37 為止。這個差數(shù)與 103438 除以 37 的余數(shù)是一樣的,而如果用第二種方法,狌狌次可以得到它。這樣,使用第二方法的理由就在于用累次減法求除法的余數(shù)是非常低效率的效率上的收益在實(shí)踐上是很重的,第二種方法給出的是多項(xiàng)時間算法,而第一種方法所需則是指數(shù)長的時間。推廣歐幾得算法可以推廣到許多其他背下,只要有加法、減法和乘法概念就行。例如它有一個變體可以用于高斯整數(shù)環(huán)。就是形 a+ bi,而其中 a,b 為整數(shù)的復(fù)數(shù)所成的環(huán),它也可對于用于系數(shù)為實(shí)數(shù)的多項(xiàng)式中(就此而論,系數(shù)在任意域也行)。但有一個要求,就是能夠定義帶余除法的類比物,了這一點(diǎn)以后、算法就與正整情況的算法基本上相同了。例下面的命題:設(shè) A 和 B 是兩個任意多項(xiàng)式,而且 B 不是零多項(xiàng)式、則必存在兩個項(xiàng)式 Q 和 R。使得或者 R=0,或者 R 的次數(shù)小于 B 的次數(shù)。正如歐幾里得在《幾何原銅山》中提到的那樣,可以對于一對數(shù)(a,b)當(dāng) a 和 b 不一定是整數(shù)時實(shí)行這個程序。容易驗(yàn)證光山當(dāng)且當(dāng)比 a / b 是有理數(shù)時,這個程序會停下來。這個觀引導(dǎo)到連分?jǐn)?shù)的概念。在 17 世紀(jì)以前,沒有特別地研究過它,但是其中計(jì)蒙思想根源可以溯到阿基米德。阿基米德計(jì)算 π 的方法:逼近和有限性圓周長和圓的直徑的比值是一個堯,而自從 18 世紀(jì)以來就記作 π?,F(xiàn)在我們來看一看阿基米德怎驕山在公元前 3 世紀(jì)就得到了這個比值的經(jīng)典的近似 22/7。若在圓內(nèi)作一個內(nèi)接的正多邊形(其頂猾褱都在圓上),又作其外切的正多邊形其邊都是圓周的切線),再計(jì)這些多邊形的周長,就會得到 x 的下界與上界,因?yàn)閳A的周長必定大于任意內(nèi)春秋多邊形的長,而小于任意外切多邊形的長。阿基米德從正六邊形開始然后,每次把多邊形的邊數(shù)加,得到了越來越精確的上下界他做到九十六邊形為止,得到π 的逼近這個過程中顯然涉及迭代。名家是稱它為一個算法對對?嚴(yán)格地說,它不是一個算,不論取多少邊的多邊形,所到的僅是 π 的近似值,所以這個過程不是有限的。然而我確實(shí)得到了一個可以近似計(jì)算 π 到任意精確度的算法。例如。如果想得到 π 的一個準(zhǔn)確到小數(shù)十位的近似值,經(jīng)過有多步以后,這個算法會給出一我們想要的近似值。重要的是這個過程是收斂的。就是說,要的在于由迭代得出之值可以意地接近于 π。這個方法的幾何來源可以用來證明這個收斂,而 1609 年德國人作到了 202 邊形(基本上用阿基米德的方法),得到 π 的精確到小數(shù) 35 位的近似值。然而,逼近 π 的算法與阿基米德計(jì)算兩個正整數(shù)的 gcd 的算法有一個明顯的區(qū)別。如歐幾里得那樣的算法戲器常稱離散算法,而與用來計(jì)算非整值的數(shù)值算法相對立。牛頓-拉夫森方法:遞推公式1670 年前后、牛頓提出了一個求方之根的方法,而且就方程 x^3-2x-5=0 解釋了他的方法。他的解釋從下面的雨師個察開始:根 x 近似地等于 2。于是他寫出 x=2+p,并用 2+p 代替原方程的 x,而得到了一個關(guān)于 p 的方程。這個新方程算出來是因 x 接近于 2,所以 p 很小,而他就略去了 p^3 和 6p^2 來估計(jì) p。這就給了他 p 的方程 10p-1=0,即 p=1/10。這當(dāng)然不是一個準(zhǔn)確解,但是給了牛頓關(guān)于根的新的更好的似值:x=2.1。然后牛頓就重復(fù)這個過程,令 x=2.1+q,代入原方程以后又給出了一個關(guān)于 q 的方程,近似地解這個方程,又把他的?鳥似解確化了,于是得到 q 的估計(jì)為-0.0054,所以 x 的下一個近似值是 2.0946。盡管如此,我們怎么能確定這個過讙會收斂于 x 呢?讓我們更仔細(xì)地考察這個方法。線和收斂性牛頓的方法可以從何上用函數(shù) f 的圖像來解釋,雖然牛頓本人并沒有這樣做f(x)=0 的每一個根 x 都對應(yīng)于函數(shù) y=f(x)的曲線和 x 軸的一個交點(diǎn)。如果從根 x 的一個近似值 a 開始,而且和上面做的一樣,設(shè) p=x- a,于是可以用 a+p 代替 x 而得到一個新的函數(shù) g(p),也就是說把原點(diǎn)(0,0)有效地移到了(a,0)處。然后把 p 的所有高次冪都略去,只留下常數(shù)項(xiàng)和線性項(xiàng),這樣就得到函數(shù) g 的最佳的線性逼近 —— 從幾何上說,這就是 g 在點(diǎn)(0,g(0))處的切線。這樣,對于 p 所得到的近似值就是函數(shù) y 在點(diǎn)(0,g(0))處的切線與 x 軸的交點(diǎn)。再在橫坐標(biāo)上加一 a,也就是讓原點(diǎn)回到原來的(0,0)處,這樣 a+p 就給出了 f 的根的新近似值。這就是牛頓的方法稱為切線的原因。牛頓方法從上圖可以到,再作一次切線的逼近,如曲線 y=f(x)與 x 軸的交點(diǎn)在 a 點(diǎn)以及 f 在點(diǎn)(a,f(a))處的切線與 x 軸的交點(diǎn)(即上圖中的橫坐標(biāo)為 a+p 的點(diǎn),即根的近似值)之間,則第二次的近值(即 a+p+q)肯定比第一次的近似值 a+p 好(這里稱 a 為根的零次近似)?;氐脚nD的例子,可和山看到牛選取 a=2 并不是上面所說的情況。但是從下一個近似值 2.1 開始,以下所有的近似值就都是這個情況了。從幾何看,如果點(diǎn)(a,f(a))位于 x 軸的上方,而且 y=f(x)的曲線在凸部與 x 軸相交,或者點(diǎn)(a,f(a))在 x 軸的下方,而且 y=f(x)曲線在凹部與 x 軸相交,就會出現(xiàn)這種有利的況。初始的逼近(即零次近似的選擇顯然是很重要的,而且出了微妙的未曾想到的問題。果我們考慮復(fù)多項(xiàng)式的復(fù)根,就更加清楚了。牛頓的方法很易適應(yīng)這個更廣泛的背景。設(shè) z 是一個復(fù)多項(xiàng)式的復(fù)根,而 z_0 是初始的逼近,于是牛頓方法將給出一銅山序列 z_0,z_1,z_2…… 它可能收斂于 z,也可能不收斂。我們定義根 z 的吸引區(qū)域?yàn)檫@樣的初始逼近 z_0 的集合,使得所得到的序列確實(shí)收于 z,并且記這個區(qū)域?yàn)?A(z)。怎樣來決定 A(z)呢?第一個問這個問題的人是萊,時間是 1879 年。他注意到,對于二次多項(xiàng)式,這問題是很容易的,但當(dāng)次數(shù)為 3 或者更大時,問題就很困難了。例如多項(xiàng)式 z^2-1 的根 ±1 的吸引區(qū)域分別是復(fù)平面上以鉛直軸為界的兩個平面,但是 z^3-1 的三個根 1,w,w^2 的相應(yīng)的吸引區(qū)域就是極復(fù)雜的集合這些集合是由儒利亞在 1918 年描述的,而現(xiàn)在稱為分形集合。遞推公式牛頓方法的每階段都會產(chǎn)生一個新方程。但拉夫森指出實(shí)際上并無必要。就特殊的例子給出在每一步都以使用的單一一個公式。但是的基本的觀察可以一般地適用導(dǎo)出可以用于每一個情況的一公式,而這個公式用切線的解就可以容易得出。事實(shí)上,曲 y=f(x)在 x 坐標(biāo)為 a 處的切線方程是它與 x 軸的交點(diǎn)的橫坐標(biāo)是 a-f(a)/f'(a)。我們現(xiàn)在所說的牛頓-拉夫森方法就是指的這個公式。我們從一孟槐初始近 a_0=a 開始再用這個遞推公式得出這樣就得到一個近的序列,在復(fù)情況下,也就前面說的 z_0,z_1,z_2,…。作為一個例子,考慮函數(shù) f(x)=x^2-c。這時,牛頓方法就給出 c 的平方根根號 c 的一串近似值,遞推公式現(xiàn)在成了在上面的般公式中把 f 換成 x^2-c 即得。這個近似平方根的求法,公帝鴻 1 世紀(jì)的亞歷山大里亞的海倫就已經(jīng)知道。本來自微信公眾號:老胡說科學(xué) (ID:LaohuSci),作者:我才是老?