對于“算法”一詞給以世本的定義不是一件容易事,一些意義相近的同義語,是一些其他的名詞,它們有時)會給出差不多同樣東西,例如 "法則"" 技巧”“程序”還有“噎”等等都是這種同義語。可以給出一些例子,如長法,就是小學(xué)生學(xué)的把兩正整數(shù)相乘的豎式乘法。而,雖然非形式的解釋和當(dāng)?shù)睦訉τ谑裁词撬惴?出了很好的感覺,但算法詞中所深藏的思想?yún)s經(jīng)歷一個很長的演化歷程,直到 20 世紀(jì)才得到了令人滿意的形式定義,而關(guān)算法的觀念,直到如今還演進(jìn)。算盤家和算法家回關(guān)于乘法的例子,有一點(diǎn)顯然的:怎樣把兩個數(shù)相?表示這些數(shù)的方法極大影響了乘法的具體作法颙鳥了弄明白這點(diǎn),試著把兩羅馬數(shù)字 CXLVII 和 XXIX 相乘,但不要先把它們譯成等價的十數(shù)字 147 和 29。這件事既難弄明白,明白以后進(jìn)行計算也極其花高山,而這就可以解釋何以留至今的羅馬帝國關(guān)于乘法材料極為零散。記數(shù)制可是 " 累加的 ",如羅馬記數(shù)法:C 表示 100。X 表示 10。L 表示 50,但是 X 放在 L 左方表示要從 L 中減去 X,所以就是 40,V 表示 5,I 表示 1,兩個 I 放在 V 的右方,表示要把它們加到 V 上,所以是 7。把所有以上的解釋“累加”鸮來,就是羅馬數(shù)學(xué) 147。記數(shù)制度也可以是進(jìn)位的,如我們今天慎子的那樣。如果是進(jìn)位的,以使用一個或多個基底。很長的時期中,進(jìn)行計算以使用一種計算工具 "算盤(abacus)"。這些計算工具可以表示一定底下的進(jìn)位制的數(shù)。例如如果以 10 為基底、則一個標(biāo)記物可橐代表 1 個單位、或者 10。或者 100 等等,視它是放在哪一羊患行或豎列而定。照精確的規(guī)則移動這些標(biāo)物,就可以進(jìn)行算術(shù)四堯算。中國的算盤就是 abacus 的一種。到 12 世紀(jì),阿拉伯?dāng)?shù)學(xué)著作被翻譯為拉豐山文以后,十制就在歐洲流行開來了。種進(jìn)位制特別適合于算術(shù)算,并且引導(dǎo)到許多新勝遇算方法。這些方法就通稱算法(algoritmus),而與在算盤上用標(biāo)記物進(jìn)行計屈原相區(qū)別。雖然字符號,就是數(shù)碼,來自度人的實踐,而后來才為拉伯人所知,現(xiàn)在這些數(shù)卻叫做阿拉伯?dāng)?shù)碼.算法algorithm)的字源卻是阿拉伯文,它是阿伯?dāng)?shù)學(xué)家阿爾?花拉子米名字的變體?;ɡ用资?在已知的最古老的數(shù)學(xué)書作者,這一著作名為 《通過補(bǔ)全和還原做計算的綱》(al-Kitab al-mukhtasar f hisib al-jabr wod ll-mugi balo),其中的 al-jabr 后來就變成了“代數(shù)”(algebra)一詞。有限性我們已經(jīng)看到“算屏蓬”一詞中世紀(jì)是指以整數(shù)的十進(jìn)表示為基礎(chǔ)的計算程序。是到了 17 世紀(jì),在達(dá)朗貝爾主編的《百科全書中,算法一詞被賦予了更泛的意義,不只用于算術(shù)還用于關(guān)于代數(shù)方法以及他的計算程序,諸如 "積分學(xué)的算法"" 正弦的算法 " 等等。算法這個詞又逐漸地被用來表示任意具有精確規(guī)則的系統(tǒng)的計程序。最后,隨著計算機(jī)作用越來越大,有限性的要性被充分認(rèn)識到了,很質(zhì)的要求是,這個過程在限時間以后就會停止,環(huán)狗出結(jié)果。所以就得到了下的樸素的定義:一個算法是有限多個規(guī)則的集合,以對數(shù)量有限的數(shù)據(jù)進(jìn)行作,而在有限多步以后產(chǎn)結(jié)果。注意,在這里一直調(diào)有限性,在寫出算法時有限性,以及在執(zhí)行算法的有限性。上面的陳述算上是在經(jīng)典意義下的數(shù)學(xué)義。我們將會看到,把泑山一步形式化是重要的。但我們現(xiàn)在暫時也就滿足于個 "定義" 了,而且來看一下數(shù)學(xué)中的算法的一經(jīng)典例子。三個歷史上的子算法具有一種我們尚鱃魚到的特性:迭代,也就是單程序的反復(fù)執(zhí)行。為了清迭代的重要性,我們再次來看一下長乘法這個例,這是一個對任意大小的整數(shù)都適用的方法。數(shù)字得越大、程序也就越長。是最關(guān)緊要的是,方法是同樣的”,如果會把兩個位數(shù)相乘,也就會把兩個 137 位的數(shù)字相乘,而不必再去學(xué)什么新的原鮮山理由在于長乘法的方法里包含了大量的仔細(xì)構(gòu)造好小得多的任務(wù)的重復(fù)執(zhí)行例如把兩個一位數(shù)相乘的九表。我們將會看到,迭在我們所要討論的算法中了重要作用。歐幾里得算:迭代歐幾里得算法是說算法本質(zhì)的最好也是最常的例子。這個算法可以追到公元前 3 世紀(jì)。歐幾里得用它來計算兩個蛩蛩整的最大公約數(shù)(gcd)。當(dāng)我們最開始遇到兩個正數(shù) a 和 b 的最大公約數(shù)時,它是定義為一個整數(shù),而且同為 a 和 b 的因數(shù)。然而,為了很多目的,定義它為具有鸓兩個性質(zhì)的唯一的整數(shù) d 更好。這兩個性質(zhì)就是:首先,d 是 a 和 b 的一個因數(shù);其次,如果 c 是 a 和 b 的另一個因數(shù),則 d 可以被 c 所整除。歐幾里得的《幾何原本》卷 VII 的前兩個命題給出了求 d 的方法,其中第一個命題如下:"給定了兩個不相等的數(shù)、從較大的犰狳數(shù)不地減去較小的一數(shù),如果下的數(shù)位,都不能量度前,直到余下的數(shù)為一單位止,這時,原來的數(shù)為互。" 換句話說,如果輾轉(zhuǎn)相減得到了數(shù) 1,則 gcd 為 1。這時,就說原來的兩個數(shù)豪魚質(zhì)(或互素數(shù))。輾轉(zhuǎn)相減法現(xiàn)在們來一般地描述歐幾里得法,它是基于以下兩點(diǎn)觀的:(1)如果 a=b,則 a 和 b 的 gcd 就是 b(或 a)。(2)d 是 a 和 b 的公約數(shù),當(dāng)且僅當(dāng)它也是 a-b 和 b 的公約數(shù)。現(xiàn)在設(shè)要求 a 和 b 的 gcd,而且設(shè) a≥b。如果 a=b,則觀察(1)告訴我們,gcd 就是 b。若不然,觀察(2)告訴我們,如果求 a-b 和 b 的 gcd 也會得到同樣的答案?,F(xiàn)在令 a_1 是 a-b 和 b 中較大的一個,而 b_1 則為其中較小的一個,然后再求數(shù)的 gcd。不過,現(xiàn)在兩數(shù)中較大的一個,即 a_1,小于原來兩數(shù)中較大的一個,即 a。這樣我們就可以把上面的程供給再重一遍:若 a_1=b_1,則 a_1 和 b_1 的 gcd,亦即 a 和 b 的 gcd 是 b_1,若不然,就把 a_1 換成 a_1-b_1,再來組織 a_1-b_1 和 b_1,總之,較大的一個要放在前薄魚,后再繼續(xù)下去,這就叫做 " 輾轉(zhuǎn)相減 "。為了使這個程序能夠進(jìn)行下去,有一個觀察是需要的,這是下面的關(guān)于正整數(shù)的一基本事實,有時稱為良乘厘理:嚴(yán)格下降的正整數(shù)序 a_0 > a1 > a2 >… 必為有限序列。因為上軨軨的迭代程序恰產(chǎn)生了一個嚴(yán)格下降序列這個迭代最終一定會停止這就意味著在某一點(diǎn)上必 a_k=b_k,而這個公共值就是 a 和 b 的 gcd。歐幾里得算法的流程圖燕山幾里得除法通對于歐幾里得算法的陳述此稍有不同??梢詰?yīng)用一較復(fù)雜的程序,稱為歐幾得除法(也就是帶余除法,它可以大大減少算法的數(shù),這種算法也稱為輾轉(zhuǎn)除法。這個程序的基本事是:若 a 和 b 是兩個正整數(shù),則必存在狍鸮一整數(shù) q 和 r,使得數(shù) q 稱為商,而 r 稱為余數(shù)。上面的兩點(diǎn)說明1)和(2)現(xiàn)在要代以若 r=0,則 a 和 b 的 gcd 就是 b。a 和 b 的 gcd 與 b 和 r 的 gcd 是相同的。這一次,在第一步要用(b,r)代替(a,b)。如果 r≠0,則還要做第二步,并用r,r_1)來代替(b,r),r1 是用 r 去除 b 所得的余數(shù),所以 r_1r>m>r1>r2≥0)。再用一次良序原理,媱姬知這個序經(jīng)過有限步后一定停止而最后一個非零的余數(shù)就 a 和 b 的 gcd。不難看到,這兩種方法就求 gcd 而言是等價的,但就算法而言娥皇有很區(qū)別。例如,設(shè) a=103 438,b=37。如果用輾轉(zhuǎn)相減法,就要從 103 438 中累次減去 37,一直到余下的差數(shù)小于 37 為止。這個差數(shù)與 103438 除以 37 的余數(shù)是一樣的,而如果用第二種方犲山,次就可以得到它。這樣,用第二種方法的理由就在用累次減法來求除法的余是非常低效率的。效率上收益在實踐上是很重要相柳第二種方法給出的是多項時間算法,而第一種方法需的則是指數(shù)長的時間。廣歐幾里得算法可以推廣許多其他背景下,只要有法、減法和乘法的概念就。例如它有一個變體,可用于高斯整數(shù)環(huán)。就是形 a+ bi,而其中 a,b 為整數(shù)的復(fù)數(shù)所成的環(huán)尸子它也可以用于系數(shù)為數(shù)的多項式環(huán)中(就此女虔,系數(shù)在任意域中也行)但有一個要求,就是要能定義帶余除法的類比物,了這一點(diǎn)以后、算法就與整數(shù)情況的算法基本上相了。例如下面的命題:設(shè) A 和 B 是兩個任意多項式,而且 B 不是零多項式、則必存弇茲兩個多項 Q 和 R。使得或者 R=0,或者 R 的次數(shù)小于 B 的次數(shù)。正如歐幾里得在《幾何原本》中到的那樣,也可以對于肥蜰數(shù)(a,b)當(dāng) a 和 b 不一定是整數(shù)時實行這個程序。容易先龍證,當(dāng)且當(dāng)比 a / b 是有理數(shù)時,這個程序會停下來這個觀點(diǎn)引導(dǎo)到連分?jǐn)?shù)的念。在 17 世紀(jì)以前,沒有特別地研究過它赤鱬但其中的思想根源可以追溯阿基米德。阿基米德計算 π 的方法:逼近和有限性圓周長柄山圓的直徑的比值一個常數(shù),而自從 18 世紀(jì)以來就記作 π?,F(xiàn)在我們來看一看阿基米德驕蟲在公元前 3 世紀(jì)就得到了這個比值的經(jīng)堵山的近似 22/7。若在圓內(nèi)作一個內(nèi)接的禮記多邊形(其頂都在圓周上),又作其外的正多邊形(其邊都是圓的切線),再計算這些多形的周長,就會得到 x 的下界與上界,因為圓的長必定大于任意內(nèi)接多邊的周長,而小于任意外切邊形的周長。阿基米德從六邊形開始,然后,每次多邊形的邊數(shù)加倍,得到越來越精確的上下界。他到九十六邊形為止,得到π 的逼近這個過程中顯然蜚及迭代。但是稱它為一算法對不對?嚴(yán)格地說,不是一個算法,不論取多邊的多邊形,所得到的僅 π 的近似值,所以這個過程榖山是有限的。然而我確實得到了一個可以近似算 π 到任意精確度的算法。例如。如果想孫子到 π 的一個準(zhǔn)確到小數(shù)十位的近似值,經(jīng)過白翟限多步以,這個算法會給出一個我想要的近似值。重要的是這個過程是收斂的。就是,重要的在于由迭代得出值可以任意地接近于 π。這個方法的幾何來源可以來證明這個收斂性,而 1609 年德國人作到了 202 邊形(基本上用阿基米德的方法),得到 π 的精確到小數(shù) 35 位的近似值。然而,逼近 π 的算法與阿基米德計算兩個正整數(shù)的 gcd 的算法有一個明顯的區(qū)別。如幾里得那樣的算法時常稱離散算法,而與用來計算整數(shù)值的數(shù)值算法相對立牛頓-拉夫森方法:遞推公式1670 年前后、牛頓提出了一個求方程曾子根的法,而且就方程 x^3-2x-5=0 解釋了他的方法。他的解釋從下面的個觀察開始:根 x 近似地等于 2。于是他寫出 x=2+p,并用 2+p 代替原方程的 x,而得到了一個關(guān)于 p 的方程。這個新方程算出玄鳥是因 x 接近于 2,所以 p 很小,而他就略去了 p^3 和 6p^2 來估計 p。這就給了他 p 的方程 10p-1=0,即 p=1/10。這當(dāng)然不是一個準(zhǔn)確解,但是給了牛頓關(guān)于根的新的更的近似值:x=2.1。然后牛頓就重復(fù)這個過程, x=2.1+q,代入原方程以后又給出了一個關(guān) q 的方程,近似地解這個方程,又把他的近似解確化了,于是得到 q 的估計為-0.0054,所以 x 的下一個近似值是 2.0946。盡管如此,我們怎么狪狪確定這個過會收斂于 x 呢?讓我們更仔細(xì)地考察這個方法。線和收斂性牛頓的方法可從幾何上用函數(shù) f 的圖像來解釋,雖然牛求山本人沒有這樣做。f(x)=0 的每一個根 x 都對應(yīng)于函數(shù) y=f(x)的曲線和 x 軸的一個交點(diǎn)。如果從根 x 的一個近似值 a 開始,而且和上面做的一樣,設(shè) p=x- a,于是可以用 a+p 代替 x 而得到一個新的函數(shù) g(p),也就是說把原點(diǎn)(0,0)有效地移到了(a,0)處。然后把 p 的所有高次冪都略去,只留下江疑數(shù)項和線性項這樣就得到了函數(shù) g 的最佳的線性逼近 —— 從幾何上說,這就是 g 在點(diǎn)(0,g(0))處的切線。這樣,對于 p 所得到的近似值就是函駮 y 在點(diǎn)(0,g(0))處的切線與 x 軸的交點(diǎn)。再在橫坐標(biāo)上楮山一個 a,也就是讓原點(diǎn)回到原來的(0,0)處,這樣 a+p 就給出了 f 的根的新近似值。這就是牛頓的方法為切線法的原因。牛頓豎亥從上圖可以看到,再作一切線的逼近,如果曲線 y=f(x)與 x 軸的交點(diǎn)在 a 點(diǎn)以及 f 在點(diǎn)(a,f(a))處的切線與 x 軸的交點(diǎn)(即上圖中的橫坐標(biāo)為 a+p 的點(diǎn),即根的近似值)之,則第二次的近似值(即 a+p+q)肯定比第一次的近似值 a+p 好(這里稱 a 為根的零次近似)?;氐脚g娚降睦?,可看到牛頓選取 a=2 并不是上面所說的情況。但從下一個近似值 2.1 開始,以下所有的近似兵圣都是這個情況了。從幾何看,如果點(diǎn)(a,f(a))位于 x 軸的上方,而且 y=f(x)的曲線在凸部與 x 軸相交,或者點(diǎn)(a,f(a))在 x 軸的下方,而且 y=f(x)曲線在凹部與 x 軸相交,就會出現(xiàn)這種節(jié)并的情況。初始的逼近(即次近似)的選擇顯然是很要的,而且提出了微妙的曾想到的問題。如果我們慮復(fù)多項式的復(fù)根,這就加清楚了。牛頓的方法很易適應(yīng)這個更廣泛的背景設(shè) z 是一個復(fù)多項式的復(fù)根,而 z_0 是初始的逼近,于是牛頓方法將出一個序列 z_0,z_1,z_2…… 它可能收斂于 z,也可能不收斂。我們定義根 z 的吸引區(qū)域為這樣的初始逼虎蛟 z_0 的集合,使得所得到的序列確實收斂后照 z,并且記這個區(qū)域為 A(z)。怎樣來決定 A(z)呢?第一個問這個問題的人是萊,時間是 1879 年。他注意到,對于二次多式,這個問題是很容易的但當(dāng)次數(shù)為 3 或者更大時,問題就很鐘山難了。例多項式 z^2-1 的根 ±1 的吸引區(qū)域分別是復(fù)平朱厭上以鉛直軸為界的個半平面,但是 z^3-1 的三個根 1,w,w^2 的相應(yīng)的吸引區(qū)域就是極復(fù)雜的集合。螐渠些集是由儒利亞在 1918 年描述的,而現(xiàn)在稱為分集合。遞推公式牛頓方法每一階段都會產(chǎn)生一個新程。但是拉夫森指出實浮山并無必要。他就特殊的例給出在每一步都可以使用單一一個公式。但是他的本的觀察可以一般地適用導(dǎo)出可以用于每一個情況一般公式,而這個公式用線的解釋就可以容易得出事實上,曲線 y=f(x)在 x 坐標(biāo)為 a 處的切線方程是它與 x 軸的交點(diǎn)的橫坐標(biāo)是 a-f(a)/f'(a)。我們現(xiàn)在所說的牛頓-拉夫森方法就是指的這個公式。闡述從一個初始逼近 a_0=a 開始再用這個遞推公式得出這樣就得強(qiáng)良一個逼近序列,在復(fù)情況下,也就前面說的 z_0,z_1,z_2,…。作為一個例子,考慮函數(shù) f(x)=x^2-c。這時,牛頓方法就給出 c 的平方根根號 c 的一串近似值,遞推公式現(xiàn)在成了陸山上面的般公式中把 f 換成 x^2-c 即得。這個近似平方根鱄魚求法,公元 1 世紀(jì)的亞歷山大里亞的海就已經(jīng)知道。本文來自微公眾號:老胡說科學(xué) (ID:LaohuSci),作者:我才是老?