解讀:1分鐘直觀理解一個數學概念:對稱、期望、熱力學第二定律
《一分鐘直觀理解一個數學概念》(Maths in a)是Plus推出的系列叢書,在短短的篇幅里直觀地解釋了一些常見數學概念的內涵。 環球科學不時發布翻譯。 今天的五篇文章是對稱性、期望、熱力學第二定律、布爾代數和中心極限定理。
譯者王維孝
審稿人張夢媛丁佳琪
對稱()
直觀上,我們都知道什么是對稱,但是通過語言描述什么是對稱比我們想象的要困難。 下面的蝴蝶圖片是對稱的,因為即使圖片沿中軸翻轉,蝴蝶也保持不變。 我們知道正方形是對稱的,因為當它繞其中心旋轉 90 度,或分別沿水平軸、垂直軸或對角軸翻轉時,它保持不變。 如果圖像在某些變換(例如旋轉或映射操作)后保持不變,則該圖像是對稱的。 或者更一般地說,對稱性是為了保持不變性。
像蝴蝶一樣,公式具有對稱性。
上述對稱性的定義還可以擴展到圖片之外的其他事物。 例如,無論是x還是-x都會使數學表達式x^2得到相同的結果,所以x^2在x到-x的變換下是對稱的。
如果要制定一個學校的時間表,而此時有兩個老師可以做同樣的工作,并且他們的可用工作時間相等,那么在兩個老師的輪班時間發生變化的情況下,制定時間表的問題是有對稱性的:如果你有一個時間表,那么交換兩位老師也可以給你另一種解決方案。
在物理學中,我們知道無論在倫敦還是在紐約,運動定律都是完全相同的,這意味著運動定律在空間變換下是對稱的。
因此,公式、問題、甚至自然法則都可以表現出對稱性。 對稱性是物理學中非常重要的概念:物理學家認為自然的基本定律應該具有某種對稱性,并且他們從理論之初就將對稱性納入其中,即使當時他們甚至沒有觀察到對稱性的任何直接證據它的對稱性。 當涉及到現實生活中的問題時,對稱性也有實用的一面,正如上面老師的例子所演示的那樣:如果你理解了問題的對稱性,一種解決方案會立即告訴另一種解決方案。
對稱在我們的日常生活中也扮演著有趣的角色。 有人認為對稱是美麗的先決條件:我們只認為對稱的人美麗,因為不對稱可能預示著疾病或其他缺陷; 魅力:我們都有過性感的斜視或歪嘴笑。 無論您對對稱有何看法,對稱不僅僅是一個抽象的數學概念。
效力于多特蒙德的德國球星馬爾科·雷烏斯(Marco Reus)。 他的嘴巴有點歪,但是粉絲們也不會因為嘴巴歪了就覺得他不帥。
預計()
如果公平地擲骰子,則擲出 1 到 6 六個數字中任何一個的機會均等。但是,擲骰子的預期值為 3.5。 怎么會這樣? 骰子上沒有這個數字!
該圖顯示了隨著擲骰次數的增加,擲骰子結果的平均值(紅線)如何收斂到預期值 3.5(綠線)。
因此,對 n 次拋出的結果進行平均會得到一個近似等于
大數定律指出,對于較大的 n 值,實際平均值會更接近 3.5。 從某種意義上說,數字 3.5 是無數次擲骰子的平均值。
假設擲骰子的過程不公平,六個數字出現的幾率就會不同。 再次假設1出現一次的概率為p1,2出現一次的概率為p2,以此類推。這樣,大量n次拋出的結果的平均值大約為
這是廣義期望的基本思想。如果隨機變量 ( ) 從 X1 到 Xm 有 m 個可能的結果,對應的概率為 p1 到 pm,則結果的期望值為
熱力學第二定律(定律)
與我們在同一辦公室工作的同事有時會對我們凌亂的辦公桌感到失望,并幫我們收拾干凈。 整理后的桌面非常有秩序,用物理學的語言來形容這種狀態就是低熵( )。 熵是描述物理系統無序程度的量。 同事們從個人經驗中了解到,每當我們在辦公室,桌面變得越來越雜亂時,桌面的熵必然會增加。 這本質上可以歸結為一個概率論點——干凈的桌面總是相似的,而凌亂的桌面都以自己的方式凌亂,因此桌子進入凌亂狀態的概率總是大于處于干凈狀態的概率。 除非有人干預并積極組織(這不是我們的強項),否則熵必然會增加。
這絕對不是你后臺辦公桌的桌面,嗯
這確實不是我們的錯 - 你無法違背物理定律,這是最基本的物理定律之一:熱力學第二定律(定律)。 該定律的內容是孤立系統的熵永遠不會減少。 這不僅解釋了為什么桌面永遠不會自行清潔,還解釋了為什么飲料中的冰塊會融化。 所有系統都會演化到最大熵狀態:冰完全融化并與飲料混合的系統顯然比由溫熱液體中的高度結構化冰塊組成的系統更混亂。 系統熵最高的狀態也是平衡狀態。
熱力學第二定律的概念來自統計力學領域。 統計力學是通過統計原理描述大量粒子行為的理論。 顯然,這對于描述氣體或液體的行為非常有用——氣體和液體是由大量粒子組成的。 我們可以嘗試編寫(或在計算機上模擬)描述每個氣體粒子的運動和所有相互作用的牛頓方程,但這將是愚蠢且不可能的:有大約分子需要大量的公式來描述,而不是提到分子間的相互作用。 于是物理學家想出了一種描述系統的方法,不是通過一一描述每個粒子,而是利用統計數據來預測整個系統的集體行為。
例如,如果你在房間里取下裝滿氣體的瓶子的蓋子,我們的直覺告訴我們,氣體不會繼續留在瓶子里,而是會逐漸擴散,直到充滿整個空間。 在房間內氣體分子的所有可能排列中,只有少數幾種是所有氣體都保留在打開的瓶子中,而更多的是氣體分子擴散到整個盒子中。 氣體分子總是會分散,不會回到瓶子里,這不是 100% 肯定會發生的事情,但它是最有可能發生的。
乍一看似乎很奇怪,像熱力學第二定律這樣的基本自然定律應該基于統計概率——畢竟,普通定律描述的是確定性,但“可能性”意味著不確定性。 法國數學家埃米爾·博雷爾(émile Borel)借用了一個有趣的比喻來說明這條定律的不可侵犯性:如果一百萬只猴子連續一年每天打字十個小時,它們打出的單詞組合起來,世界上最豐富的圖書館也找不到完全匹配的單詞。他們輸入的字符順序,甚至不太可能違反統計力學定律。 “當數量很大時,機會是必然性的最好保證。幸運的是,在對大量分子、能量和輻射成分的研究中,我們面對的是極其龐大的群體,因此我們可以從中獲得確定性。這確定性與祈求幸運女神眷顧的‘可能性’不同?!?英國物理學家阿瑟·愛丁頓 ( ) 所寫的這篇文章抓住了偶然性與必然性之間的奇怪聯系。
布爾代數 ( )
只要你使用計算機,就離不開布爾邏輯(logic)。 布爾邏輯以英國數學家喬治·布爾的名字命名,早在計算機發明之前就已建立。 在布爾邏輯體系下,一個陳述可以為真也可以為假(例如,“我想要一杯茶”此時為假真值表寫出邏輯表達式,但“我想要一塊蛋糕”永遠為真),這些陳述可以可以通過“與(AND)”、“或(OR)”、“非(NOT)”來連接。 為了證明這些復合語句是真還是假,需要制作一個真值表(truth table),其中列出了基本語句可以獲得的所有可能值,然后列出了基本語句能夠得到的所有值。復合語句即可得到相應的結果。
一個簡單的真值表,表示“A和B”的所有可能值
真值表對于簡單的邏輯語句很有用,但對于更復雜的語句,它們可能會變得麻煩且更容易出錯。 布爾通過巧妙地認識到二進制邏輯的運算方式與我們普通的算術運算非常相似(除了一些細微的差異)而解決了這個難題。
在這個稱為布爾代數 ( ) 的新算術系統中,變量是邏輯語句(粗略地說,是真或假的句子)。 這些陳述只能采用兩個值,0 表示我們知道錯誤的陳述,1 表示正確的陳述。 所以我們可以將“或”重寫為僅由0和1表示的加法:
0 + 0 = 0(因為“假或假”仍然是假)
1 + 0 = 0 + 1 = 1(因為“真或假”和“假或真”都是真)
1 + 1 = 1(因為“真或真”仍然是真)。
也可以將“and”重寫為一種乘法:
0 × 1 = 1 × 0 = 0 (因為“假與真”和“真與假”都是假)
0 × 0 = 0(因為“假假假”仍然是假)
1 × 1 = 1(因為“真且真”仍然是真)。
因為變量只能取0或1,所以我們可以將“非”運算定義為補運算,即取變量的補:
如果A=1,則不是A=0
如果A=0,則不是A=1
A + 不是 A = 1(因為“真或假”為真)
A × 不是 A = 0(因為“真假”是假的)。
這些新定義的運算在很大程度上類似于眾所周知的加法和乘法概念,但仍存在關鍵差異。 在布爾代數中,可以很容易地消去公式中的某些項,非常方便實用。 例如,在 A + A × B 中,變量 B 的存在對結果沒有影響,無論 B 取什么值或表達式表達什么邏輯語句。 這是因為如果A為真(相當于A=1),那么無論B是否為真,A或(A和B)都為真; 如果 A 為假(即 A=0),則無論 B 的值如何,A 或(A 和 B)均為假。 所以布爾代數給出了一種簡化:表達式A + A × B 等于一個簡單的A,即A + A × B = A。
此外,布爾代數在加法和乘法之間具有逆對偶性:
(A + B)' = A' × B'
(A x B)' = A' + B'。
這正是德摩根定律(De's Laws),以英國數學家奧古斯都·德·摩根( De ,1806-1871)的名字命名。 (可以肯定的是,使用等效真值表時,上式也成立。)
這兩條定律是布爾代數在簡化復雜邏輯語句過程中的兩個技巧。 最后,我還是要感謝發明布爾代數的喬治!
中心極限定理(極限)
統計學的中心思想是通過觀察小樣本,可以獲得整個總體的信息。 沒有這種想法,就沒有民意調查或選舉預測,沒有辦法測試新藥或橋梁的安全等。我們能夠做這種事情,并將不確定性控制在一定范圍內,這在很大程度上要歸功于中央極限定理。
人口的平均體重是多少?
要了解中心極限定理的工作原理,假設您想要獲得全國人口的平均體重。 您需要隨機挑選 100 個人,測量他們的體重,并計算平均值——稱為樣本平均值 ( )。 樣本平均值應提供有關全國平均體重的一些信息。 但如果你的樣本恰好都是大個子,或者都是瘦子怎么辦?
為了了解樣本平均值的代表性,您需要知道 100 人樣本的平均體重與組平均值的差異有多大:如果您抽取許多 100 人的樣本并分別計算平均體重,將這組數字會是什么樣的? 改變? 這組數字的平均值(樣本平均值)與整個人口的真實平均體重相比如何?
例如,假設你發現,如果獲取大量100人的樣本,記錄每個樣本的平均體重,最終的數值分布在10公斤和300公斤之間的概率是相等的,那么可以看出通過單個容量為 100 的樣本來估計總體平均值并不是一個好方法,因為存在太多不確定性。 您將獲得 10 公斤到 300 公斤之間的任何可能值真值表寫出邏輯表達式,但不知道哪一個最接近人群的真實平均體重。
具有不同均值和方差的正態分布。
這樣,在我們對總體的權重分布一無所知的情況下,如何得到100人樣本的平均分布(也叫抽樣分布)呢? 這就是中心極限定理發揮作用的地方:對于足夠大的樣本,樣本分布近似于正態分布,也稱為鐘形分布曲線——至近似值。 (通常認為 30 個樣本量就足夠了。)
正態分布的均值(即樣本均值的均值,也就是鐘形曲線頂部所在的位置)與總體的均值(總體平均權重)相同。 正態分布的方差(即均值變化多少,用鐘的寬度表示)由樣本量決定:樣本越大,方差越小。 兩者之間的確切關系可以由公式給出。
如果樣本量足夠大(100遠大于30,所以一定夠用),樣本正態分布的方差相對較小,這意味著觀察到的均值權重接近于正態分布的均值(因為鐘形又窄又長)。 并且由于此正態分布的均值等于總體的真實平均權重,因此觀察到的均值非常接近真實均值。
所有這些都可以用數學語言精確地描述。 例如,您可以準確指出真實均值在樣本均值的特定值范圍內的置信度百分比,并且您可以使用觀察結果來計算需要多大的樣本量才能獲得給定的估計值準確性。 中心極限定理為統計推斷藝術提供了精確性,這使得正態分布變得無處不在。
轉載請先聯系。