聰明的人類發現把簡單的開關組合起來可以表達復雜的bool邏輯,在此基礎之上構建了 CPU ,因此 CPU 只能簡單的理解開關,用數字表達就是0和1。
創世紀:聰明的笨蛋
CPU 相當原始,就像單細胞生物一樣,只能把數據從一個地方搬到另一個地方、簡單的加一下,沒有任何高難度動作,這些操作雖然看上去很簡單很笨,但 CPU 有一個無與倫比的優勢,那就是一個字:快,這是人類比不了了的,CPU 出現后人類開始擁有第二個大腦。就是這樣原始的一個物種開始支配起另一個叫做程序員的物種。
干活的是大爺一般來說兩個不同的物種要想交流,比如人和鳥,就會有兩種方式:要不就是鳥說人話,讓人聽懂;要不就是人說鳥語,讓鳥聽懂;就看誰厲害了。最開始 CPU 勝出,程序員開始說鳥語并認真感受 CPU 的支配地位,好讓 CPU 大爺可以工作,感受一下最開始的程序員是怎么說鳥語的:程序員按照 CPU 的旨意直接用0和1編寫指令,你沒有看錯,這破玩意就是代碼了,就是這么原生態,然后放到打孔紙帶上輸入給CPU,CPU 開始工作,這時的程序可真的是看得見摸得著,就是有點浪費紙。這時程序員必須站在 CPU 的角度來寫代碼,畫風是這樣的:
1101101010011010100100110010100111001000110111101011101101010010乍一看你知道這是什么意思嗎?你不知道,心想:“這是什么破玩意?”,但 CPU 知道,心想“這就簡直就是世界上最美的語言”。
天降大任終于有一天程序員受夠了說鳥語,好歹也是靈長類,嘰嘰喳喳說鳥語太沒面子,你被委以重任:讓程序員說人話。你沒有苦其心志勞其筋骨,而是仔細研究了一下 CPU,發現 CPU 執行的指令集來來回回就那么幾個指令,比如加法指令、跳轉指令等等,因此你把機器指令和對應的具體操作做了一個簡單的映射,把機器指令映射到人類能看懂的單詞,這樣上面的01串就變成了:
sub $8, %rspmov $.LC0, %edicall putsmov $0, %eax這樣,程序員不必生硬的記住1011.。..。,而是記住人類可以認識的ADD SUB MUL DIV等這樣的單詞即可。匯編語言就這樣誕生了,編程語言中首次出現了人類可以認識的東西。這時程序員終于不用再“嘰嘰喳喳。。”,而是升級為“阿巴阿巴。。”,雖然人類認知“阿巴阿巴”這幾個字,但這和人類的語言在形式上差別還是有點大。
細節 VS 抽象盡管匯編語言已經有人類可以認識的單詞,但匯編語言和機器語言一樣都屬于低級語言。所謂低級語言是說你需要關心所有細節。關心什么細節呢?我們說過,CPU 是非常原始的東西,只知道把數據從一個地方搬到另一個地方,簡單的操作一下再從一個地方搬到另一地方。因此,如果你想用低級語言來編程的話,你需要使用多個“把數據從一個地方搬到另一個地方,簡單的操作一下再從一個地方搬到另一地方”這樣的簡單指令來實現諸如排序這樣復雜的問題。有的同學可能對此感觸不深,這就好比,本來你想表達“去給我端杯水過來”:如果你用匯編這種低級語言就得這樣實現:我想你已經 Get 到了。
彌補差異CPU 實在太簡單了,簡單到不能了理解任何稍微抽象一點諸如“給我端杯水”這樣的東西,但人類天生習慣抽象化的表達,人類和機器的差距有辦法來彌補嗎?換句話說就是有沒有一種辦法可以自動把人類抽象的表達轉為 CPU 可以理解的具體實現,這顯然可以極大增強程序員的生產力,現在,這個問題需要你來解決。
套路,都是套路思來想去你都不知道該怎么把人類的抽象自動轉為 CPU 能理解的具體實現,就在要放棄的時候你又看了一眼 CPU 可以理解的一堆細節:電光火石之間靈光乍現,你發現了滿滿的套路,或者說模式。大部分情況下 CPU 執行的指令平鋪直敘的,就像這樣:
這些都是告訴 CPU 完成某個特定動作,你給這些平鋪直敘的指令起了個名字,姑且就叫陳述句吧,statement。除此之外,你還發現了這樣的套路,那就是需要根據某種特定狀態決定走哪段指令,這個套路在人看來就是“如果。。。就。。。否則。。就。。。”:
if *** blablablaelse *** blablabla
在某些情況下還需要不斷重復一些指令,這個套路看起來就是原地打轉:
while *** blablabla最后就是這里有很多看起來差不多的指令,就像這里:
這些指令是重復的,只是個別細節有所差異,把這些差異提取出來,剩下的指令打包到一起,用一個代號來指定這些指令就好了,這要有個名字,就叫函數吧:
func abc: blablabla
現在你發現了所有套路:
// 條件轉移if *** blablablaelse *** blablabla // 循環while ***blablabla // 函數func abc: blablabla
這些相比匯編語言已經有了質的飛躍,因為這已經和人類的語言非常接近了。接下來你發現自己面臨兩個問題:
這里的blablabla該是什么呢?
該怎樣把上面的人類可以認識的字符串轉換為 CPU 可以認識的機器指令
盜夢空間你想起來了,上文說過大部分代碼都是平鋪直敘的陳述句,statement,這里的blablabla 僅僅就是一堆陳述句嗎?顯然不是,blablabla 可以是陳述句,當然也可以是條件轉移if else,也可以是循環while,也可以是調用函數,這樣才合理。
雖然這樣合理,很快你就發現了另一個嚴重的問題:blabalbla中可以包含 if else 等語句,而if else等語句中又可以包含blablabla,blablabla中反過來又雙可能會包含if else等語句,if else等語句又雙叒有可能會包含blablabla,blablabla又雙叒叕可能會包含if else等語句。。。
就像盜夢空間一樣,一層夢中還有一層夢,夢中之夢,夢中之夢中之夢。。。一層嵌套一層,子子孫孫無窮匱也。。。此時你已經明顯感覺腦細胞不夠用了,這也太復雜了吧,絕望開始吞噬你,上帝以及老天爺啊,誰來救救我!此時你的高中老師過來拍了拍你的肩膀,遞給了你一本高中數學課本,你惱羞成怒,給我這破玩意干什么,我現在想的問題這么高深,豈是一本破高中數學能解決的了的,抓過來一把扔在了地上。此時一陣妖風吹過,教材停留在了這樣一頁,上面有這樣一個數列表達:
f(x) = f(x-1) + f(x-2)
這個遞歸公式在表達什么呢?f(x)的值依賴f(x-1),f(x-1)的值又依賴f(x-2),f(x-2)的值又依賴。。。一層嵌套一層,夢中之夢,if中嵌套 statement,statement 又可以嵌套if。。。等一下,這不就是遞歸嘛,上面看似無窮無盡的嵌套也可以用遞歸表達啊!你的數學老師仰天大笑,too young too simple,留下羞愧的你佛手而去,看似高科技的東西竟然用高中數學就解決了,一時震驚的目瞪狗帶不知所措無地自容。有了遞歸這個概念加持,聰明的智商又開始占領高地了。
遞歸:代碼的本質不就是嵌套嘛,一層套一層嘛,遞歸天生就是來表達這玩意的 (提示:這里的表達并不完備,真實的編程語言不會這么簡單):
if : if bool statement else statementfor: while bool statementstatement: if | for | statement
上面一層嵌套一層的盜夢空間原來可以這么簡潔的幾句表達出來啊,你給這幾句表達起了高端的名字,語法。數學,就是可以讓一切都變得這么優雅。世界上所有的代碼,不管有多么復雜最終都可以歸結到語法上,原因也很簡單,所有的代碼都是按照語法的形式寫出來的嘛。至此,你發明了真正的人類可以認識的編程語言。之前提到的第一個問題解決了,但僅僅有語言還是不夠的。
讓計算機理解遞歸現在還差一個問題,怎樣才能把這語言最終轉化為 CPU 可以認識的機器指令呢?人類可以按照語法寫出代碼,這些代碼其實就是一串字符,怎么讓計算機也能認識用遞歸語法表達的一串字符呢?
這是一項事關人類命運的事情,你不禁感到責任重大,但這最后一步又看似困難重重,你不禁仰天長嘆,計算機可太難了。此時你的初中老師過來拍了拍你的肩膀,遞給了你一本初中植物學課本,你惱羞成怒,給我這破玩意干什么,我現在想的問題這么高深,豈是一本破初中教科書能解決的了的,抓過來一把扔在了地上。
此時又一陣妖風掛過,書被翻到了介紹樹的一章,你望著這一頁不禁發起呆來:樹干下面是樹枝,樹枝下是樹葉,樹枝下也可以是樹枝,樹枝下還可以是樹枝、吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮,哎?這句不對,回到上面這句,樹干生樹枝,樹枝還可以生樹枝,一層套一層、夢中之夢、子子孫孫無窮匱、高中數學老師,等一下,這也是遞歸啊!!!我們可以把根據遞歸語法寫出來的的代碼用樹來表示啊!
你的初中老師仰天大笑,圖樣圖森破,看似高科技的東西竟然靠初中知識就解決了。
優秀的翻譯官計算機處理編程語言時可以按照遞歸定義把代碼用樹的形式組織起來,由于這棵樹是按照語法生成的,姑且就叫語法樹吧。
現在代碼被表示成了樹的形式,你仔細觀察后發現,其實葉子節點的表達是非常簡單的,可以很簡單的翻譯成對應的機器指令,只要葉子節點翻譯成了機器指令,你就可以把此結果應用到葉子節點的父節點,父節點又可以把翻譯結果引用到父節點的父節點,一層層向上傳遞,最終整顆樹都可以翻譯成具體的機器指令。
完成這個工作的程序也要有個名字,根據“弄不懂原則”,你給這個類似翻譯的程序起了個不怎么響亮的名字,編譯器,compiler。
現在你還覺得二叉樹之類的數據結構沒啥用嗎?至此,你完成了一項了不起的發明創造,程序員可以用人類認識的東西來寫代碼,你編寫的一個叫做編譯器的程序負責將其翻譯成 CPU 可以認識的機器指令。后人根據你的思想構建出了C/C++、以及后續的Java、Python,這些語言現在還有一幫人在用呢。
總結世界上所有的編程語言都是遵照特定語法來編寫的,編譯器根據該語言的語法將代碼解析成語法樹,遍歷語法樹生成機器指令(C/C++)或者字節碼等(Java),然后交給 CPU(或者虛擬機)來執行。也因此,高級語言的抽象表達能力很強,代價都是犧牲了對底層的控制能力,這就是為什么操作系統的一部分需要使用匯編語言編寫,匯編語言對底層細節的強大控制力是高級語言替代不了的。
最后請注意,本文為通俗易懂講解編程語言犧牲了嚴謹性,這里的語法沒有體現函數、表達式等等,真實語言的語法遠遠比這里的復雜,此外關于編譯器也不會直接把語法樹翻譯成機器語言,而是生成一種類似機器指令的中間語言,經過一系列復雜的優化后最終生成真正的機器指令,真實的編譯器遠比這里復雜。希望本文對大家理解編程語言有所幫助。
責任編輯:haq
責任編輯:haq
-
cpu
+關注
關注
68文章
10902瀏覽量
213014 -
編程
+關注
關注
88文章
3637瀏覽量
93983
原文標題:假如你來發明編程語言
文章出處:【微信號:A1411464185,微信公眾號:multisim】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論