70年代初,貝爾實驗室創建了C語言,它是開發UNIX的副產品。很快C就成為了最受歡迎的編程語言之一。但是對于Bjarne Stroustrup來說,C的表達能力還不夠。于是,他在1983年的博士論文中擴展了C語言。
于是,支持類的C語言誕生了。
當時,Bjarne Stroustrup明白編程語言有許多組成部分,除了語言本身,還有編譯器、鏈接器和各種庫。提供熟悉的工具有助于語言被廣泛接受。在這種歷史背景下,在C語言的基礎上開發C++也是有道理的。
40年后,C和C++都在行業中得到了廣泛使用。但是,互聯網上的C開發人員認為C++是有史以來最糟糕的人類發明,而許多C++開發人員則希望有朝一日C語言灰飛煙滅。
01
究竟發生了什么事?
從表面上看,C和C++都可以滿足相同的用例:高性能、確定性、原生但可移植的代碼,可用于最廣泛的硬件和應用程序。
但是,更讓C自豪的是它是一門低級語言,更接近匯編。
而C++,從誕生第一天開始就充斥了各種奇怪的東西。例如析構函數這個黑魔法。自作主張的編譯器。盡管很早C++就有了類型推斷功能,但是80年代中期的開發人員還無法接受這個概念,因此Bjarne Stroustrup不得不刪除了auto,直到C++ 11又重新添加回來。
從那以后,C++就不斷加入各種工具來實現抽象。很難說C++是一種低級語言還是高級語言。從設計目的上來說,C++兩者都是。但是在不犧牲性能的情況下,建立高級抽象是很困難的。于是C++引入了各種工具來實現constexpr、move語義、模板和不斷增長的標準庫。
從根本上講,我認為C信任開發人員,而C++信任編譯器。這是一個巨大的差異,單憑“兩者的原生類型相同”、“while循環的語法相同”等簡單一致是無法掩蓋的。
C++開發人員將有這些問題歸咎于C,而C開發人員則認為C++過于瘋狂。我覺得站在C的角度看C++,這種說法也很正確。作為C的超集,C++確實很瘋狂。一個經驗豐富的C開發人員面對C++可能沒有熟悉的感覺。C++不是C,這就足以引發互聯網上的激烈爭論。
然而,雖然我不喜歡C,但也沒有權利取笑C。盡管我有一定的C++經驗,但用C編寫過的代碼少之又少,而且肯定是很糟糕的代碼。好的編程語言包括良好的實踐、模式、慣用寫法,這些都需要多年的學習。如果你嘗試用編寫C++的方式寫C的代碼,或者用C的方式編寫C++的代碼,那感覺一定很糟糕。即便你懂C,也不一定會C++,反之亦然,懂C++也不一定會用C編程。
那么,我們是否應該停止說C/C++,為這兩個不幸的命名而感到悲哀嗎?也不至于。
盡管C++的設計理念與C不一樣,但是C++仍然是C的超集。也就是說,你可以在C++轉換單元中包含C的頭文件,這樣依然可以通過編譯。而這正是造成混亂的地方。
C++不是C的擴展,它是由不同的委員會、不同的人獨立設計的標準。從邏輯上講,喜歡C++理念的人會參與C++社區以及C++標準化的過程,而其他人可能會嘗試參與C。無論是C的委員會還是C++委員會,他們表達意圖和方向的方式只能通過各自的最終產品:標準;而標準是眾多投票的成果。
然而,編譯器很難知道它正在處理的是C頭文件還是C++頭文件。
extern “C” 標記并沒有得到廣泛一致的使用,而且它只能影響修飾,而不會影響語法或語義。頭文件僅對預處理器有影響,對于C++編譯器而言,所有內容都是C++轉換單元,因此也就是C++。然而,人們依然會在C++中包含C頭文件,并期望它“正常工作”,而大多數時候也確實可以正常工作。
那么,我們不禁想問:
02
由不同地方的、不同的人開發的C++代碼如何保持C的兼容性?
恐怕很難。
最近,一位同事讓我想起了康威定律:
"設計系統的架構受制于產生這些設計的組織的溝通結構。"
根據這個邏輯,如果兩個委員不互相合作,則他們創造的語言也不會互通。
C++維護了一個與C及其標準庫的不兼容列表。然而該列表似乎并未反映出許多C11和C18中添加、但在C++中不合法的功能。更清晰的介紹請參見這個維基本科頁面(https://en.wikipedia.org/wiki/Compatibility_of_C_and_C%2B
%2B)。然而,僅僅列出兩種語言之間的不兼容性,并不足以衡量二者的不兼容性。
那些存在于C++標準庫中但主要聲明來自C的函數,很難聲明成constexpr,更難聲明成noexcept。C的兼容性會導致性能成本,而C函數是優化的障礙。
許多C的結構在C++中都是有效的,但無法通過代碼審查(如NULL、longjmp、malloc、構造/析構函數、free、C風格的類型強制轉換等)。
在C看來,這些慣用寫法可能問題不大,但在C++中可不行。C++具有更強大的類型系統,不幸的是,C的慣用寫法在這個類型系統中鑿了一個洞,因此實現C的兼容性需要在安全性方面付出代價。
別誤會,C++仍然關心C的兼容性,某種程度上。然而,有趣的是C也很關心C++,某種程度上。實話實說,C對C++的關心程度可能高于C++對C的關心。看來,每個委員會還是在乎另一個委員會的工作。但我們很不情愿。
C++知道,許多基礎庫都是用C編寫的,不僅包括libc,而且還有zip、png、curl、openssl(!)以及許多其他庫,無數的C++項目都在使用這些庫。C++不能破壞這些兼容性。
但是最近,尤其是在過去的十年中,C++的規模已遠遠超過C。C++擁有更多的用戶,并且社區更加活躍。也許這就是為什么如今C++委員會的規模是C委員會的10倍以上。
C++是不可忽視的力量,因此C委員會必須考慮不破壞C++兼容性。如果非要說一個標準追隨另一個標準對話,那么如今C++是領頭者,而C是追隨者。
現在,C++處于穩定的三年周期中,無論是風雨還是烈日,抑或是致命的新疫情。而C每十年左右才發布一次主版本。不過這也很合理,因為作為一種較低級的語言,C不需要發展得那么快。
C語言的環境也與C++完全不同。C多用于平臺,更多地用于編譯器。每個人(甚至他們的狗狗)都會編寫C編譯器,因為該語言的特性集很小,所以任何人都可以編寫C編譯器。而C++委員會真正考慮的實現只有四種,而且在每次會議上這四種實現都會出現。所以,C語言中的許多功能都是與實現有關的,或者是可選支持的,這樣各種編譯器不需要做太多努力就可以聲稱自己遵從了標準,據說這樣委員會的人會比較高興。
如今,C++更加側重于可移植性,而不是實現的自由。這又是一個理念的不同。
03
因此,你的提議破壞了C的兼容性
我提議的P2178的一部分理論上會影響與C的兼容性。這樣的話所有方案都不會令人滿意。
有人可能會說,你可以先向C委員會提議你的新特性。這意味著需要召開更多會議。C會議的嚴格出席規則可能導致你無法參加會議,這就將那些不愿意花上數千美元成為ISO會員的個人拒之門外。這是因為C委員會必須遵守ISO的規則。
而且,如果新的標準剛剛發布,那么可能還需要等待十年時間,你的提案才會被考慮。最重要的是,如果C委員不理解或不在乎你正在努力解決的問題,那么你的提案就石沉大海了。或者他們可能沒有精力來處理這個問題。而且,可能你也沒有精力來處理C。畢竟,你的本意是要改進C++。實際上,哪怕會議上無人反對你的提議(盡管不太可能發生),如果有人讓你先去跟C委員會的人討論,就等于給你的提議判了死刑。
另一種可能的情況是,C委員會接受與C++中存在的版本略有不同的版本。true只能做一個宏來實現。char16_t需要通過typedef。char32_t不一定是UTF-32。static_assert對應的是 _Static_assert。
這類的情況還有很多,我們應該責備C嗎?可能不應該。他們的委員會只是在盡力將C語言做好。反之亦然。在C++20中,指定的初始化器就受到了C的啟發,但采取了略微不同的規則,因為如果完全一樣的話就不符合C++的初始化規則。
對于這個問題,我也有責任。C有VLA。如果當時我在,我一定會反對在標準C++中采用它,因為它導致了太多安全性問題。我也會堅決反對將_Generic添加到C++中的提議。也許_Generic的目的是減少由于缺乏模板或缺乏重載而導致的問題,但是C++有這兩個功能,從我的角度來看,_Generic并不適合我想象中的C++。
這兩個委員會似乎對于對方語言的關心程度也不一樣。有時我們會遇到兼容性非常好的情況(std::complex),有時完全不在乎兼容性(靜態數組參數)。
這沒有辦法。別忘了每個委員會都是一群人,他們在不同的時間、不同的地點投票,而試圖控制結果會導致投票毫無意義。將這些人放在同一個房間也不現實。ISO可能會反對,參與者的不平衡會導致C的人處于極大的劣勢。
04
C的兼容性不重要
如果你是C開發人員,那么肯定會把C視為一種簡潔的編程語言。但對于我們其他人而言,C的印象完全不同。
C是通用的、跨語言的膠水,可以將一切緊密地結合在一起。
對于C++用戶而言,C就是他們的API。從這一點來看,C的價值在于其簡單性。請記住,C++關心的那一部分C是出現在接口(頭文件)中的C。我們關心的是聲明,而不是定義。C++需要調用C庫中的函數(Python、Fortran、Rust、D、Java等語言也一樣,在所有情況下都可以在接口邊界使用C)。
因此,C是一種接口定義語言。向C添加的內容越多,定義接口就越困難。這些接口隨著時間的推移保持穩定的可能性較小。
那么,C++中缺少是否重要?可能并不重要,因為這不太可能出現在公共接口中。
05
如今大家都在談論C
過去,C的兼容性是C++的一大賣點。但如今,每個人(甚至他們的金魚)都懂C。Rust可以調用C函數,Python、Java、一切語言都可以!甚至怪異的Javascript都可以在WebAssemby中調用C函數。
但是在這些語言中,接口是顯式的。該語言提供的工具可以公開特定的C聲明。當然,這比較麻煩。但這可以讓接口非常非常清晰。而且還是有界的。例如,在rust中,調用C函數并不會迫使Rust犧牲某些設計來容納C子集。實際上C是被包含進去的。
?
?
mod confinment { use std::{c_char}; extern "C" { pub fn puts(txt: *const c_char); } } pub fn main() { unsafe { confinment::puts( std::new("Hello, world!").expect("failed!").as_ptr() ); } }
?
?
06
編譯器資源管理器
除非C的ABI發生變化,否則這段代碼可以一直正常運行。而且Rust/C的邊界非常清晰、不言自明。
因此,C++可能是為C兼容性付出最多的語言。
更糟糕的是,打開任何C的頭文件,你很快就會發現一堆#ifdef __cplusplus。沒錯,C++的兼容性往往需要大量C開發人員的工作。兼容性一直是海市蜃樓。很多人都知道我的這條推文:
07
我們該何去何從?
我認為兩個委員會都在嘗試更多地溝通。他們計劃明年在波特蘭召開會議(盡管這個計劃可能會變)。溝通是一件好事。
但是雞同鴨講的溝通效果會非常有限。兩種語言的設計支柱可能都不協調。我會努力建議提供一個模板。但是首先我得吐槽C語言沒有模塊、沒有命名空間,以及整個宏是什么玩意兒。
也許可以將C++能接受的C子集約束在C99上?也許兩種語言都需要找到一個共同的子集并獨立地發展?也許extern C需要影響解析。如果C++經歷了多個時代,那么C可能是其中之一。
也許我們需要接受將C作為C++的子集,但唯一的方法是將WG14融入到WG21中。
現狀可能不會改變。C++可能永遠也無法從自己的起源中解脫,而C可能永遠都要與那些頂著C語言之名的骯臟特性戰斗。
編輯:黃飛
?
評論
查看更多