如果說筆試的時候經常遇到各種動歸回溯的騷操作,那么面試會傾向于一些比較經典的問題,難度不算大,而且也比較實用。
本文就用 Git 引出一個經典的算法問題:最近公共祖先(Lowest Common Ancestor,簡稱 LCA)。
git pull
這個命令我們經常會用,它默認是使用merge
方式將遠端別人的修改拉到本地;如果帶上參數git pull -r
,就會使用rebase
的方式將遠端修改拉到本地。
這二者最直觀的區別就是:merge
方式合并的分支會看到很多「分叉」,而rebase
方式合并的分支就是一條直線。但無論哪種方式,如果存在沖突,Git 都會檢測出來并讓你手動解決沖突。
那么問題來了,Git 是如何合并兩條分支并檢測沖突的呢?
以rebase
命令為例,比如下圖的情況,我站在dev
分支執行git rebase master
,然后dev
就會接到master
分支之上:
這個過程中,Git 是這么做的:
首先,找到這兩條分支的最近公共祖先LCA
,然后從master
節點開始,重演LCA
到dev
的commit
的修改,如果這些修改和LCA
到master
的commit
有沖突,就會提示你手動解決沖突,最后的結果就是把dev
的分支完全接到master
上面。
那么,Git 是如何找到兩條不同分支的最近公共祖先的呢?這就是一個經典的算法問題了,下面我來由淺入深講一講。
尋找一個元素
先不管最近公共祖先問題,我請你實現一個簡單的算法:
給你輸入一棵沒有重復元素的二叉樹根節點root
和一個目標值val
,請你寫一個函數尋找樹中值為val
的節點。
函數簽名如下:
TreeNodefind(TreeNoderoot,intval);
這個函數應該很容易實現對吧,比如我這樣寫代碼:
//定義:在以 root 為根的二叉樹中尋找值為 val 的節點
TreeNodefind(TreeNoderoot,intval){
//basecase
if(root==null){
returnnull;
}
//看看root.val是不是要找的
if(root.val==val){
returnroot;
}
//root不是目標節點,那就去左子樹找
TreeNodeleft=find(root.left,val);
if(left!=null){
returnleft;
}
//左子樹找不著,那就去右子樹找
TreeNoderight=find(root.right,val);
if(right!=null){
returnright;
}
//實在找不到了
returnnull;
}
這段代碼應該不用我多解釋了,但我基于這段代碼做一些簡單的改寫,請你分析一下我的改動會造成什么影響。
PS:如果你沒讀過前文東哥帶你刷二叉樹(綱領篇),強烈建議閱讀一下,理解二叉樹前中后序遍歷的奧義。
首先,我修改一下 return 的位置:
TreeNodefind(TreeNoderoot,intval){
if(root==null){
returnnull;
}
//前序位置
if(root.val==val){
returnroot;
}
//root不是目標節點,去左右子樹尋找
TreeNodeleft=find(root.left,val);
TreeNoderight=find(root.right,val);
//看看哪邊找到了
returnleft!=null?left:right;
}
這段代碼也可以達到目的,但是實際運行的效率會低一些,原因也很簡單,如果你能夠在左子樹找到目標節點,還有沒有必要去右子樹找了?沒有必要。但這段代碼還是會去右子樹找一圈,所以效率相對差一些。
更進一步,我把對root.val
的判斷從前序位置移動到后序位置:
TreeNodefind(TreeNoderoot,intval){
if(root==null){
returnnull;
}
//先去左右子樹尋找
TreeNodeleft=find(root.left,val);
TreeNoderight=find(root.right,val);
//后序位置,看看root是不是目標節點
if(root.val==val){
returnroot;
}
//root不是目標節點,再去看看哪邊的子樹找到了
returnleft!=null?left:right;
}
這段代碼相當于你先去左右子樹找,然后才檢查root
,依然可以到達目的,但是效率會進一步下降。因為這種寫法必然會遍歷二叉樹的每一個節點。
對于之前的解法,你在前序位置就檢查root
,如果輸入的二叉樹根節點的值恰好就是目標值val
,那么函數直接結束了,其他的節點根本不用搜索。
但如果你在后序位置判斷,那么就算根節點就是目標節點,你也要去左右子樹遍歷完所有節點才能判斷出來。
最后,我再改一下題目,現在不讓你找值為val
的節點,而是尋找值為val1
或val2
的節點,函數簽名如下:
TreeNodefind(TreeNoderoot,intval1,intval2);
這和我們第一次實現的find
函數基本上是一樣的,而且你應該知道可以有多種寫法,我選擇這樣寫代碼:
//定義:在以 root 為根的二叉樹中尋找值為 val1 或 val2 的節點
TreeNodefind(TreeNoderoot,intval1,intval2){
//basecase
if(root==null){
returnnull;
}
//前序位置,看看root是不是目標值
if(root.val==val1||root.val==val2){
returnroot;
}
//去左右子樹尋找
TreeNodeleft=find(root.left,val1,val2);
TreeNoderight=find(root.right,val1,val2);
//后序位置,已經知道左右子樹是否存在目標值
returnleft!=null?left:right;
}
為什么要寫這樣一個奇怪的find
函數呢?因為最近公共祖先系列問題的解法都是把這個函數作為框架的。
下面一道一道題目來看。
秒殺五道題目
先來看看力扣第 236 題「二叉樹的最近公共祖先」:
給你輸入一棵不含重復值的二叉樹,以及存在于樹中的兩個節點p
和q
,請你計算p
和q
的最近公共祖先節點。
PS:后文我用
LCA
(Lowest Common Ancestor)作為最近公共祖先節點的縮寫。
比如輸入這樣一棵二叉樹:
如果p
是節點6
,q
是節點7
,那么它倆的LCA
就是節點5
:
當然,p
和q
本身也可能是LCA
,比如這種情況q
本身就是LCA
節點:
兩個節點的最近公共祖先其實就是這兩個節點向根節點的「延長線」的交匯點,那么對于任意一個節點,它怎么才能知道自己是不是p
和q
的最近公共祖先?
如果一個節點能夠在它的左右子樹中分別找到p
和q
,則該節點為LCA
節點。
這就要用到之前實現的find
函數了,只需在后序位置添加一個判斷邏輯,即可改造成尋找最近公共祖先的解法代碼:
TreeNodelowestCommonAncestor(TreeNoderoot,TreeNodep,TreeNodeq){
returnfind(root,p.val,q.val);
}
//在二叉樹中尋找val1和val2的最近公共祖先節點
TreeNodefind(TreeNoderoot,intval1,intval2){
if(root==null){
returnnull;
}
//前序位置
if(root.val==val1||root.val==val2){
//如果遇到目標值,直接返回
returnroot;
}
TreeNodeleft=find(root.left,val1,val2);
TreeNoderight=find(root.right,val1,val2);
//后序位置,已經知道左右子樹是否存在目標值
if(left!=null&&right!=null){
//當前節點是LCA節點
returnroot;
}
returnleft!=null?left:right;
}
在find
函數的后序位置,如果發現left
和right
都非空,就說明當前節點是LCA
節點,即解決了第一種情況:
在find
函數的前序位置,如果找到一個值為val1
或val2
的節點則直接返回,恰好解決了第二種情況:
因為題目說了p
和q
一定存在于二叉樹中(這點很重要),所以即便我們遇到q
就直接返回,根本沒遍歷到p
,也依然可以斷定p
在q
底下,q
就是LCA
節點。
這樣,標準的最近公共祖先問題就解決了,接下來看看這個題目有什么變體。
比如力扣第 1676 題「二叉樹的最近公共祖先 IV」:
依然給你輸入一棵不含重復值的二叉樹,但這次不是給你輸入p
和q
兩個節點了,而是給你輸入一個包含若干節點的列表nodes
(這些節點都存在于二叉樹中),讓你算這些節點的最近公共祖先。
函數簽名如下:
TreeNodelowestCommonAncestor(TreeNoderoot,TreeNode[]nodes);
比如還是這棵二叉樹:
輸入nodes = [7,4,6]
,那么函數應該返回節點5
。
看起來怪嚇人的,實則解法邏輯是一樣的,把剛才的代碼邏輯稍加改造即可解決這道題:
TreeNodelowestCommonAncestor(TreeNoderoot,TreeNode[]nodes){
//將列表轉化成哈希集合,便于判斷元素是否存在
HashSetvalues=newHashSet<>();
for(TreeNodenode:nodes){
values.add(node.val);
}
returnfind(root,values);
}
//在二叉樹中尋找values的最近公共祖先節點
TreeNodefind(TreeNoderoot,HashSetvalues) {
if(root==null){
returnnull;
}
//前序位置
if(values.contains(root.val)){
returnroot;
}
TreeNodeleft=find(root.left,values);
TreeNoderight=find(root.right,values);
//后序位置,已經知道左右子樹是否存在目標值
if(left!=null&&right!=null){
//當前節點是LCA節點
returnroot;
}
returnleft!=null?left:right;
}
有剛才的鋪墊,你類比一下應該不難理解這個解法。
不過需要注意的是,這兩道題的題目都明確告訴我們這些節點必定存在于二叉樹中,如果沒有這個前提條件,就需要修改代碼了。
比如力扣第 1644 題「二叉樹的最近公共祖先 II」:
給你輸入一棵不含重復值的二叉樹的,以及兩個節點p
和q
,如果p
或q
不存在于樹中,則返回空指針,否則的話返回p
和q
的最近公共祖先節點。
在解決標準的最近公共祖先問題時,我們在find
函數的前序位置有這樣一段代碼:
//前序位置
if(root.val==val1||root.val==val2){
//如果遇到目標值,直接返回
returnroot;
}
我也進行了解釋,因為p
和q
都存在于樹中,所以這段代碼恰好可以解決最近公共祖先的第二種情況:
但對于這道題來說,p
和q
不一定存在于樹中,所以你不能遇到一個目標值就直接返回,而應該對二叉樹進行完全搜索(遍歷每一個節點),如果發現p
或q
不存在于樹中,那么是不存在LCA
的。
回想我在文章開頭分析的幾種find
函數的寫法,哪種寫法能夠對二叉樹進行完全搜索來著?
這種:
TreeNodefind(TreeNoderoot,intval){
if(root==null){
returnnull;
}
//先去左右子樹尋找
TreeNodeleft=find(root.left,val);
TreeNoderight=find(root.right,val);
//后序位置,判斷root是不是目標節點
if(root.val==val){
returnroot;
}
//root不是目標節點,再去看看哪邊的子樹找到了
returnleft!=null?left:right;
}
那么解決這道題也是類似的,我們只需要把前序位置的判斷邏輯放到后序位置即可:
//用于記錄p和q是否存在于二叉樹中
booleanfoundP=false,foundQ=false;
TreeNodelowestCommonAncestor(TreeNoderoot,TreeNodep,TreeNodeq){
TreeNoderes=find(root,p.val,q.val);
if(!foundP||!foundQ){
returnnull;
}
//p和q都存在二叉樹中,才有公共祖先
returnres;
}
//在二叉樹中尋找val1和val2的最近公共祖先節點
TreeNodefind(TreeNoderoot,intval1,intval2){
if(root==null){
returnnull;
}
TreeNodeleft=find(root.left,val1,val2);
TreeNoderight=find(root.right,val1,val2);
//后序位置,判斷當前節點是不是LCA節點
if(left!=null&&right!=null){
returnroot;
}
//后序位置,判斷當前節點是不是目標值
if(root.val==val1||root.val==val2){
//找到了,記錄一下
if(root.val==val1)foundP=true;
if(root.val==val2)foundQ=true;
returnroot;
}
returnleft!=null?left:right;
}
這樣改造,對二叉樹進行完全搜索,同時記錄p
和q
是否同時存在樹中,從而滿足題目的要求。
接下來,我們再變一變,如果讓你在二叉搜索樹中尋找p
和q
的最近公共祖先,應該如何做呢?
PS:二叉搜索樹相關的題目詳解見東哥帶你刷二叉搜索樹。
看力扣第 235 題「二叉搜索樹的最近公共祖先」:
給你輸入一棵不含重復值的二叉搜索樹,以及存在于樹中的兩個節點p
和q
,請你計算p
和q
的最近公共祖先節點。
把之前的解法代碼復制過來肯定也可以解決這道題,但沒有用到 BST「左小右大」的性質,顯然效率不是最高的。
在標準的最近公共祖先問題中,我們要在后序位置通過左右子樹的搜索結果來判斷當前節點是不是LCA
:
TreeNodeleft=find(root.left,val1,val2);
TreeNoderight=find(root.right,val1,val2);
//后序位置,判斷當前節點是不是LCA節點
if(left!=null&&right!=null){
returnroot;
}
但對于 BST 來說,根本不需要老老實實去遍歷子樹,由于 BST 左小右大的性質,將當前節點的值與val1
和val2
作對比即可判斷當前節點是不是LCA
:
假設val1 < val2
,那么val1 <= root.val <= val2
則說明當前節點就是LCA
;若root.val
比val1
還小,則需要去值更大的右子樹尋找LCA
;若root.val
比val2
還大,則需要去值更小的左子樹尋找LCA
。
依據這個思路就可以寫出解法代碼:
TreeNodelowestCommonAncestor(TreeNoderoot,TreeNodep,TreeNodeq){
//保證val1較小,val2較大
intval1=Math.min(p.val,q.val);
intval2=Math.max(p.val,q.val);
returnfind(root,val1,val2);
}
//在BST中尋找val1和val2的最近公共祖先節點
TreeNodefind(TreeNoderoot,intval1,intval2){
if(root==null){
returnnull;
}
if(root.val>val2){
//當前節點太大,去左子樹找
returnfind(root.left,val1,val2);
}
if(root.val//當前節點太小,去右子樹找
returnfind(root.right,val1,val2);
}
//val1<=?root.val?<=?val2
//則當前節點就是最近公共祖先
returnroot;
}
再看最后一道最近公共祖先的題目吧,力扣第 1650 題「二叉樹的最近公共祖先 III」,這次輸入的二叉樹節點比較特殊,包含指向父節點的指針:
classNode{
intval;
Nodeleft;
Noderight;
Nodeparent;
};
給你輸入一棵存在于二叉樹中的兩個節點p
和q
,請你返回它們的最近公共祖先,函數簽名如下:
NodelowestCommonAncestor(Nodep,Nodeq);
由于節點中包含父節點的指針,所以二叉樹的根節點就沒必要輸入了。
這道題其實不是公共祖先的問題,而是單鏈表相交的問題,你把parent
指針想象成單鏈表的next
指針,題目就變成了:
給你輸入兩個單鏈表的頭結點p
和q
,這兩個單鏈表必然會相交,請你返回相交點。
我在前文單鏈表的六大解題套路中詳細講解過求鏈表交點的問題,具體思路在本文就不展開了,直接給出本題的解法代碼:
NodelowestCommonAncestor(Nodep,Nodeq){
//施展鏈表雙指針技巧
Nodea=p,b=q;
while(a!=b){
//a走一步,如果走到根節點,轉到q節點
if(a==null)a=q;
elsea=a.parent;
//b走一步,如果走到根節點,轉到p節點
if(b==null)b=p;
elseb=b.parent;
}
returna;
}
至此,5 道最近公共祖先的題目就全部講完了,前 3 道題目從一個基本的find
函數衍生出解法,后 2 道比較特殊,分別利用了 BST 和單鏈表相關的技巧,希望本文對你有啟發。
審核編輯 :李倩
-
算法
+關注
關注
23文章
4613瀏覽量
92947 -
檢測
+關注
關注
5文章
4490瀏覽量
91489 -
Git
+關注
關注
0文章
200瀏覽量
15776
原文標題:一文秒殺 5 道最近公共祖先問題
文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論