閱讀(1k) 書簽贊(0) 我要糾錯

C++分治算法

2023-09-20 09:23 更新

「分治 divide and conquer」，全稱分而治之，是一種非常重要且常見的算法策略。分治通常基于遞歸實現(xiàn)，包括“分”和“治”兩個步驟。

分（劃分階段）：遞歸地將原問題分解為兩個或多個子問題，直至到達最小子問題時終止。
治（合并階段）：從已知解的最小子問題開始，從底至頂?shù)貙⒆訂栴}的解進行合并，從而構(gòu)建出原問題的解。

如圖 12-1 所示，“歸并排序”是分治策略的典型應(yīng)用之一。

分：遞歸地將原數(shù)組（原問題）劃分為兩個子數(shù)組（子問題），直到子數(shù)組只剩一個元素（最小子問題）。
治：從底至頂?shù)貙⒂行虻淖訑?shù)組（子問題的解）進行合并，從而得到有序的原數(shù)組（原問題的解）。

歸并排序的分治策略

圖 12-1 歸并排序的分治策略

如何判斷分治問題

一個問題是否適合使用分治解決，通?？梢詤⒖家韵聨讉€判斷依據(jù)。

問題可以被分解：原問題可以被分解成規(guī)模更小、類似的子問題，以及能夠以相同方式遞歸地進行劃分。
子問題是獨立的：子問題之間是沒有重疊的，互相沒有依賴，可以被獨立解決。
子問題的解可以被合并：原問題的解通過合并子問題的解得來。

顯然，歸并排序是滿足以上三條判斷依據(jù)的。

問題可以被分解：遞歸地將數(shù)組（原問題）劃分為兩個子數(shù)組（子問題）。
子問題是獨立的：每個子數(shù)組都可以獨立地進行排序（子問題可以獨立進行求解）。
子問題的解可以被合并：兩個有序子數(shù)組（子問題的解）可以被合并為一個有序數(shù)組（原問題的解）。

通過分治提升效率

分治不僅可以有效地解決算法問題，往往還可以帶來算法效率的提升。在排序算法中，快速排序、歸并排序、堆排序相較于選擇、冒泡、插入排序更快，就是因為它們應(yīng)用了分治策略。

那么，我們不禁發(fā)問：為什么分治可以提升算法效率，其底層邏輯是什么？換句話說，將大問題分解為多個子問題、解決子問題、將子問題的解合并為原問題的解，這幾步的效率為什么比直接解決原問題的效率更高？這個問題可以從操作數(shù)量和并行計算兩方面來討論。

操作數(shù)量優(yōu)化

以“冒泡排序”為例，其處理一個長度為 $n$ 的數(shù)組需要 $O (n^{2})$ 時間。假設(shè)我們按照圖 12-2 所示的方式，將數(shù)組從中點分為兩個子數(shù)組，則劃分需要 $O (n)$ 時間，排序每個子數(shù)組需要 $O ((n / 2)^{2})$ 時間，合并兩個子數(shù)組需要 $O (n)$ 時間，總體時間復(fù)雜度為：

O (n + (\frac{n}{2})^{2} \times 2 + n) = O (\frac{n^{2}}{2} + 2 n)

劃分數(shù)組前后的冒泡排序

圖 12-2 劃分數(shù)組前后的冒泡排序

接下來，我們計算以下不等式，其左邊和右邊分別為劃分前和劃分后的操作總數(shù)：

\begin{aligned} n^{2} & > \frac{n^{2}}{2} + 2 n \\ n^{2} ? \frac{n^{2}}{2} ? 2 n & > 0 \\ n (n ? 4) & > 0 \end{aligned}

這意味著當(dāng) $n > 4$ 時，劃分后的操作數(shù)量更少，排序效率應(yīng)該更高。請注意，劃分后的時間復(fù)雜度仍然是平方階 $O (n^{2})$ ，只是復(fù)雜度中的常數(shù)項變小了。

進一步想，如果我們把子數(shù)組不斷地再從中點劃分為兩個子數(shù)組，直至子數(shù)組只剩一個元素時停止劃分呢？這種思路實際上就是“歸并排序”，時間復(fù)雜度為 $O (n \log ? n)$ 。

再思考，如果我們多設(shè)置幾個劃分點，將原數(shù)組平均劃分為 $k$ 個子數(shù)組呢？這種情況與“桶排序”非常類似，它非常適合排序海量數(shù)據(jù)，理論上時間復(fù)雜度可以達到 $O (n + k)$ 。

2. 并行計算優(yōu)化?

我們知道，分治生成的子問題是相互獨立的，因此通?？梢圆⑿薪鉀Q。也就是說，分治不僅可以降低算法的時間復(fù)雜度，還有利于操作系統(tǒng)的并行優(yōu)化。

并行優(yōu)化在多核或多處理器的環(huán)境中尤其有效，因為系統(tǒng)可以同時處理多個子問題，更加充分地利用計算資源，從而顯著減少總體的運行時間。

比如在圖 12-3 所示的“桶排序”中，我們將海量的數(shù)據(jù)平均分配到各個桶中，則可所有桶的排序任務(wù)分散到各個計算單元，完成后再進行結(jié)果合并。

桶排序的并行計算

圖 12-3 桶排序的并行計算

分治常見應(yīng)用

一方面，分治可以用來解決許多經(jīng)典算法問題。

尋找最近點對：該算法首先將點集分成兩部分，然后分別找出兩部分中的最近點對，最后再找出跨越兩部分的最近點對。
大整數(shù)乘法：例如 Karatsuba 算法，它是將大整數(shù)乘法分解為幾個較小的整數(shù)的乘法和加法。
矩陣乘法：例如 Strassen 算法，它是將大矩陣乘法分解為多個小矩陣的乘法和加法。
漢諾塔問題：漢諾塔問題可以視為典型的分治策略，通過遞歸解決。
求解逆序?qū)?/strong>：在一個序列中，如果前面的數(shù)字大于后面的數(shù)字，那么這兩個數(shù)字構(gòu)成一個逆序?qū)?。求解逆序?qū)栴}可以通過分治的思想，借助歸并排序進行求解。

另一方面，分治在算法和數(shù)據(jù)結(jié)構(gòu)的設(shè)計中應(yīng)用非常廣泛。

二分查找：二分查找是將有序數(shù)組從中點索引分為兩部分，然后根據(jù)目標(biāo)值與中間元素值比較結(jié)果，決定排除哪一半?yún)^(qū)間，然后在剩余區(qū)間執(zhí)行相同的二分操作。

歸并排序：文章開頭已介紹，不再贅述。

快速排序：快速排序是選取一個基準(zhǔn)值，然后把數(shù)組分為兩個子數(shù)組，一個子數(shù)組的元素比基準(zhǔn)值小，另一子數(shù)組的元素比基準(zhǔn)值大，然后再對這兩部分進行相同的劃分操作，直至子數(shù)組只剩下一個元素。

桶排序：桶排序的基本思想是將數(shù)據(jù)分散到多個桶，然后對每個桶內(nèi)的元素進行排序，最后將各個桶的元素依次取出，從而得到一個有序數(shù)組。

樹：例如二叉搜索樹、AVL 樹、紅黑樹、B 樹、B+ 樹等，它們的查找、插入和刪除等操作都可以視為分治的應(yīng)用。

堆：堆是一種特殊的完全二叉樹，其各種操作，如插入、刪除和堆化，實際上都隱含了分治的思想。

哈希表：雖然哈希表來并不直接應(yīng)用分治，但某些哈希沖突解決策略間接應(yīng)用了分治策略，例如，鏈?zhǔn)降刂分械拈L鏈表會被轉(zhuǎn)化為紅黑樹，以提升查詢效率。

可以看出，分治是一種“潤物細無聲”的算法思想，隱含在各種算法與數(shù)據(jù)結(jié)構(gòu)之中。

以上內(nèi)容是否對您有幫助：

在文檔使用的過程中是否遇到以下問題：

內(nèi)容錯誤

更新不及時

鏈接錯誤

缺少代碼/圖片示列

太簡單/步驟待完善

其他

更多建議：

提交建議

← C++排序小結(jié)

C++分治搜索策略 →

寫筆記

我要補充

精選筆記