排序簡介與氣泡排序法
本文同步發布於 2023 iThome 鐵人賽:那些前端不用會,但是可以會的資料結構與演算法 系列文中。
在第 10 天談到搜尋演算法時,我們提到了資料如果是有排過序的,那麼我們就可以使用更快速的搜尋演算法來加速整個搜尋過程,那麼要怎麼去對資料進行排序呢?這就是我接下來幾天會介紹到的各種排序演算法。
排序簡介
排序在生活中是一件很常見的事情,例如:將一副牌從大到小排序、將一堆書依照作者的姓氏排序、將一堆學生依照成績排序等等,而在程式設計中,排序也是一個很常見的問題,例如:將一個陣列依照數字大小排序。以一名前端工程師來說,碰到排序的問題,第一時間想到的就是 Array.prototype.sort()
這個內建的方法,不過不知道大家有沒有想過這個內建的 sort
是怎麼樣去實作的呢?
面試官:「你能在不使用內建的 sort
方法的情況下,對一個陣列進行排序嗎?」
這是一個很常見的面試題目,其實就是想要知道你對 sorting 有沒有一定的了解。我們在先前已經看過了 heap sort,接著來看看其他還有哪些排序演算法吧!
排序演算法最常見的有下列十大排序法:
- 氣泡排序法(Bubble Sort)
- 選擇排序法(Selection Sort)
- 插入排序法(Insertion Sort)
- 希爾排序法(Shell Sort)
- 合併排序法(Merge Sort)
- 快速排序法(Quick Sort)
- 計數排序法(Counting Sort)
- 桶排序法(Bucket Sort)
- 基數排序法(Radix Sort)
- 堆積排序法(Heap Sort)
可以簡單歸類於下圖的關係:
氣泡排序法 Bubble Sort
氣泡排序(Bubble Sort)是一種簡單、直觀的排序演算法,其取名源於自然界中的水中的氣泡在上升的過程中會不斷變大的現象。
氣泡排序的行為類似一個雙重迴圈,外迴圈控制迭代回合數,內迴圈則控制每回合的比較次數,每回合都會將最大的元素「浮」到陣列的最後面。我們可以看下面這張 wiki 上的動畫圖:
具體步驟為:
- 比較第 1 個數與第 2 個數,若第 1 個數大於第 2 個數則交換位置。
- 比較第 2 個數與第 3 個數,這時第 2 個數應該是第 1 個數和第 2 個數的最大值,它們會重複步驟 1 的行為,將比較大的數放到最後,依此類推直到倒數第 1 個數與倒數第 2 個數比較完畢,最後,末位的數就是陣列中最大的數。這是第一次迭代。
- 開始下一次迭代,陣列有
n
個元素,就遍歷n - 1
次。
接下來用程式碼實作一下 bubble sort,我們需要使用雙重迴圈,每次從 0
開始,然後到 n
結束:
function bubbleSort1(array) {
const n = array.length;
for (let i = 0; i < n; i++) {
for (let j = 0; j < n - i; j++) { // i 增大,內層迴圈比較次數 n - i 減少
if (array[j] > array[j + 1]) { // 注意這裡索引變數都是 j
swap(array, j, j + 1);
}
}
}
}
用來交換陣列中兩個元素的位置的 swap
函式,在之後的程式碼中只要是 swap
都是指它:
function swap(array, i, j) {
const temp = array[i];
array[i] = array[j];
array[j] = temp;
}
接下來我們來看看目前的實作還有沒有能夠改進的地方
最佳化方案 1
如果原陣列就是有序的,例如 [1, 2, 3, 4]
,那麼我們在內層迴圈可以引入一個存取標誌,如果在一次外層迴圈中,滿足比較條件則進行交換,然後更改標誌。如果在一次外層迴圈中,沒有進行過交換,那麼就代表陣列已經有序,可以提前結束迴圈。
function bubbleSort2(array) {
const n = array.length;
for (let i = 0; i < n; i++) {
let hasSorted = true;
for (let j = 0; j < n - i; j++) {
if (array[j] > array[j + 1]) {
// 注意這裡索引變數都是 j
swap(array, j, j + 1);
hasSorted = false;
}
}
if (hasSorted) {
break;
}
}
}
最佳化方案 2
還有沒有近一步改進的地方呢? 我們留意操作步驟的最後一句,其中提到,每次排序結束,最後一個元素都是最大的,即大數下沉的策略。當交換時,可以利用臨時變數 swapPos
紀錄交換位置。在內層迴圈結束後,將最後一個交換元素的位置賦值給 k
,這樣可節省下一輪內層迴圈從 k
到 n - i
的比較:
function bubbleSort3(array) {
const n = array.length;
let k = n - 1;
let swapPos = 0;
for (let i = 0; i < n; i++) {
let hasSorted = true;
for (let j = 0; j < k; j++) {
if (array[j] > array[j + 1]) {
swap(array, j, j + 1);
hasSorted = false;
swapPos = j; // 記錄交換的位置,直接到內層迴圈最後一個被交換的元素
}
}
if (hasSorted) {
break;
}
k = swapPos; // 重寫內層迴圈的邊界
}
}
雞尾酒排序法 Cocktail Sort
如果我們要將剛才的繼續進行最佳化,前人發明了一種雙向的氣泡排序法,稱為雞尾酒排序法,又叫搖晃排序法(Shaker Sort)。它是氣泡排序的一種變形,與氣泡排序不同之處在於排序時是以雙向在序列中進行排序。具體可以透過範例來了解:
function cocktailSort(array) {
let left = 0; // 陣列起始索引
let right = array.length - 1; // 陣列索引最大值
let index = left; // 臨時變數
// 判斷陣列中是否有多個元素
while (right > left) {
let isSorted = false;
// 每一次進到 while 迴圈,都會找出對應範圍內的最大值和最小值並分別放到對應的位置
// 大的排到後面
for (let i = left; i < right; i++) {
if (array[i] > array[i + 1]) {
swap(array, i, i + 1);
index = i; // 紀錄目前索引
isSorted = true;
}
}
right = index; // 重寫右邊界(最後一個交換的位置)
// 小的排到前面
for (let i = right; i > left; i--) { // 從最後一個交換的位置從右往左掃
if (array[i] < array[i - 1]) {
swap(array, i, i - 1);
index = i;
isSorted = true;
}
}
left = index; // 重寫左邊界(最後一個交換的位置)
if (!isSorted) {
break;
}
}
}
這個排序方式在完全亂序的情況下,效率比氣泡排序高,同時兩端排序的思路也是其他排序沿襲的重要思路。
現在來確認一下是否都已經通過測試:
最後來看四種 bubble sort 的效率比較(可以實際去執行測試看控制台輸出結果),用來測試執行效率的測試程式碼可以在系列文專案裡的 sortTestUtils.js
中找到,具體實作如下:
function testRuntime(sortedFn) {
const array = [];
// 向陣列寫入 10000 個資料,其中前 1000 個資料倒序,後 9000 個資料順序
for (let i = 0; i < 10000; i++) {
if (i < 1000) {
array[i] = 1000 - i;
} else {
array[i] = i;
}
}
console.log('========');
let start = new Date() - 0;
sortedFn(array);
console.log('部分有序的情況', sortedFn.name, new Date() - start);
shuffle(array);
start = new Date() - 0;
sortedFn(array);
console.log('完全亂序的情況', sortedFn.name, new Date() - start);
}
我們把測試執行效率的測試給打開,可以在 vitest ui
的 Console 中看到測試結果:
複雜度 Complexity
氣泡排序的複雜度是
Name | Average | Best | Worst | Space | Method | Stable |
---|---|---|---|---|---|---|
Bubble sort | In-place | Yes |
Stable:如果排序後兩個相等的元素相對位置不變,則該排序演算法是穩定的。