掃二維碼與項(xiàng)目經(jīng)理溝通
我們在微信上24小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
繼上篇文章介紹完了HashMap,這篇文章開始介紹Map系列另一個(gè)比較重要的類TreeMap。 大家也許能感覺到,網(wǎng)絡(luò)上介紹HashMap的文章比較多,但是介紹TreeMap反而不那么多,這里面是有原因:一方面HashMap的使用場景比較多;二是相對于HashMap來說,TreeMap所用到的數(shù)據(jù)結(jié)構(gòu)更為復(fù)雜。 廢話不多說,進(jìn)入正題。

因?yàn)榕驼嬲\,有更多的客戶和我們聚集在一起,為了共同目標(biāo),成都創(chuàng)新互聯(lián)公司在工作上密切配合,從創(chuàng)業(yè)型企業(yè)到如今不斷成長,要感謝客戶對我們的高要求,讓我們敢于面對挑戰(zhàn),才有今天的進(jìn)步與發(fā)展。從網(wǎng)站到微信小程序定制開發(fā),軟件開發(fā),成都App定制開發(fā),十多年企業(yè)網(wǎng)站建設(shè)服務(wù)經(jīng)驗(yàn),為企業(yè)提供網(wǎng)站設(shè)計(jì),網(wǎng)站改版維護(hù)一條龍服務(wù).為企業(yè)提供網(wǎng)絡(luò)營銷推廣,定制網(wǎng)站制作,原創(chuàng)設(shè)計(jì),十多年品質(zhì),值得您的信賴.
簽名(signature)
public class TreeMap
extends AbstractMap
implements NavigableMap
可以看到,相比HashMap來說,TreeMap多繼承了一個(gè)接口NavigableMap,也就是這個(gè)接口,決定了TreeMap與HashMap的不同:
HashMap的key是無序的,TreeMap的key是有序的
接口NavigableMap
首先看下NavigableMap的簽名
public interface NavigableMap
發(fā)現(xiàn)NavigableMap繼承了SortedMap,再看SortedMap的簽名
SortedMap
public interface SortedMap
SortedMap就像其名字那樣,說明這個(gè)Map是有序的。這個(gè)順序一般是指由Comparable接口提供的keys的自然序(natural ordering),或者也可以在創(chuàng)建SortedMap實(shí)例時(shí),指定一個(gè)Comparator來 決定。 當(dāng)我們在用集合視角(collection views,與HashMap一樣,也是由entrySet、keySet與values方法提供)來迭代(iterate)一個(gè)SortedMap實(shí)例 時(shí)會體現(xiàn)出key的順序。 這里引申下關(guān)于Comparable與Comparator的區(qū)別(參考這里):
Comparable一般表示類的自然序,比如定義一個(gè)Student類,學(xué)號為默認(rèn)排序
Comparator一般表示類在某種場合下的特殊分類,需要定制化排序。比如現(xiàn)在想按照Student類的age來排序
插入SortedMap中的key的類類都必須繼承Comparable類(或指定一個(gè)comparator),這樣才能確定如何比較(通過k1.compareTo(k2)或comparator.compare(k1, k2))兩個(gè)key,否則,在插入時(shí),會報(bào)ClassCastException的異常。 此為,SortedMap中key的順序性應(yīng)該與equals方法保持一致。也就是說k1.compareTo(k2)或comparator.compare(k1, k2)為true時(shí),k1.equals(k2)也 應(yīng)該為true。 介紹完了SortedMap,再來回到我們的NavigableMap上面來。 NavigableMap是JDK1.6新增的,在SortedMap的基礎(chǔ)上,增加了一些“導(dǎo)航方法”(navigation methods)來返回與搜索目標(biāo)最近的元素。例如下面這些方法:
lowerEntry,返回所有比給定Map.Entry小的元素
floorEntry,返回所有比給定Map.Entry小或相等的元素
ceilingEntry,返回所有比給定Map.Entry大或相等的元素
higherEntry,返回所有比給定Map.Entry大的元素
設(shè)計(jì)理念(design concept)
紅黑樹(Red–black tree)
TreeMap是用紅黑樹作為基礎(chǔ)實(shí)現(xiàn)的,紅黑樹是一種二叉搜索樹,讓我們在一起回憶下二叉搜索樹的一些性質(zhì)
二叉搜索樹
先看看二叉搜索樹(binary search tree,BST)長什么樣呢?
二叉搜索樹
相信大家對這個(gè)圖都不陌生,關(guān)鍵點(diǎn)是:
左子樹的值小于根節(jié)點(diǎn),右子樹的值大于根節(jié)點(diǎn)。
二叉搜索樹的優(yōu)勢在于每進(jìn)行一次判斷就是能將問題的規(guī)模減少一半,所以如果二叉搜索樹是平衡的話,查找元素的時(shí)間復(fù)雜度為log(n),也就是樹的高度。 我這里想到一個(gè)比較嚴(yán)肅的問題,如果說二叉搜索樹將問題規(guī)模減少了一半,那么三叉搜索樹不就將問題規(guī)模減少了三分之二,這不是更好嘛,以此類推,我們還可以有四叉搜索樹,五叉搜索樹……對于更一般的情況:
n個(gè)元素,K叉樹搜索樹的K為多少時(shí)效率是***的?K=2時(shí)嗎?
K 叉搜索樹
如果大家按照我上面分析,很可能也陷入一個(gè)誤區(qū),就是
三叉搜索樹在將問題規(guī)模減少三分之二時(shí),所需比較操作的次數(shù)是兩次(二叉搜索樹再將問題規(guī)模減少一半時(shí),只需要一次比較操作)
我們不能把這兩次給忽略了,對于更一般的情況:
n個(gè)元素,K叉樹搜索樹需要的平均比較次數(shù)為
k*log(n/k)。
對于極端情況k=n時(shí),K叉樹就轉(zhuǎn)化為了線性表了,復(fù)雜度也就是O(n)了,如果用數(shù)學(xué)角度來解這個(gè)問題,相當(dāng)于:
n為固定值時(shí),k取何值時(shí),
k*log(n/k)的取值最?。?/p>
k*log(n/k)根據(jù)對數(shù)的運(yùn)算規(guī)則可以轉(zhuǎn)化為ln(n)*k/ln(k),ln(n)為常數(shù),所以相當(dāng)于取k/ln(k)的極小值。這個(gè)問題對于大一剛學(xué)高數(shù)的人來說再簡單不過了,我們這里直接看結(jié)果
當(dāng)k=e時(shí),
k/ln(k)取最小值。
自然數(shù)e的取值大約為2.718左右,可以看到二叉樹基本上就是這樣***解了。在Nodejs的REPL中進(jìn)行下面的操作
- function foo(k) {return k/Math.log(k);}
- > foo(2)
- 2.8853900817779268
- > foo(3)
- 2.730717679880512
- > foo(4)
- 2.8853900817779268
- > foo(5)
- 3.1066746727980594
貌似k=3時(shí)比k=2時(shí)得到的結(jié)果還要小,那也就是說三叉搜索樹應(yīng)該比二叉搜索樹更好些呀,但是為什么二叉樹更流行呢?后來在***的stackoverflow上找到了答案,主旨如下:
現(xiàn)在的CPU可以針對二重邏輯(binary logic)的代碼做優(yōu)化,三重邏輯會被分解為多個(gè)二重邏輯。
這樣也就大概能理解為什么二叉樹這么流行了,就是因?yàn)檫M(jìn)行一次比較操作,我們最多可以將問題規(guī)模減少一半。 好了這里扯的有點(diǎn)遠(yuǎn)了,我們再回到紅黑樹上來。
紅黑樹性質(zhì)
先看看紅黑樹的樣子:
紅黑樹示例
上圖是從wiki截來的,需要說明的一點(diǎn)是:
葉子節(jié)點(diǎn)為上圖中的NIL節(jié)點(diǎn),國內(nèi)一些教材中沒有這個(gè)NIL節(jié)點(diǎn),我們在畫圖時(shí)有時(shí)也會省略這些NIL節(jié)點(diǎn),但是我們需要明確,當(dāng)我們說葉子節(jié)點(diǎn)時(shí),指的就是這些NIL節(jié)點(diǎn)。
紅黑樹通過下面5條規(guī)則,保證了樹是平衡的:
樹的節(jié)點(diǎn)只有紅與黑兩種顏色
根節(jié)點(diǎn)為黑色的
葉子節(jié)點(diǎn)為黑色的
紅色節(jié)點(diǎn)的字節(jié)點(diǎn)必定是黑色的
從任意一節(jié)點(diǎn)出發(fā),到其后繼的葉子節(jié)點(diǎn)的路徑中,黑色節(jié)點(diǎn)的數(shù)目相同
滿足了上面5個(gè)條件后,就能夠保證:根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的最長路徑不會大于根節(jié)點(diǎn)到葉子最短路徑的2倍。 其實(shí)這個(gè)很好理解,主要是用了性質(zhì)4與5,這里簡單說下:
假設(shè)根節(jié)點(diǎn)到葉子節(jié)點(diǎn)最短的路徑中,黑色節(jié)點(diǎn)數(shù)目為B,那么根據(jù)性質(zhì)5,根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的最長路徑中,黑色節(jié)點(diǎn)數(shù)目也是B,最長的情況就是每兩個(gè)黑色節(jié)點(diǎn)中間有個(gè)紅色節(jié)點(diǎn)(也就是紅黑相間的情況),所以紅色節(jié)點(diǎn)最多為B-1個(gè)。這樣就能證明上面的結(jié)論了。
紅黑樹操作
紅黑樹旋轉(zhuǎn)示例(沒有畫出NIL節(jié)點(diǎn))
關(guān)于紅黑樹的插入、刪除、左旋、右旋這些操作,我覺得***可以做到可視化,文字表達(dá)比較繁瑣,我這里就不在獻(xiàn)丑了,網(wǎng)上能找到的也比較多,像v_July_v的《教你透徹了解紅黑樹》。我這里推薦個(gè)swf教學(xué)視頻(視頻為英文,大家不要害怕,重點(diǎn)是看圖??),7分鐘左右,大家可以參考。 這里還有個(gè)交互式紅黑樹的可視化網(wǎng)頁,大家可以上去自己操作操作,插入幾個(gè)節(jié)點(diǎn),刪除幾個(gè)節(jié)點(diǎn)玩玩,看看左旋右旋是怎么玩的。
源碼剖析
由于紅黑樹的操作我這里不說了,所以這里基本上也就沒什么源碼可以講了,因?yàn)檫@里面重要的算法都是From CLR,這里的CLR是指Cormen, Leiserson, Rivest,他們是算法導(dǎo)論的作者,也就是說TreeMap里面算法都是參照算法導(dǎo)論的偽代碼。 因?yàn)榧t黑樹是平衡的二叉搜索樹,所以其put(包含update操作)、get、remove的時(shí)間復(fù)雜度都為log(n)。
總結(jié)
到目前為止,TreeMap與HashMap的的實(shí)現(xiàn)算是都介紹完了,可以看到它們實(shí)現(xiàn)的不同,決定了它們應(yīng)用場景的不同:
O(log(n)),為了保證紅黑樹平衡,在必要時(shí)會進(jìn)行旋轉(zhuǎn)O(1),為了做到動態(tài)擴(kuò)容,在必要時(shí)會進(jìn)行resize。另外,我這里沒有解釋具體代碼,難免有些標(biāo)題黨了,請大家見諒,后面理解的更深刻了再來填坑。

我們在微信上24小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流