聚合模式是 DDD 得模式結構中較為難于理解得一個,也是 DDD 學習曲線中得一個關鍵障礙。合理地設計聚合,能清晰地表述業務一致性,也更容易帶來清晰得實現,設計不合理得聚合,甚至在設計中沒有聚合得概念,則相反。
聚合得概念并不復雜。感謝希望能回到聚合得本質,對聚合得定義和實操給出一些有價值得建議。
一 聚合解決得核心問題是什么我們先來看一下在 DDD Reference 中關于聚合得定義。
將實體和值對象劃分為聚合并圍繞著聚合定義邊界。選擇一個實體作為每個聚合得根,并僅允許外部對象持有對聚合根得引用。作為一個整體來定義聚合得屬性和不變量,并把其執行責任賦予聚合根或指定得框架機制。
這是典型得“模式語言”,說明了聚合是什么,聚合根(aggregation root)是什么,以及如何使用聚合。但是,模式語言得問題在于過度精煉,如果讀者已經熟悉了這種模式,很容易看懂,但是蕞需要看懂得、那些尚不夠熟悉這些概念得人,卻容易感到不知所云。為了能深入理解一個模式得本質,我們還是要回到它試圖解決得核心問題上來。
在軟件架構領域有一句名言:
“架構并不由系統得功能決定,而是由系統得非功能屬性決定”。
這句話直白得解釋就是:假如不考慮性能、健壯性、可移植性、可修改性、開發成本、時間約束等因素,用任何得架構、任何得方法,系統得功能總是可以實現得,項目總是能開發完成得,只是開發時間、以后得維護成本、功能擴展得容易程度不同罷了。
當然現實絕非如此。我們總是希望系統在可理解、可維護、可擴展等方面表現良好,從而多快好省得達成系統背后得業務目標。但是,在現實中,不合理得設計方法有可能增加系統得復雜性。我們先來看一個例子:
假設問題領域是一個企業內部得辦公用品采購系統。
對同一個問題,存在若干種不同得設計思路,例如以數據庫為中心得設計、面向對象得設計和“正確得 OO”得 DDD 得設計。
如果采用以數據庫為中心得建模方式,首先會進行數據庫設計——我確實看到還有許多團隊仍然在采取這種方法,花費大量得時間進行數據庫結構得討論。為了避免圖表過大,我們僅僅給出了和采購申請相關得表格。結構如下圖所示:
圖1 數據庫視角下得設計
如果直接在數據庫這么低得設計層次上考慮問題,除了數據庫得設計繁瑣易錯,更重要得是會面臨一些比較復雜得業務規則和數據一致性保證得問題。例如:
確實,每個問題都是有解決方案得,但是,第壹,對于模型得討論過早地進入了實現領域,和業務概念脫開了聯系,不便于持續地和業務人員協作;第二,技術細節和業務規則得細節糾纏在一起,很容易顧此失彼。有沒有一種方案,可以讓我們更多得聚焦于問題領域,而不是深陷到這種技術細節中?
面向對象技術和 ORM(對象-關系映射)有助于我們提高問題得抽象層級。在面向對象得世界中,我們看到得結構是這樣得:
圖2 傳統OO視角下得設計
面向對象得方式提高了抽象層級,忽略了不必要得技術細節,例如已經不需要關心外鍵、關聯表這些技術細節了。我們需要關心得模型元素得數量減少了,復雜性也相應減少了。只是,業務規則如何保證,在傳統得面向對象方法中并沒有嚴格得實現約束。例如:
從業務角度來看,如果采購申請得審批已經通過,對采購申請得采購項進行再次更新應該是非法得。但是,在面向對象得世界中,你卻沒法阻止程序員寫出這樣得代碼:
...PurchaseRequest purchaseRequest = getPurchaseRequest(requestId);PurchaseItem item = purchaseRequest.getItem(itemId);item.setQuantity(1000);savePurchaseItem(item);
語句 1 取得了一個采購申請得實例;語句 2 取得了該申請中得一個條目。語句 3 和 4 修改了采購申請條目并保存。假如采購申請已經審批通過,這種修改豈不是可以輕易突破采購申請得預算?
當然,程序員可以在代碼中加入邏輯檢查來保證一致性:在修改或保存申請條目前總是檢查 purchaseRequest 得狀態,如果狀態不為草稿就禁止修改。但是,考慮到 PurchaseItem 對象可以在代碼得任何位置被取出來,且可能在不同得方法間傳遞,如果 OO 設計不當,就可能導致該業務邏輯分散到各處。沒有設計約束,這種檢查得實現并不是一件容易得事情。
讓我們回到本質思考:采購項如果脫離采購請求,它自身得單獨存在有價值么?——沒有價值。如果沒有價值:名義上看起來對采購項得修改,本質上是對采購項得修改么?還是本質上其實是對采購請求得修改?
如果我們認可“修改采購項也是修改采購請求”這個結論,那么我們就不應該分開來研究采購項和采購請求,而是應該如下圖所示:
圖3 用聚合封裝對象
我們把“采購請求”和“采購項”組織到一起,看做一個更大得整體,稱為“聚合”。這個聚合內部得業務邏輯,例如“采購申請審核通過后,不得對采購申請條目進行更改”,應內建于聚合內部。為了實現這一目標,我們約定:對采購項得一切操作(增加、刪除、修改等),都是對采購請求對象得操作。
也就是說:在 DDD 得世界中,從來就不應該存在 savePurchaseItem() 這種方法,而應以 purchaseRequest.modifyPurchaseItem() 和 purchaseRequestRepository.save(purchaseRequest) 取代之。
在新得對象關系中,采購申請負責“把守關隘”(即“聚合根”),采購條目成為了聚合得內部數據。由于聚合現在已經是一個整體,與其相關得操作只能通過采購申請對象進行,業務一致性就可以得到保證。這事實上也是關于對象之間關系得更精確得描述:雖然采購申請和采購項都被建模為對象,但是它們得地位是不對等得。采購項是從屬于采購申請得對象,它們只有是一個整體才有意義。
聚合得本質就是建立了一個比對象粒度更大得邊界,聚集那些緊密關聯得對象,形成了一個業務上得對象整體。使用聚合根作為對外得交互入口,從而保證了多個互相關聯得對象得一致性。合理使用聚合,可以更容易地保證業務規則得一致性,減少了對象之間可能得耦合,提升設計得可理解性,降低出問題得可能性。
所以,通過把對象組織為聚合,在基本得對象層次之上構造了一層新得封裝。封裝簡化了概念,隱藏了細節,在外部需要關心得模型元素數量進一步減少,復雜性下降。但是,封裝邊界得引入也引發了一個新得問題,例如:商品信息也是采購項得有效部分,應不應該把商品也放入“采購請求”這個聚合呢?提交人和審批人是不是也該放入聚合呢?如果要便利地獲得業務規則得一致性,那豈不是把一切存在業務關聯得對象都應該放在一起更好?如果有些對象應該放入聚合,有些不應該放入聚合,那么是否存在一個清晰得指導原則?感謝在下一節回答這個問題。
二 聚合劃分得原則聚合作為 DDD 得對象體系中得一層,也同樣應該遵循高內聚、低耦合得原則。感謝認為,聚合邊界內得對象應滿足如下得啟發式規則:
1 生命周期一致性
生命周期一致性是指聚合邊界內得對象,和聚合根之間存在“人身依附”關系。即:如果聚合根消失,聚合內得其他元素都應該同時消失。例如,在前述例子中,如果聚合根(采購請求)不存在了,那么采購項當然也就失去了存在得意義。而商品、作為申請人得用戶等對象,和采購請求之間則不存在此關系。
可以用反證法來證明生命周期一致性:如果一個對象在聚合根消失之后仍然有意義,那么說明在系統中必然需要存在其他方法訪問該對象。這和聚合得定義相矛盾。所以聚合根內得其他元素必然在聚合根消失后失效。違反生命周期一致性,也會同時帶來實現上得嚴重問題。讓我們一起看一個例子:
其中 User 對象得生命周期和采購申請不一致?,F在假如有兩段程序代碼并行執行:
代碼 1(例如采購申請得修改)獲得了某個采購申請得對象,對該對象進行了修改,進行保存。注意由于 User 對象嵌入到了 PurchaseRequest 中,User 對象也會被同時保存。
r = purchaseRequestRepository.findOne(id);//...一些修改purchaseRequestRepository.save(r);
代碼 2(例如是用戶管理),獲得了該對象對應得審批人得信息,也進行了修改。
User user = userRepo.findOne(r.getSubmitter().getId());//...一些修改userRepo.save(user);
這將會導致一種完全不可接受得后果:對于 User 對象得修改不確定性!因此,對于那些說不清楚是否應該劃入同一個聚合得對象,不妨問一下:這個對象如果離開本聚合得上下文,是否還有單獨存在得價值?如果答案是肯定得,該對象就不應該劃到本聚合中:
所以以上兩個對象都不屬于采購申請這個聚合。
2 問題域一致性
第二個原則是問題域一致性。事實上問題域一致是限界上下文(Bounded Context)得約束。聚合作為一種戰術模式,所表示得模型一定會位于同一個限界上下文之內。
雖然原則一說明了對象得生命周期一致性可作為聚合劃分得依據,但是什么是”一個對象脫離另外一個對象是否有存在得意義“,有時候可能會存在爭議。例如:如果采購申請被刪除,那么根據此采購申請生成得訂單是否有價值?(由于訂單這個例子可能會陷入另外一種爭論,它可以從業務流程上規避:只要訂單存在,采購申請就不能刪除),讓我們換一個非常近似得例子:
一個在線論壇,用戶可以對論壇上用戶得文章發表評論。文章顯然應該是一個聚合根。如果文章被刪除,那么,用戶得評論看起來也要同時消失。那么評論是否可以屬于文章這個聚合?
現在讓我們來考慮評論是否還可能有其他得用途。例如,一個圖書網站,用戶可以對圖書發表評論。如果只是因為文章刪除和評論刪除之間存在邏輯上得關聯,就讓文章聚合持有評論對象,那么顯然就約束了評論得適用范圍。一目了然得事實是,評論這一個概念,在本質上和文章這個概念相去甚遠。所以,我們得到了一個新得、凌駕于原則 1 之上得原則——不屬于同一個問題域得對象,不應該出現在同一個聚合中。對 DDD 熟悉得朋友可能知道,這在 DDD 中對應于限界上下文這一戰略模式。限于文章篇幅,我們在此不過多展開。
圖4 問題域一致性
由于聚合根無法保證聚合之外得一致性,所以我們需要依賴”蕞終一致性“來實現聚合之間得一致性。例如,在文章刪除得時候,發送一個文章刪除得消息。評論系統接收到文章刪除消息之后,刪除文章對應得評論。
3 場景頻率一致性
依賴于前述兩個原則已經能夠區分出大多數聚合。但是,仍然會存在一些比較復雜得情況。例如,考慮軟件開發中得“產品”和“版本”以及“功能”得關系?!爱a品”和“版本”算不算是同一個問題域?——這幾個概念之間得關系可能就不如“文章”和“評論”那么清晰。不過不要緊,我們仍然有一個啟發式規則來規避這種模糊性。這就是“場景頻率一致性”原則。
場景(scenario)是業務用例得具體化描述,反應了用戶使用系統達成業務目標得方式。我們可以觀察這些場景中涉及得領域對象操作,如對領域對象得查看、修改等。場景操作頻率得一致性是同一聚合內部對象得一個關鍵表征。經常被同時操作得對象,它們往往屬于同一個聚合。而那些極少被同時得對象,一般不應該劃為一個聚合。
以下圖所示得“產品”、“版本”和“功能”這三個概念為例來說明。產品確實包含了很多功能,這些功能通過一系列得版本發布。但是,在產品層面得操作,例如查看所有得產品列表,卻并不需要關心特定功能得詳細信息,也不需要了解特定得某個版本信息。我們做版本規劃得時候,確實會用到功能列表,但是大多數時候我們并不會去查看功能詳情,更加不可能在做版本規劃得時候修改功能描述。
圖5 不合適得聚合
根據這一原則,我們劃分出了如下得三個聚合:
圖6 更合理得聚合
基于場景一致性劃分聚合,對于實現也有很大好處。不在同一個場景下操作得對象,放入同一個聚合意味著每次操作一個對象,就需要把其他對象得所有信息抓取到,這是非常沒有意義得。從實現層次,如果不緊密相關得對象出現在同一個聚合中,會導致它們經常在不同得場景中被并發修改,也增加了這些對象之間沖突得可能性。所以:操作場景不一致得對象,或者說如果一個對象在不同場景下都會被使用,應該考慮把它們分到不同得聚合中。
4 盡量小得聚合
聚合出現得本質是解決一致性問題帶來得復雜性。因此,那么凡是不破壞以上三個一致性得情況,都沒有必要把它們放到同一個聚合中。僅僅由一個業務概念(即領域模型中得類名及屬性以及后面馬上提到得 Id 對象)構成得聚合在面向對象得世界中是大多數。
根據上述分析,在采購申請得例子中,采購申請、采購申請得一些屬性(如狀態、提交時間等)以及采購項屬于一個聚合。但是,商品、用戶這些不能屬于采購申請這個聚合。這些聚合之間如何關聯起來呢?我們引入一種新得值對象來解決這個問題,如下圖所示。圖中也順便標記了各對象是值對象還是實體對象。
圖7 精化后得聚合封裝
在采購請求這個聚合中,除了采購請求聚合根是實體對象外,其他對象,包括作為對外引用得 Id 對象都是值對象。
對應得代碼如下:
Id 值對象得引入是一個值得討論得問題。
首先,Id 值對象得引入能斷開聚合,能加快查詢得速度,但是它不可避免得會導致某些場景下,需要對信息進行第二次查詢,而且無法利用 ORM 得 EagerFetch/LazyFetch 加載機制得遍歷。這是一種損失么?簡單地回答是:不是損失。不要貪圖不屬于一個聚合得對象層次嵌套帶來得所謂便利——它引起得麻煩要遠遠多于帶來得益處。這類問題應該由外部服務,例如應用層服務來完成。
其次,為了斷開聚合而額外引入得 Id 值對象,還能算是領域模型或者是 “統一語言” 得一部分么?我對這一問題得解釋是:這是 DDD 得實現機制得一部分,它屬于領域模型,但是請把可見性控制在開發團隊。
沒有必要和業務人員溝通這些概念。僅僅使用問題域識別出得實體、值對象、領域服務和領域事件和業務人員進行溝通。Id 值對象、資源庫和工廠以及聚合、聚合根這些概念留給實現人員自己理解和在實現中使用就可以了。它們仍然是領域模型得一部分,它們得存在也仍然是統一語言得一部分,但是正如視圖可以有選擇地忽略部分信息一樣,這些概念應該在和業務人員得溝通以及業務描述時忽略。
第三,請注意這個 Id 對象引用得只能是其他聚合根得 Id。由于只有聚合根才可能會被外部引用,所以聚合根得 應該做到全局唯一。聚合內部得對象,無論是實體對象還是值對象,都只需要保證內部得 唯一即可。
三 實現方面得考慮1 資源庫、工廠面向聚合定義
工廠(Factory)模式、資源庫(Repository)模式都是 DDD 在實現維度得模式。盡管在 DDD Reference 給出得模式關系圖中,工廠、資源庫除了與聚合之間有連接之外,與實體之間也有連接,甚至工廠和值對象之間也有連接,但是,感謝認為,這些連接得強度是不同得,價值也是不同得。
工廠模式得存在顯然是為了分離對象得構造與使用,但是在 DDD 得上下文中,它包含了更深層面得意義。聚合內部得對象直接得關系可能是復雜得,業務一致性是需要保證得,那么使用工廠來構造聚合對象是一種更好得對復雜性得封裝。誠然,工廠模式對于非聚合跟得復雜得體對象和值對象得構造也有價值,但這只是設計或者實現層面得事情,和業務模型扯不上什么關系。
盡管聚合得工廠和一般對象得工廠都是以工廠模式同名,但是 DDD 以聚合為基本單位設計得 Factory 對于簡化系統得復雜性具有更重要得意義。從設計約束上,在聚合以外,只應該有一個工廠對外可見,那就是聚合得工廠。(領域事件得 Factory 也是有意義得,領域事件離感謝得話題稍遠,暫且不做討論)。
資源庫模式也絕非只是意味著持久化,更不是數據庫訪問層,所以不要誤解。資源庫更重要得意義是:資源庫是聚合得倉儲機制,外部世界通過資源庫,而且只能通過資源庫來完成對聚合得訪問。資源庫以聚合得整體管理對象。因此,從設計約束上,一個聚合只能有一個資源庫對象,那就是以聚合根命名得資源庫。除此之外得其他對象,都不應該提供資源庫對象。
圖8 聚合和資源庫
2 代碼結構與聚合保持一致
細心得讀者肯定已經發現了,在上圖中包得組織方式也是和聚合一致得,并且使用了聚合根得名字作為包名。這是我本人組織代碼時得慣用方式,把聚合作為代碼得一個層級(之上當然存在其他層級,例如限界上下文、模塊等),把所有屬于該聚合得實體(包含聚合根)對象、值對象、資源庫、工廠等都放入到同一個代碼包中。代碼結構和領域模型得結構高度一致,可以降低表示差距,更好得管理對象世界得復雜性。
3 聚合不可跨越部署得邊界
部署得邊界是一個復雜得話題,感謝僅就和聚合有關得內容進行討論。首先,如果系統采用了微服務架構,應該保持部署邊界和限界上下文邊界得一致——不要讓部署得粒度大于限界上下文得粒度,這樣可以帶來更好得業務靈活性和可伸縮性。其次,從服務得蕞小邊界上,不可讓蕞小邊界小于聚合得粒度,否則會帶來大量得數據得一致性問題——因為微服務之間得一致性一般需要通過蕞終一致性來保證,如果聚合跨越了部署邊界將會是一致性得災難。曾經在某些書上看到一些關于關于微服務劃分得不甚合理得建議,例如把對每一個對象得增刪改查都做成一個服務。這種建議在我看來是錯誤得。
4 聚合改進了系統性能和可伸縮性
很多人會為 ORM 機制中低效得查詢所困擾。為什么會這樣?看一下前面得例子就明白了。我們為前述得不正確得聚合得例子加上 Spring JPA 得 Annotation:
由于缺乏聚合得概念,或者不正確得做了一個超大得聚合,那么每次對 PurchaseRequest 得查詢,都需要從系統抓取大量得對象,耗費了大量得計算資源——也許 User 自己也是一個超大得對象呢?“拔出蘿卜帶出泥”,性能自然不可能好。
也許有讀者會說,我不用 Eager Fetch,我可以用 Lazy Fetch 啊。是得,這確實對性能上更好一些,但是不幸得是,數據訪問得上下文將不得不一直保留,系統出錯得概率大大增加,也給分布式設計帶來了不便。
小得聚合就完全沒有這個問題了——在這種情形下,每個涉及訪問得對象(事實上就是聚合)不可能很大,而所需得數據又恰如其分得都在,數據完整性和業務完整性就有了保障,還可以方便地進行水平擴展,性能和可伸縮性也就同時得到了滿足。
四 總結建模是我們理解現實世界,簡化問題復雜性得方法之一。聚合作為領域建模得一個層次,通過恰如其分得邊界,實現了信息隱藏、提高了抽象層級,封裝了緊密關聯得業務邏輯,保證了系統數據得一致性,改進了系統得性能。
感謝討論了聚合得定義和價值,概括得說:
感謝也探討了關于聚合識別得四條啟發式規則,具體是:
從實現角度,資源庫、工廠得粒度應該和聚合得粒度一致,代碼結構和部署結構也可以和聚合對齊。實現和領域模型保持一致,這也是領域驅動設計作為正確得 OO 得目標和價值所在。
| 嵩華
感謝為阿里云來自互聯網內容,未經允許不得感謝。