掃二維碼與項(xiàng)目經(jīng)理溝通
我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
COW 不是奶牛,是 Copy-On-Write 的縮寫,這是一種是復(fù)制但也不完全是復(fù)制的技術(shù)。

一般來說復(fù)制就是創(chuàng)建出完全相同的兩份,兩份是獨(dú)立的:
但是,有的時(shí)候復(fù)制這件事沒多大必要,完全可以復(fù)用之前的,這時(shí)候可以只是引用之前的那份,在寫內(nèi)容的時(shí)候才去復(fù)制對(duì)應(yīng)的一部分內(nèi)容。這樣如果內(nèi)容用于讀的話,就免去了復(fù)制,而如果需要寫,才會(huì)真正復(fù)制部分內(nèi)容來做修改。
這就叫做“寫時(shí)復(fù)制”,也就是 Copy-On-Write。
原理很簡單,但是在操作系統(tǒng)的內(nèi)存管理和文件系統(tǒng)中卻很常見,Node.js 里面也因?yàn)檫@種技術(shù)變“懶”了。
本文我們來探究下 Copy-On-Write 在 Node.js 的進(jìn)程創(chuàng)建和文件復(fù)制的應(yīng)用:
文件復(fù)制這件事最常見的思路就是完全寫一份相同的文件內(nèi)容到另一個(gè)位置,但是這樣有兩個(gè)問題:
怎么辦呢?這時(shí)候操作系統(tǒng)設(shè)計(jì)者就想到了 COW 技術(shù)。
用 COW 技術(shù)實(shí)現(xiàn)文件復(fù)制以后完美解決了上面兩個(gè)問題:
在 Node.js 的 fs.copyFile 的 api 就可以使用 Copy-On-Write 模式:
默認(rèn)情況下,copyFile 會(huì)寫入目標(biāo)文件,覆蓋原內(nèi)容
- const fsPromises = require('fs').promises;
- (async function() {
- try {
- await fsPromises.copyFile('source.txt', 'destination.txt');
- } catch(e) {
- console.log(e.message);
- }
- })();
但是可以通過第三個(gè)參數(shù)指定復(fù)制的策略:
- const fs = require('fs');
- const fsPromises = fs.promises;
- const { COPYFILE_EXCL, COPYFILE_FICLONE, COPYFILE_FICLONE_FORCE} = fs.constants;
- (async function() {
- try {
- await fsPromises.copyFile('source.txt', 'destination.txt', COPYFILE_FICLONE);
- } catch(e) {
- console.log(e.message);
- }
- })();
支持的 flag 有 3 個(gè):
這3個(gè)常量分別是 1,2,4,可以通過按位或把它們合并之后傳入:
- const flags = COPYFILE_FICLONE | COPYFILE_EXCL;
- fsPromises.copyFile('source.txt', 'destination.txt', flags);
Node.js 支持操作系統(tǒng)的 copy-on-write 技術(shù),在一些場(chǎng)景下可以提升性能,建議使用 COPYFILE_FICLONE 的方式,會(huì)比默認(rèn)的方式好一些。
fork 是常見的創(chuàng)建進(jìn)程的方式,而它的實(shí)現(xiàn)就是一種 copy-on-write 技術(shù)。
我們知道,進(jìn)程在內(nèi)存中分為代碼段、數(shù)據(jù)段、堆棧段這 3 部分:
如果基于該進(jìn)程創(chuàng)建一個(gè)新的進(jìn)程,那么要復(fù)制這 3 部分內(nèi)存。而如果這三部分內(nèi)存是一樣的內(nèi)容,那就浪費(fèi)了內(nèi)存空間。
所以 fork 并不會(huì)真正的復(fù)制內(nèi)存,而是創(chuàng)建一個(gè)新的進(jìn)程,引用父進(jìn)程的內(nèi)存,當(dāng)做數(shù)據(jù)的修改的時(shí)候,才會(huì)真正復(fù)制該部分的內(nèi)存。
這也是為什么把進(jìn)程創(chuàng)建叫做 fork,也就是分叉,因?yàn)椴煌耆仟?dú)立的,只是某部分做了分叉,成了兩份,但是大部分還是一樣的。
但如果要執(zhí)行的代碼不一樣怎么辦呢,這時(shí)候就要用 exec 了,它會(huì)創(chuàng)建新的代碼段、數(shù)據(jù)段、堆棧段、執(zhí)行新的代碼。
Node.js 里面同樣可以用 fork 和 exec 的 api:
fork:
- const cluster = require('cluster');
- if (cluster.isMaster) {
- console.log('I am master');
- cluster.fork();
- cluster.fork();
- } else if (cluster.isWorker) {
- console.log(`I am worker #${cluster.worker.id}`);
- }
exec:
- const { exec } = require('child_process');
- exec('my.bat', (err, stdout, stderr) => {
- if (err) {
- console.error(err);
- return;
- }
- console.log(stdout);
- });
fork 是 linux 進(jìn)程創(chuàng)建的基礎(chǔ),由此可見 copy-on-write 技術(shù)多么重要了。
復(fù)制同樣的內(nèi)容多份無疑比較浪費(fèi)空間,所以操作系統(tǒng)在做文件復(fù)制、進(jìn)程創(chuàng)建時(shí)的內(nèi)存復(fù)制的時(shí)候都采用了 Copy-On-Write 技術(shù),只有真正修改的時(shí)候才會(huì)去做復(fù)制。
Node.js 支持了 fs.copyFile 的 flags 的設(shè)置,可以指定 COPYFILE_FICLONE 來使用 Copy-On-Write 的方式做文件復(fù)制,也建議大家使用這種方式來節(jié)省硬盤空間,提高文件復(fù)制的性能。
進(jìn)程的 fork 也是 Copy-On-Write 的實(shí)現(xiàn),并不會(huì)直接復(fù)制進(jìn)程的代碼段、數(shù)據(jù)段、堆棧段到新的內(nèi)容,而是引用之前的,只有在修改的時(shí)候才會(huì)做真正的內(nèi)存復(fù)制。
除此以外,Copy-On-Write 在 Immutable 的實(shí)現(xiàn),在分布式的讀寫分離等領(lǐng)域都有很多應(yīng)用。
COW 讓 Node.js 變“懶”了,但性能卻更高了。

我們?cè)谖⑿派?4小時(shí)期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流