Linux 写时复制问题

69 天前
 ChainLock
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>

int g=100;

int main()
{

	static int x=666;

	
	pid_t pid = fork();


	if (pid==-1){
		printf("创建进程失败\r\n");
	}

	if (pid==0){
		printf("pid=%d g=%d,x=%d,g=%p,x=%p\r\n",pid,g,x,&g,&x);
		g=111;
		x=222;

		printf("我子进程 pid=%d,g=%d,x=%d,g=%p,x=%p\r\n",pid,g,x,&g,&x);
	}else{

		printf("pid=%d,g=%d,x=%d,g=%p,x=%p\r\n",pid,g,x,&g,&x);
		g=666;
		x=777;
		printf("我是父进程 pid=%d,g=%d,x=%d,g=%p,x=%p\r\n",pid,g,x,&g,&x);
		
	}


	return 0;
}

输出

pid=4502,g=100,x=666,g=0x601044,x=0x601048
我是父进程 pid=4502,g=666,x=777,g=0x601044,x=0x601048
pid=0 g=100,x=666,g=0x601044,x=0x601048
我子进程 pid=0,g=111,x=222,g=0x601044,x=0x601048

我的问题是:

子进程修改变量后,会重新开启一块新内存,再我重新修改变量值后,为什么在打印变量的地址还是相同的?

2014 次点击
所在节点    程序员
21 条回复
sagaxu
69 天前
你打印的是虚拟内存的地址,不是物理内存,两个进程可以有完全一样的虚拟内存布局
ChainLock
69 天前
@sagaxu #1 父子虚拟内存地址一样,父子进程中各自修改数据,都不互相影响
shijingshijing
69 天前
@ChainLock 打印出来的内存是虚拟内存地址,实际物理内存地址是 MMU 负责转换的。
ChainLock
69 天前
我纠结的点在于,父子进程第一次打印变量地址 相同,我可以理解,我在子进程里面都改变这个变量的值,再次打印还是相同的
GeekGao
69 天前
wkla
69 天前
@ChainLock #4 进程内存空间互相独立,这点你得先整明白。然后物理内存(绝对地址)和虚拟内存映射的分页机制你得先整明白。

写时复制可以在更底层做,没必要反应到进程虚拟内存上。你想象的就是写的时候,变量会开一个新地址放。事实上可能是这整个内存页在物理地址上不一样,也没必要变动进程的虚拟地址。
dhb233
69 天前
对于内核来说,能让程序正常运行,还能让指针地址改变是更难的事情吧。。。
写时拷贝是硬件提供的能力,fork 之后,设置页不可写,写的时候触发中断,复制一份就可以了
heiher
69 天前
COW 是为被写的虚拟地址创建了一个新的物理页,复制数据到上面,再映射到触发写进程的该虚拟页上。从始至终虚拟地址不变,物理地址改变。只打印虚拟地址当然看不出来啦。
wxf666
69 天前
@dhb233 #7 请教一下,4GB 的程序被 fork 之后,系统会设置 100W 页不可写吗?(假设 4KB/页)
ho121
69 天前
写时复制是在比进程这个层级更底层中做的,对进程这一层是透明的。
你想想系统怎么可能随时改变进程内的状态(比如某变量的地址),那不就乱套了。
况且程序中拿到的地址是虚地址,不是物理内存的地址。写时复制是在物理内存级别做的。

同样的可以参考一下文件系统的写时复制,写时复制是在文件系统层面做的,对文件本身是透明不可见的。不管何时写时复制,对于文件来说,文件还是那个文件,内容不会因为写时复制而改变,只是磁盘上的分布变了。
yanqiyu
69 天前
@wxf666 是,除非是 mmap 的 shared 这种情况,之外父子进程都会看到 ro 的页面,等写入的时候中断介入复制
r46mht
69 天前
@wxf666 概念上是这样的,实际的操作不需要 100w 页一个一个设置。x86 的页表是一个类似于字典树的结构,在父节点上标不可写相当于一次性设置了很多连续的页不可写
ChainLock
69 天前
@wkla #6 感谢佬
ChainLock
69 天前
@GeekGao #5 感谢佬
ChainLock
69 天前
@heiher #8 感谢佬,大彻大悟
ChainLock
69 天前
@ho121 #10 我一直把虚地址,物理内存地址搞混了,要想完全搞懂,得去看 Linux 源码了
ChainLock
69 天前
@r46mht #12 要想完全搞明白这些,只能去啃 linux 源码 ,我太菜了
dhb233
69 天前
@wxf666 #9 具体的实现不是很清楚。。。至少 fork 的时候,新的进程的页表就是要全创建出来啊,有 100w 个页就要创建 100w 个页表
ho121
69 天前
@ChainLock 看源码不至于,看操作系统原理就行
vituralfuture
68 天前
给楼主提供几个意见,这些是操作系统的知识,中国大学 mooc 上找个课程,买几本书,现代操作系统,操作系统导论等经典书籍看一看,然后找国外大学是公开课程跟着做个实验,就能理解了。linux 内核源码很难读,如果不是内核开发,就没有读的必要,里面很多奇技淫巧➕各种历史遗留。操作系统的理论很早就有了,到现在已经非常完善了,所谓各种内核只不过是将这些理论落地而已,实现不重要,背后的思想设计才是精华

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1069433

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX