You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

12 KiB

18 | 进程的创建:如何发起一个新项目?

前面我们学习了如何使用fork创建进程也学习了进程管理和调度的相关数据结构。这一节我们就来看一看创建进程这个动作在内核里都做了什么事情。

fork是一个系统调用根据咱们讲过的系统调用的流程流程的最后会在sys_call_table中找到相应的系统调用sys_fork。

sys_fork是如何定义的呢根据SYSCALL_DEFINE0这个宏的定义下面这段代码就定义了sys_fork。

SYSCALL_DEFINE0(fork)
{
......
	return _do_fork(SIGCHLD, 0, 0, NULL, NULL, 0);
}

sys_fork会调用_do_fork。

long _do_fork(unsigned long clone_flags,
	      unsigned long stack_start,
	      unsigned long stack_size,
	      int __user *parent_tidptr,
	      int __user *child_tidptr,
	      unsigned long tls)
{
	struct task_struct *p;
	int trace = 0;
	long nr;


......
	p = copy_process(clone_flags, stack_start, stack_size,
			 child_tidptr, NULL, trace, tls, NUMA_NO_NODE);
......
	if (!IS_ERR(p)) {
		struct pid *pid;
		pid = get_task_pid(p, PIDTYPE_PID);
		nr = pid_vnr(pid);


		if (clone_flags & CLONE_PARENT_SETTID)
			put_user(nr, parent_tidptr);


......
		wake_up_new_task(p);
......
		put_pid(pid);
	} 
......

fork的第一件大事复制结构

_do_fork里面做的第一件大事就是copy_process咱们前面讲过这个思想。如果所有数据结构都从头创建一份太麻烦了还不如使用惯用“伎俩”Ctrl C + Ctrl V。

这里我们再把task_struct的结构图拿出来对比着看如何一个个复制。

static __latent_entropy struct task_struct *copy_process(
					unsigned long clone_flags,
					unsigned long stack_start,
					unsigned long stack_size,
					int __user *child_tidptr,
					struct pid *pid,
					int trace,
					unsigned long tls,
					int node)
{
	int retval;
	struct task_struct *p;
......
	p = dup_task_struct(current, node);

dup_task_struct主要做了下面几件事情

  • 调用alloc_task_struct_node分配一个task_struct结构

  • 调用alloc_thread_stack_node来创建内核栈这里面调用__vmalloc_node_range分配一个连续的THREAD_SIZE的内存空间赋值给task_struct的void *stack成员变量

  • 调用arch_dup_task_struct(struct task_struct *dst, struct task_struct *src)将task_struct进行复制其实就是调用memcpy

  • 调用setup_thread_stack设置thread_info。

到这里整个task_struct复制了一份而且内核栈也创建好了。

我们再接着看copy_process。

retval = copy_creds(p, clone_flags);

轮到权限相关了copy_creds主要做了下面几件事情

  • 调用prepare_creds准备一个新的struct cred *new。如何准备呢其实还是从内存中分配一个新的struct cred结构然后调用memcpy复制一份父进程的cred

  • 接着p->cred = p->real_cred = get_cred(new)将新进程的“我能操作谁”和“谁能操作我”两个权限都指向新的cred。

接下来copy_process重新设置进程运行的统计量。

p->utime = p->stime = p->gtime = 0;
p->start_time = ktime_get_ns();
p->real_start_time = ktime_get_boot_ns();

接下来copy_process开始设置调度相关的变量。

retval = sched_fork(clone_flags, p);

sched_fork主要做了下面几件事情

  • 调用__sched_fork在这里面将on_rq设为0初始化sched_entity将里面的exec_start、sum_exec_runtime、prev_sum_exec_runtime、vruntime都设为0。你还记得吗这几个变量涉及进程的实际运行时间和虚拟运行时间。是否到时间应该被调度了就靠它们几个

  • 设置进程的状态p->state = TASK_NEW

  • 初始化优先级prio、normal_prio、static_prio

  • 设置调度类如果是普通进程就设置为p->sched_class = &fair_sched_class

  • 调用调度类的task_fork函数对于CFS来讲就是调用task_fork_fair。在这个函数里先调用update_curr对于当前的进程进行统计量更新然后把子进程和父进程的vruntime设成一样最后调用place_entity初始化sched_entity。这里有一个变量sysctl_sched_child_runs_first可以设置父进程和子进程谁先运行。如果设置了子进程先运行即便两个进程的vruntime一样也要把子进程的sched_entity放在前面然后调用resched_curr标记当前运行的进程TIF_NEED_RESCHED也就是说把父进程设置为应该被调度这样下次调度的时候父进程会被子进程抢占。

接下来copy_process开始初始化与文件和文件系统相关的变量。

retval = copy_files(clone_flags, p);
retval = copy_fs(clone_flags, p);

copy_files主要用于复制一个进程打开的文件信息。这些信息用一个结构files_struct来维护每个打开的文件都有一个文件描述符。在copy_files函数里面调用dup_fd在这里面会创建一个新的files_struct然后将所有的文件描述符数组fdtable拷贝一份。

copy_fs主要用于复制一个进程的目录信息。这些信息用一个结构fs_struct来维护。一个进程有自己的根目录和根文件系统root也有当前目录pwd和当前目录的文件系统都在fs_struct里面维护。copy_fs函数里面调用copy_fs_struct创建一个新的fs_struct并复制原来进程的fs_struct。

接下来copy_process开始初始化与信号相关的变量。

init_sigpending(&p->pending);
retval = copy_sighand(clone_flags, p);
retval = copy_signal(clone_flags, p);

copy_sighand会分配一个新的sighand_struct。这里最主要的是维护信号处理函数在copy_sighand里面会调用memcpy将信号处理函数sighand->action从父进程复制到子进程。

init_sigpending和copy_signal用于初始化并且复制用于维护发给这个进程的信号的数据结构。copy_signal函数会分配一个新的signal_struct并进行初始化。

接下来copy_process开始复制进程内存空间。

retval = copy_mm(clone_flags, p);

进程都有自己的内存空间用mm_struct结构来表示。copy_mm函数中调用dup_mm分配一个新的mm_struct结构调用memcpy复制这个结构。dup_mmap用于复制内存空间中内存映射的部分。前面讲系统调用的时候我们说过mmap可以分配大块的内存其实mmap也可以将一个文件映射到内存中方便可以像读写内存一样读写文件这个在内存管理那节我们讲。

接下来copy_process开始分配pid设置tidgroup_leader并且建立进程之间的亲缘关系。

	INIT_LIST_HEAD(&p->children);
	INIT_LIST_HEAD(&p->sibling);
......
    p->pid = pid_nr(pid);
	if (clone_flags & CLONE_THREAD) {
		p->exit_signal = -1;
		p->group_leader = current->group_leader;
		p->tgid = current->tgid;
	} else {
		if (clone_flags & CLONE_PARENT)
			p->exit_signal = current->group_leader->exit_signal;
		else
			p->exit_signal = (clone_flags & CSIGNAL);
		p->group_leader = p;
		p->tgid = p->pid;
	}
......
	if (clone_flags & (CLONE_PARENT|CLONE_THREAD)) {
		p->real_parent = current->real_parent;
		p->parent_exec_id = current->parent_exec_id;
	} else {
		p->real_parent = current;
		p->parent_exec_id = current->self_exec_id;
	}

好了copy_process要结束了上面图中的组件也初始化的差不多了。

fork的第二件大事唤醒新进程

_do_fork做的第二件大事是wake_up_new_task。新任务刚刚建立有没有机会抢占别人获得CPU呢

void wake_up_new_task(struct task_struct *p)
{
	struct rq_flags rf;
	struct rq *rq;
......
	p->state = TASK_RUNNING;
......
	activate_task(rq, p, ENQUEUE_NOCLOCK);
	p->on_rq = TASK_ON_RQ_QUEUED;
	trace_sched_wakeup_new(p);
	check_preempt_curr(rq, p, WF_FORK);
......
}

首先我们需要将进程的状态设置为TASK_RUNNING。

activate_task函数中会调用enqueue_task。

static inline void enqueue_task(struct rq *rq, struct task_struct *p, int flags)
{
.....
	p->sched_class->enqueue_task(rq, p, flags);
}

如果是CFS的调度类则执行相应的enqueue_task_fair。

static void
enqueue_task_fair(struct rq *rq, struct task_struct *p, int flags)
{
	struct cfs_rq *cfs_rq;
	struct sched_entity *se = &p->se;
......
	cfs_rq = cfs_rq_of(se);
	enqueue_entity(cfs_rq, se, flags);
......
	cfs_rq->h_nr_running++;
......
}

在enqueue_task_fair中取出的队列就是cfs_rq然后调用enqueue_entity。

在enqueue_entity函数里面会调用update_curr更新运行的统计量然后调用__enqueue_entity将sched_entity加入到红黑树里面然后将se->on_rq = 1设置在队列上。

回到enqueue_task_fair后将这个队列上运行的进程数目加一。然后wake_up_new_task会调用check_preempt_curr看是否能够抢占当前进程。

在check_preempt_curr中会调用相应的调度类的rq->curr->sched_class->check_preempt_curr(rq, p, flags)。对于CFS调度类来讲调用的是check_preempt_wakeup。

static void check_preempt_wakeup(struct rq *rq, struct task_struct *p, int wake_flags)
{
	struct task_struct *curr = rq->curr;
	struct sched_entity *se = &curr->se, *pse = &p->se;
	struct cfs_rq *cfs_rq = task_cfs_rq(curr);
......
	if (test_tsk_need_resched(curr))
		return;
......
	find_matching_se(&se, &pse);
	update_curr(cfs_rq_of(se));
	if (wakeup_preempt_entity(se, pse) == 1) {
		goto preempt;
	}
	return;
preempt:
	resched_curr(rq);
......
}

在check_preempt_wakeup函数中前面调用task_fork_fair的时候设置sysctl_sched_child_runs_first了已经将当前父进程的TIF_NEED_RESCHED设置了则直接返回。

否则check_preempt_wakeup还是会调用update_curr更新一次统计量然后wakeup_preempt_entity将父进程和子进程PK一次看是不是要抢占如果要则调用resched_curr标记父进程为TIF_NEED_RESCHED。

如果新创建的进程应该抢占父进程在什么时间抢占呢别忘了fork是一个系统调用从系统调用返回的时候是抢占的一个好时机如果父进程判断自己已经被设置为TIF_NEED_RESCHED就让子进程先跑抢占自己。

总结时刻

好了fork系统调用的过程咱们就解析完了。它包含两个重要的事件一个是将task_struct结构复制一份并且初始化另一个是试图唤醒新创建的子进程。

这个过程我画了一张图,你可以对照着这张图回顾进程创建的过程。

这个图的上半部分是复制task_struct结构你可以对照着右面的task_struct结构图看这里面的成员是如何一部分一部分地被复制的。图的下半部分是唤醒新创建的子进程如果条件满足就会将当前进程设置应该被调度的标识位就等着当前进程执行__schedule了。

课堂练习

你可以试着设置sysctl_sched_child_runs_first参数然后使用系统调用写程序创建进程看看执行结果。

欢迎留言和我分享你的疑惑和见解,也欢迎你收藏本节内容,反复研读。你也可以把今天的内容分享给你的朋友,和他一起学习、进步。