You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

310 lines
12 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 18 | 进程的创建:如何发起一个新项目?
前面我们学习了如何使用fork创建进程也学习了进程管理和调度的相关数据结构。这一节我们就来看一看创建进程这个动作在内核里都做了什么事情。
fork是一个系统调用根据咱们讲过的系统调用的流程流程的最后会在sys\_call\_table中找到相应的系统调用sys\_fork。
sys\_fork是如何定义的呢根据SYSCALL\_DEFINE0这个宏的定义下面这段代码就定义了sys\_fork。
```
SYSCALL_DEFINE0(fork)
{
......
return _do_fork(SIGCHLD, 0, 0, NULL, NULL, 0);
}
```
sys\_fork会调用\_do\_fork。
```
long _do_fork(unsigned long clone_flags,
unsigned long stack_start,
unsigned long stack_size,
int __user *parent_tidptr,
int __user *child_tidptr,
unsigned long tls)
{
struct task_struct *p;
int trace = 0;
long nr;
......
p = copy_process(clone_flags, stack_start, stack_size,
child_tidptr, NULL, trace, tls, NUMA_NO_NODE);
......
if (!IS_ERR(p)) {
struct pid *pid;
pid = get_task_pid(p, PIDTYPE_PID);
nr = pid_vnr(pid);
if (clone_flags & CLONE_PARENT_SETTID)
put_user(nr, parent_tidptr);
......
wake_up_new_task(p);
......
put_pid(pid);
}
......
```
## fork的第一件大事复制结构
\_do\_fork里面做的第一件大事就是copy\_process咱们前面讲过这个思想。如果所有数据结构都从头创建一份太麻烦了还不如使用惯用“伎俩”Ctrl C + Ctrl V。
这里我们再把task\_struct的结构图拿出来对比着看如何一个个复制。
![](https://static001.geekbang.org/resource/image/fd/1d/fda98b6c68605babb2036bf91782311d.png)
```
static __latent_entropy struct task_struct *copy_process(
unsigned long clone_flags,
unsigned long stack_start,
unsigned long stack_size,
int __user *child_tidptr,
struct pid *pid,
int trace,
unsigned long tls,
int node)
{
int retval;
struct task_struct *p;
......
p = dup_task_struct(current, node);
```
dup\_task\_struct主要做了下面几件事情
* 调用alloc\_task\_struct\_node分配一个task\_struct结构
* 调用alloc\_thread\_stack\_node来创建内核栈这里面调用\_\_vmalloc\_node\_range分配一个连续的THREAD\_SIZE的内存空间赋值给task\_struct的void \*stack成员变量
* 调用arch\_dup\_task\_struct(struct task\_struct \*dst, struct task\_struct \*src)将task\_struct进行复制其实就是调用memcpy
* 调用setup\_thread\_stack设置thread\_info。
到这里整个task\_struct复制了一份而且内核栈也创建好了。
我们再接着看copy\_process。
```
retval = copy_creds(p, clone_flags);
```
轮到权限相关了copy\_creds主要做了下面几件事情
* 调用prepare\_creds准备一个新的struct cred \*new。如何准备呢其实还是从内存中分配一个新的struct cred结构然后调用memcpy复制一份父进程的cred
* 接着p->cred = p->real\_cred = get\_cred(new)将新进程的“我能操作谁”和“谁能操作我”两个权限都指向新的cred。
接下来copy\_process重新设置进程运行的统计量。
```
p->utime = p->stime = p->gtime = 0;
p->start_time = ktime_get_ns();
p->real_start_time = ktime_get_boot_ns();
```
接下来copy\_process开始设置调度相关的变量。
```
retval = sched_fork(clone_flags, p);
```
sched\_fork主要做了下面几件事情
* 调用\_\_sched\_fork在这里面将on\_rq设为0初始化sched\_entity将里面的exec\_start、sum\_exec\_runtime、prev\_sum\_exec\_runtime、vruntime都设为0。你还记得吗这几个变量涉及进程的实际运行时间和虚拟运行时间。是否到时间应该被调度了就靠它们几个
* 设置进程的状态p->state = TASK\_NEW
* 初始化优先级prio、normal\_prio、static\_prio
* 设置调度类如果是普通进程就设置为p->sched\_class = &fair\_sched\_class
* 调用调度类的task\_fork函数对于CFS来讲就是调用task\_fork\_fair。在这个函数里先调用update\_curr对于当前的进程进行统计量更新然后把子进程和父进程的vruntime设成一样最后调用place\_entity初始化sched\_entity。这里有一个变量sysctl\_sched\_child\_runs\_first可以设置父进程和子进程谁先运行。如果设置了子进程先运行即便两个进程的vruntime一样也要把子进程的sched\_entity放在前面然后调用resched\_curr标记当前运行的进程TIF\_NEED\_RESCHED也就是说把父进程设置为应该被调度这样下次调度的时候父进程会被子进程抢占。
接下来copy\_process开始初始化与文件和文件系统相关的变量。
```
retval = copy_files(clone_flags, p);
retval = copy_fs(clone_flags, p);
```
copy\_files主要用于复制一个进程打开的文件信息。这些信息用一个结构files\_struct来维护每个打开的文件都有一个文件描述符。在copy\_files函数里面调用dup\_fd在这里面会创建一个新的files\_struct然后将所有的文件描述符数组fdtable拷贝一份。
copy\_fs主要用于复制一个进程的目录信息。这些信息用一个结构fs\_struct来维护。一个进程有自己的根目录和根文件系统root也有当前目录pwd和当前目录的文件系统都在fs\_struct里面维护。copy\_fs函数里面调用copy\_fs\_struct创建一个新的fs\_struct并复制原来进程的fs\_struct。
接下来copy\_process开始初始化与信号相关的变量。
```
init_sigpending(&p->pending);
retval = copy_sighand(clone_flags, p);
retval = copy_signal(clone_flags, p);
```
copy\_sighand会分配一个新的sighand\_struct。这里最主要的是维护信号处理函数在copy\_sighand里面会调用memcpy将信号处理函数sighand->action从父进程复制到子进程。
init\_sigpending和copy\_signal用于初始化并且复制用于维护发给这个进程的信号的数据结构。copy\_signal函数会分配一个新的signal\_struct并进行初始化。
接下来copy\_process开始复制进程内存空间。
```
retval = copy_mm(clone_flags, p);
```
进程都有自己的内存空间用mm\_struct结构来表示。copy\_mm函数中调用dup\_mm分配一个新的mm\_struct结构调用memcpy复制这个结构。dup\_mmap用于复制内存空间中内存映射的部分。前面讲系统调用的时候我们说过mmap可以分配大块的内存其实mmap也可以将一个文件映射到内存中方便可以像读写内存一样读写文件这个在内存管理那节我们讲。
接下来copy\_process开始分配pid设置tidgroup\_leader并且建立进程之间的亲缘关系。
```
INIT_LIST_HEAD(&p->children);
INIT_LIST_HEAD(&p->sibling);
......
p->pid = pid_nr(pid);
if (clone_flags & CLONE_THREAD) {
p->exit_signal = -1;
p->group_leader = current->group_leader;
p->tgid = current->tgid;
} else {
if (clone_flags & CLONE_PARENT)
p->exit_signal = current->group_leader->exit_signal;
else
p->exit_signal = (clone_flags & CSIGNAL);
p->group_leader = p;
p->tgid = p->pid;
}
......
if (clone_flags & (CLONE_PARENT|CLONE_THREAD)) {
p->real_parent = current->real_parent;
p->parent_exec_id = current->parent_exec_id;
} else {
p->real_parent = current;
p->parent_exec_id = current->self_exec_id;
}
```
好了copy\_process要结束了上面图中的组件也初始化的差不多了。
## fork的第二件大事唤醒新进程
\_do\_fork做的第二件大事是wake\_up\_new\_task。新任务刚刚建立有没有机会抢占别人获得CPU呢
```
void wake_up_new_task(struct task_struct *p)
{
struct rq_flags rf;
struct rq *rq;
......
p->state = TASK_RUNNING;
......
activate_task(rq, p, ENQUEUE_NOCLOCK);
p->on_rq = TASK_ON_RQ_QUEUED;
trace_sched_wakeup_new(p);
check_preempt_curr(rq, p, WF_FORK);
......
}
```
首先我们需要将进程的状态设置为TASK\_RUNNING。
activate\_task函数中会调用enqueue\_task。
```
static inline void enqueue_task(struct rq *rq, struct task_struct *p, int flags)
{
.....
p->sched_class->enqueue_task(rq, p, flags);
}
```
如果是CFS的调度类则执行相应的enqueue\_task\_fair。
```
static void
enqueue_task_fair(struct rq *rq, struct task_struct *p, int flags)
{
struct cfs_rq *cfs_rq;
struct sched_entity *se = &p->se;
......
cfs_rq = cfs_rq_of(se);
enqueue_entity(cfs_rq, se, flags);
......
cfs_rq->h_nr_running++;
......
}
```
在enqueue\_task\_fair中取出的队列就是cfs\_rq然后调用enqueue\_entity。
在enqueue\_entity函数里面会调用update\_curr更新运行的统计量然后调用\_\_enqueue\_entity将sched\_entity加入到红黑树里面然后将se->on\_rq = 1设置在队列上。
回到enqueue\_task\_fair后将这个队列上运行的进程数目加一。然后wake\_up\_new\_task会调用check\_preempt\_curr看是否能够抢占当前进程。
在check\_preempt\_curr中会调用相应的调度类的rq->curr->sched\_class->check\_preempt\_curr(rq, p, flags)。对于CFS调度类来讲调用的是check\_preempt\_wakeup。
```
static void check_preempt_wakeup(struct rq *rq, struct task_struct *p, int wake_flags)
{
struct task_struct *curr = rq->curr;
struct sched_entity *se = &curr->se, *pse = &p->se;
struct cfs_rq *cfs_rq = task_cfs_rq(curr);
......
if (test_tsk_need_resched(curr))
return;
......
find_matching_se(&se, &pse);
update_curr(cfs_rq_of(se));
if (wakeup_preempt_entity(se, pse) == 1) {
goto preempt;
}
return;
preempt:
resched_curr(rq);
......
}
```
在check\_preempt\_wakeup函数中前面调用task\_fork\_fair的时候设置sysctl\_sched\_child\_runs\_first了已经将当前父进程的TIF\_NEED\_RESCHED设置了则直接返回。
否则check\_preempt\_wakeup还是会调用update\_curr更新一次统计量然后wakeup\_preempt\_entity将父进程和子进程PK一次看是不是要抢占如果要则调用resched\_curr标记父进程为TIF\_NEED\_RESCHED。
如果新创建的进程应该抢占父进程在什么时间抢占呢别忘了fork是一个系统调用从系统调用返回的时候是抢占的一个好时机如果父进程判断自己已经被设置为TIF\_NEED\_RESCHED就让子进程先跑抢占自己。
## 总结时刻
好了fork系统调用的过程咱们就解析完了。它包含两个重要的事件一个是将task\_struct结构复制一份并且初始化另一个是试图唤醒新创建的子进程。
这个过程我画了一张图,你可以对照着这张图回顾进程创建的过程。
这个图的上半部分是复制task\_struct结构你可以对照着右面的task\_struct结构图看这里面的成员是如何一部分一部分地被复制的。图的下半部分是唤醒新创建的子进程如果条件满足就会将当前进程设置应该被调度的标识位就等着当前进程执行\_\_schedule了。
![](https://static001.geekbang.org/resource/image/9d/58/9d9c5779436da40cabf8e8599eb85558.jpeg)
## 课堂练习
你可以试着设置sysctl\_sched\_child\_runs\_first参数然后使用系统调用写程序创建进程看看执行结果。
欢迎留言和我分享你的疑惑和见解,也欢迎你收藏本节内容,反复研读。你也可以把今天的内容分享给你的朋友,和他一起学习、进步。
![](https://static001.geekbang.org/resource/image/8c/37/8c0a95fa07a8b9a1abfd394479bdd637.jpg)