「进程」编程

date: 2017-10-16 14:53:36
title: 「进程」编程

图灵社区 - 理解UNIX进程: http://www.ituring.com.cn/book/1081
「理解Unix进程」读书笔记: http://www.jianshu.com/p/9f6bf7d2a445

博客来源:

<理解Unix进程> 这本书
rango和鸟哥的博客, 关于服务器编程的部分
自己工作学习中的积累

摘录几个进程相关的要点, 这玩意真的很重要:

所有的代码都是在进程中执行的(知道有多重要了吧)
用户空间 - 内核 - 系统调用(理解这三者的关系)
Unix哲学：万物皆为文件(普遍一点的理解是文件 + 资源, 但是这样抽象后, 可以统一进行处理了)
资源: FD(文件描述符)来跟踪资源; 三个公共资源 stdin stdout stderr
进程皆有环境(知道环境变量干啥用了吧)
pid - ppid - 僵尸进程 - 孤儿进程 - copy-on-write(进程之间的关系)
master/worker 进程模型
IPC(进程间通信): 信号管道 socket
与Unix进程打交道事关两件事：抽象和通信

当然, 强烈推荐去读一下这本书, 1-2 小时就能读完.

fork

先来对比一下:

// 司空见惯的 if-else
if ($a == -1) {
    echo '-1';
} else if($a == 0) {
    echo '0';
} else {
    echo $a;
}

// 还是 if-else
$pid = pcntl_fork(); // 基于 ext-pcntl 扩展
if ($pid == -1) {
    echo 'fork fail';
} else if ($pid) {
    echo 'parent';
} else {
    echo 'child';
}

上面的例子, 只会有一个 echo 输出(if-else 语句就该这样呀), 但是下面的 echo 'parent'; 和 echo 'child'; 却都会输出.

是不是很难理解? 我第一次遇到这样的情况, 是来源于下面的代码:

sub main{
    my $zip_dir = $conf->{config}->getone('conf,zip_dir');
    my @zip_dir = split ',', $zip_dir;
    my @files = ();

    my $project = 'brand_item';
    for my $dir(@zip_dir){
        my @tmp_files = <$dir/$project/*.zip>;
        for my $file(@tmp_files){
            #if(-M $file > 0.01){ push @files, $file; }
            push @files, $file;
        }
    }

    while(@files){
        while(@files and (keys %$child < $process_num)){
            my @task_files;
            if(@files > $do_number_per_process){
                @task_files = @files[0..$do_number_per_process-1];
                @files = @files[$do_number_per_process..$#files];
            }
            else{
                @task_files = @files;
                @files = ();
            }

            if(my $pid = fork()){ $child->{$pid} = 1;}
            else{
                $conf->{log}->sayshort("fork child $$, " . join ' ', keys %$child);
                my $conf = get_config();
                eval{ &process_content($conf, \@task_files);}; #处理文件
                if($@){ $conf->{log}->err("child failed $@");}
                $conf->{log}->sayshort("child $$ die");
                exit;
            }
        }
        my $pid = wait();
        delete $child->{$pid};
    }

    while((my $pid = wait()) != -1){}
}

上面是一段 perl 爬虫脚本, 使用多进程处理爬取到的页面内容, 达到加速脚本执行的效果.

这里有 2 点需要提一下:

任务分解: 这里只处理整个爬虫任务的一部分 - 页面内容处理; 任务分解细化是解决是解决 大规模 / 复杂问题 常用思路
如果单进程跑, 任务大概要 2 小时, 使用多进程后, 15 分钟就能结束

不知道看完之后是否可以理解:

fork 之后, 生成了子进程, 此时的进程和子进程都会执行之后的代码, 其实是有 2 个进程在跑 if-else 代码块, 这也是为什么 if-else 都有输出
使用 fork 后, 通常是 子进程 执行具体的任务, 原进程 待子进程处理完后使用 wait 回收子进程

server

看完进程的基本实践后(fork + wait), 我们再来看看服务器领域的例子.

其实上面的例子, 就包含了一个基本的进程模型 master/worker:

主进程(master)负责进程(work进程)管理
worker进程负责执行具体的任务

$serv = stream_socket_server("tcp://0.0.0.0:8000", $errno, $errstr) or die('create server failed');

// 直接 fork()
while (1) {
    $conn = stream_socket_accept($serv); // 阻塞在 accept 上
    if (pcntl_fork() == 0) {
        $request = fread($conn);
        // do something
        fwrite($conn, 'hello world');
        fclose($conn);
        exit(0);
    }
}

// 多进程/多线程 leader-follower模型 fpm/apache
for ($i=0; $i < 32; $i++) {
    if (pcntl_fork() == 0) {
        while (1) {
            $conn = stream_socket_accept($serv); // 阻塞在 accept 上
            if ($conn === false) continue;
            $request = fread($conn);
            // do something
            fwrite($conn, 'hello world');
            fclose($conn);
        }
        exit(0);
    }
}

上面 2 个实现其实都是 master/worker 模型, 仔细对比一下, 就会发现细微的差别:

下面的代码实现实现了进程池
为什么要用进程池? 因为进程的新建和销毁也需要消耗系统资源

master/worker 模型非常常见, nginx / php-fpm 都是基于此模型. swoole 也包含此模型, 但是因为需要处理更复杂的业务, 会有不同功能的进程, 进程模型也会更复杂一点.

当然, 无论进程还是服务器开发, 包含的内容都不止这么一点点. 这里写得很简单和简略, 是想要传达一个简单的认知:

吃的草多了, 你也会成为大牛

最后编辑于：2017.12.11 03:31:48

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

「进程」编程

fork

server

推荐阅读更多精彩内容