C++多任务编程简明教程 (1) - C++的多任务其实很简单
用库的方式无法实现彻底的线程安全!我们需要C++11
与很多同学交流的时候发现,一想到用C++写多线程,还是想到pthread这样的库的方法实现。
但是,十几年前的研究就证明了,线程安全是无法用库的形式来提供的,有兴趣的同学可以参见原文:
http://www.hpl.hp.com/techreports/2004/HPL-2004-209.pdf
解释需要大量的篇幅,作为快餐式的教程,我们只讲结论。
十几年过去了,CPU的乱序执行,编译器的乱序优化,使得通过pthread一样的库实现线程安全越来越困难。即使做到了,也是以牺牲性能为代价换来的。
我们以java为例,虽然在java 1.0中就支持多线程了。但是,真正完整的线程安全的基础设施的完成是在java 5.0版本中才实现的。这其中最重要的一点,就是java 5.0明确定义了内存模型。有了内存模型的保证,我们才真正知道,什么是可行的,什么是不可行的。如何定义才能在多线程中实在可见性。
在有较大影响的语言中,java是率先达到了这一目标的。C++在当时基本上没有为多线程或者多任务做过考虑,这个问题直到C++11中才被解决掉。
所以,至少对于多线程编程来讲,C++11是必须要学习的。我们不能再停留在C++98/03的老黄历上了!
所幸的是,对于最基本的C++11多任务编程来讲,比起完整学会pthread这样的库还要容易.
多任务优于多线程
然后,我们从C++11的线程开始讲?不,我宁愿把整个内存模型讲完了之后才教您如何使用线程,就怕学完了线程没学内存模型就上手直接开始用了,导致遇到问题之后才知道内存模型的重要性。
但是,这还不是我最想讲的,为什么要学线程和内存模型呢?大部分的任务,我们根本不需要了解什么是线程,什么是锁,更不用说无锁编程之类的了。看过我的《Java多线程编程简明教程(1) - Future模式与AsyncTask》都知道,如果有更简单、更高级的封装,我是不建议先学更低级的工具的。
为什么需要多线程?其实很多同学没有意识到,需要的只是多任务,线程只是手段。线程是操作系统级的概念,是操作系统级的资源,我们要管理到这么细节,就得去处理比如管理线程状态,处理线程数满了的异常,如何做线程的负载均衡之类的管理工作,而这些根业务逻辑之间没有半毛钱关系。
从java的发展来看,5.0提供了Future模式,7.0中提供了Fork-Join模式,封装得越来越高级。C++11中暂时还没有到Fork-Join这么高级,不过,直接调用一个std::async函数就可以实现Future模式.
所谓的Future模式,就是在后台起一个任务,然后前台该干嘛干嘛,等到前台任务需要用到刚才的后台任务的时候,再去获取后台任务的结果。如果后台任务已经结束了,自然是最好,继续干活就是了。即使后台还没做完,至少也能少等一会儿。不管怎么样都不赔。
std::async 快餐
C++11如何去做一个后台任务呢,实在太简单了,写个函数,或者仿函数,或者是lambda表达式这样可以被调用的逻辑,然后通过std:async去调用就是了。
唯一需要注意的一点,future模式不允许共享内存,复制一份只读的通过参数传给你的函数吧。
太简单了,一共就只需要4步:
- 引入头文件
- 写需要后台执行功能的函数
- 通过async函数调用上面写的函数
- 主任务继续干活
- 需要后台任务的结果时,去读它的返回值
引入future头文件
#include <future>
实现功能的函数
将后台要做事儿的逻辑写成一个函数吧,这里写个最简单的:
void func1(int arg){
cout<<"I am running in background!"<<arg<<endl;
}
通过async调用您的逻辑
future<void> f1 = async(launch::async,func1,0);
大家可以看到,async有多么的简单,第一个参数是马上就启动后台任务,还是用的时候再启动。我们一般都是希望马上启动,于是固定地给launch::async就好了。真的有特殊需求要用的时候再启动,就给launch::deferred。只有这两种情况,简单吧?
第二个参数就是刚才写好的后台逻辑的函数。第三个是您的函数要用的参数。
返回一个future,类型与刚才您写的函数的返回值一致。这时候不需要知道它是什么。
甚至有个更绝情的办法,我们根本不care返回值是什么,直接给个auto让编译器自己推断去。
像下面这样:
auto f1 = async(launch::async,func1,0);
不需要懂任何跟线程相关的知识吧?
主任务继续干活
这个就不多说了,既然要起后台任务,前台肯定有事儿要做。
获取后台的值
到了需要返回值的时候,直接调用get函数。本例中是void类型,所以返回值获取了我们也不用。
f1.get();
OK,我们的快餐教程就讲完了,不需要懂什么是线程,什么是锁,什么是内存模型,原子变量是什么,内存都有什么顺序之类的。大家可以快乐地去干活去了~ 等将来我们详详细细地把刚才列举的这些知识一一补齐,大家就会发现这其实是有多复杂了。
例子
Java历史上借鉴了太多的C++的东西,但是内存模型和Future模式这些,Java是领先于C++的。
那我们向Java致敬吧,将Java多线程简明教程中Future模式的例子用C++改写一下。我们看看C++的优势吧:
public class AsyncTaskSimple {
public static class Result implements Callable<String>{
@Override
public String call() throws Exception {
return doRealLogic();
}
private String doRealLogic(){
//Here to do the background logic
return new String("Done");
}
}
public static void main(String[] args) {
FutureTask<String> future = new FutureTask<String>(new Result());
ExecutorService executor = Executors.newFixedThreadPool(1);
executor.submit(future);
someThingToDo();
try {
String s = future.get();
System.out.println("The result is:"+s);
}catch (InterruptedException e){
//Deal with InterruptedExcpeiotn
}catch(ExecutionException ee){
//Deal with ExecutionException
}
}
private static void someThingToDo(){
//Main thread logic
}
}
Java写了这么一大坨,C++11只用不到一半的篇幅就搞定了:
string doRealLogic(){
return string("Done");
}
void someThingToDo(){
//do something
}
int main(int argc, char** argv)
{
auto f2 = async(launch::async,doRealLogic);
someThingToDo();
cout<<f2.get()<<endl;
}
或者我们更现代一点,也不要写函数了,直接上一个lambda表达式吧。
void someThingToDo(){
//do something
}
int main(int argc, char** argv)
{
auto f2 = async(launch::async,[](){
return string("Done");
});
someThingToDo();
cout<<f2.get()<<endl;
}
最后再强调一遍,输入参数通过函数参数传进去,输出参数通过返回值,也就是future.get获取回来。不要使用全局变量等方式来共享内存!
Enjoy it!