[译]原文链接
RenderScript是运行在Android系统上的一个高性能密集计算框架。RenderScript主要面向并行数据的计算,当然也可以使串行数据计算的负载受益。RenderScript运行时会在一台设备所有可用处理器上并行工作,比如多核的CPU,GPU或者DSP,这使得你可以专注于算法,而不是任务调度或者负载平衡。RenderScript在应用程序执行图像处理,计算摄影或者计算机视觉等方面都非常有用。
为了开始RenderScript的学习,这有两个很重要的概念是你需要了解的:
- 高性能的计算内核是通过衍生自C99的语言编写的。
- 有专用的Java API用于管理RenderScript的资源生命周期以及控制内核的执行。
编写一个RenderScript内核
一个RenderScript内核通常是驻留在<project_root>/src/目录下的一个.rs文件。每个.rs文件被称之为一个脚本。每个脚本文件包含了它自己的一套内核,函数和变量。一个脚本文件可以包含以下内容:
编译声明(#pragma version(1)),声明脚本文件所使用的内核语言版本,目前1是唯一的有效值。
编译声明(#pragma rs java_package_name(com.example.app)),声明脚本文件关联Java类的包名。请注意,你的.rs文件必须是应用程序包的一部分,而不是一个library项目。
一些可调用函数。可调用函数是一个单线程的RenderScript函数,你可以通过参数从java代码进行调用。这些往往对于初始设置或者更大处理管道的串行计算非常有用。
一些全局变量。全局脚本变量其实等同于C语言变量。你可以通过java代码访问这些全局脚本变量,这些变量往往是作为参数传递到RenderScript内核。
-
一些计算内核。一个内核是通过并行函数去处理每一个Allocation中的Element。
一个简单的内核可能看起来就像下面这样:uchar4 __attribute__((kernel)) invert(uchar4 in, uint32_t x, uint32_t y) { uchar4 out = in; out.r = 255 - in.r; out.g = 255 - in.g; out.b = 255 - in.b; return out; }
在很多方面,这等同于一个标准的C函数。第一个显著的特点是_attribute_((kernel))适用于函数原型。它表示该函数是一个RenderScript内核而不是一个可调用的功能。下一个特点是in参数和它的类型。在RenderScript内核里,这是一个特别的参数,它会根据输入的Allocation自动填充,传递给内核启动。内核会执行每一个Allocation中的Element,因此默认情况下,内核会在整个Allocation中运行。第三个显著的特点是内核的返回类型。从内核返回的值会自动写入到输出Allocation的适当位置。RenderScript会在运行时进行检查,确保Allocation中输入输出的Element类型是和内核中的原型相匹配的。如果它们不匹配,将会抛出异常。
一个内核可能有一个输入的Allocation,一个输出的Allocation,或者两个都有。一个内核可能不会有超过一个的输入或输出Allocation。如果需要超过一个的输入和输出,那这些对象需要被绑定到rs_allocation的全局脚本,通过rsGetElementAt_type()或者rsSetElementAt_type()进行内核访问或函数调用。
一个内核可以通过使用x,y,z参数来访问当前执行的坐标。这些参数是可选的,但是坐标参数的类型必须是uint32_t。
- 一个可选的init()函数。init()函数是一个特殊的功能函数,它在脚本实例化完成后运行。这使得一些计算可以在脚本创建后自动运行。
- 一些静态全局变量和函数。一个静态全局变量相当于全局变量只不过不能通过java代码进行设置。一个静态函数相当于一个标准的C函数,能够被内核或其他脚本中的功能函数进行调用,但是不暴露给Java API。如果一个脚本变量或者函数不需要被Java代码调用,那强烈建议将其声明为静态的(static)。
设置浮点数精度
你可以通过脚本控制浮点数的精度级别。如果不需要完整的IEEE 754-2008标准(默认情况下使用),这非常有用。下面的这些声明可以为浮点数精度设置不同的级别:
- #pragma rs_fp_full(没有指定会默认声明):针对需要浮点数精度为IEEE 754-2008标准的应用。
- #pragma rs_fp_relaxed :针对不需要严格遵循IEEE 754-2008标准,并且可以接受精度要求不高的应用。This mode enables flush-to-zero for denorms and round-towards-zero.
- #pragma rs_fp_imprecise : 针对没有严格精度要求的应用。这个模式允许在rs_fp_relaxed模式中的以下内容:
- -0.0的操作结果可以通过返回+0.0代替。
- INF和NAN的操作是不确定的。
大多数应用可以使用rs_fp_relaxed,没有任何的副作用。这可能在某些结构上非常有利,由于只需要适配宽松的进度而带来一些优化(例如SIMD的CPU指令)。
访问RenderScript API接口
当开发一款应用使用到RenderScript,你可以通过两种方式来访问它的API:
- android.renderscript - 这个包里的API允许运行在Android 3.0(API 11)以及更高的设备上。
- android.support.v8.renderscript - 这是Support Library的一个兼容包,使得API可以运行在Android 2.2(API 8)以及更高的设备上。
我们强烈建议使用Support Library APIs来访问RenderScript的接口,因为它提供了更广泛的设备兼容性。如果需要为特定版本的Android开发应用,可以使用android.renderscript。
使用RenderScript Support Library APIs
为了使用Support Library RenderScript的API,你必须确保你的开发环境能够访问到它们。下面的Android SDK工具是使用这些API所需要的:
- Android SDK Tools revision 22.2 or higher
- Android SDK Build-tools revision 18.1.0 or higher
你可以在Android SDK Manager里面检查并更新这些工具。
使用Support Library RenderScript的API:
- 确保已经安装了所需要的Android SDK版本以及构建工具。
- 更新Android构建过程的配置,加入RenderScript的配置:
打开你的应用模块的build.gradle文件
-
添加RenderScript的配置
android { compileSdkVersion 23 buildToolsVersion "23.0.3" defaultConfig { minSdkVersion 8 targetSdkVersion 19 renderscriptTargetApi 18 renderscriptSupportModeEnabled true } }
上述构建过程中的配置控制着不同的行为:
- renderscriptTargetApi - 指定生成的字节码版本。我们建议你设置这个值为能够提供你正在使用的所有功能的最低API级别,同时设置renderscriptSupportModeEnabled为true。这个设置的有效值为11到最近发布的API级别值。如果你的应用程序配置文件里面指定的最小SDK版本设置为不同的值,那这个值将会被忽略,构建文件中的目标版本值用来设置最低SDK版本。
- renderscriptSupportModeEnabled - 如果运行的设备不支持该目标版本,那么可以指定生成的字节码回落到一个兼容的版本。
- buildToolsVersion - Android 构建工具所使用的版本。这个值应该被设置为18.1.0或者更高。如果这个可选的配置没有被指定,那么将会默认使用安装的最高版本的构建工具。你应该总是设置这个值,以确保不同开发设备不同配置之间的一致性。
-
在你使用RenderScript的类文件里面,导入Support Library的类:
import android.support.v8.renderscript.*;
通过Java代码使用RenderScript
通过Java代码来使用RenderScript依赖于位于android.renderscript或android.support.v8.renderscript包中的API类。大多数应用都遵循基本的使用模式:
初始化一个RenderScript上下文。RenderScript上下文,通过create(Context)方法进行创建,确保RenderScript能过被使用,同时提供一个对象来控制所有后续的RenderScript对象的生存期。你应该考虑创建一个长期运行的context,因为它可以创建不同的硬件资源。通常,一个应用程序只能持有一个RenderScript单例。
创建至少一个Allocation传递到脚本中。一个Allocation是一个RenderScript对象,提供固定数据的存储。脚本中的内核,采取Allocation对象作为它们的输入和输出,同时Allocation对象可以在绑定全局脚本变量的时候,通过调用rsGetElementAt_type()和rsSetElementAt_type()方法在内核中进行访问。Allocation对象运行数组从Java代码中传递到RenderScript代码,反之亦然。Allocation对象创建最典型的方式是使用createTyped(RenderScript, Type)或者createFromBitmap(RenderScript, Bitmap)。
-
创建脚本是必要的。在使用RenderScript时,提供两种类型的脚本:
-
ScriptC:这些是写在上述RenderScript内核中的用户自定义脚本。为了使Java代码能够更容易访问到脚本代码,每个脚本都会通过RenderScript编译器反射为一个具体的Java类。这些类的名字为ScriptC_filename。例如,你的内核位于invert.rs,并且一个RenderScript上下文已经位于mRS,Java代码实例化脚本为:
ScriptC_invert invert = new ScriptC_invert(mRenderScript);
ScriptIntrinsic:这些是内置在RenderScript内核的共同操作,比如高斯模糊,图像混合等等。想了解更多信息,请参阅ScriptIntrinsic的子类。
-
用数据填充Allocation对象。除了通过android.renderscript创建Allocation对象,一个Allocation对象会在第一次创建的时候被填充空数据。为了填充一个Allocation对象,使用Allocation方法中的copy方法。
设置所有需要的全局变量。全局变量可以使用同一ScriptC_filename类里面,名为set_globalname的方法进行设置。例如,为了设置一个名为elements的int值,使用java方法set_elements(int)。RenderScript对象也可以在内核里面进行设置;例如,名为lookup的rs_allocation变量,可以通过方法set_lookup(Allocation)进行设置。
启动相应的内核。启动指定内核的方法,体现在相同的具有名为forEach_kernelname()方法的ScriptC_filename类。这些启动是异步的,并会通过启动的顺序进行序列化。根据传递给内核的不同参数,这些方法将会采取一个或两个Allocation对象。默认情况下,一个内核会执行整个输入或者输出Allocation;为了执行Allocation的子集,可以通过适当的Script.LaunchOptions作为最后一个参数传递给forEach方法。调用的函数可以通过反射ScriptC_filename内中的invoke_functionname方法进行调用。
复制Allocation对象的数据。为了从Java代码访问到Allocation对象的数据,必须使用Allocation的copy方法将数据拷贝到Java的缓冲区中。
回收RenderScript上下文。RenderScript的上下文可以通过destroy()方法进行回收,或者通过垃圾回收机制进行销毁。这会导致任何想要继续使用这个对象的地方抛出异常。
译者注:以前没了解过RenderScript,所以翻译起来也分外吃力,很多地方可能存在一些理解上的误差,在学习过程中会继续校正,如果大家在阅读过程中遇到问题,也请直接查看原文。附上几个例子,以加深对RenderScript的理解:
使用RenderScript实现图片高斯模糊效果
-
build.gradle添加RenderScript配置
apply plugin: 'com.android.application' android { compileSdkVersion 23 buildToolsVersion "23.0.3" defaultConfig { minSdkVersion 14 targetSdkVersion 23 versionCode 1 versionName "1.0" renderscriptTargetApi 19 renderscriptSupportModeEnabled true } buildTypes { release { minifyEnabled false proguardFiles getDefaultProguardFile('proguard-android.txt'), 'proguard-rules.pro' } }
-
自定义BlurBitmap类,实现高斯模糊方法
public class BlurBitmap { private static final float BITMAP_SCALE = 1.0f; private static final float BLUR_RADIUS = 25; public static Bitmap blur(Context context, Bitmap image) { int width = Math.round(image.getWidth() * BITMAP_SCALE); int height = Math.round(image.getHeight() * BITMAP_SCALE); Bitmap inputBitmap = Bitmap.createScaledBitmap(image, width, height, false); Bitmap outputBitmap = Bitmap.createBitmap(inputBitmap); RenderScript rs = RenderScript.create(context); ScriptIntrinsicBlur theIntrinsic = ScriptIntrinsicBlur.create(rs, Element.U8_4(rs)); Allocation tmpIn = Allocation.createFromBitmap(rs, inputBitmap); Allocation tmpOut = Allocation.createFromBitmap(rs, outputBitmap); theIntrinsic.setRadius(BLUR_RADIUS); theIntrinsic.setInput(tmpIn); theIntrinsic.forEach(tmpOut); tmpOut.copyTo(outputBitmap); return outputBitmap; } }