前言
这篇文章简单介绍下移动端Android系统下利用OpenSL ES进行音频采集方法。
按照惯例先上一份源码 AudioRecordLib 。
OpenSL ES采集的核心实现在于 openslescore.cpp 这个文件。
权限申请
想要使用OpenSL ES,需要在AndroidManifest.xml的配置文件里面增加权限
<uses-permission android:name="android.permission.RECORD_AUDIO"/>
OpenSL ES开发简介
什么是OpenSL ES
OpenSL ES全称为Open Sound Library for Embedded Systems,即嵌入式音频加速标准。OpenSL ES是无授权费、跨平台、针对嵌入式系统精心优化的硬件音频加速 API。它为嵌入式移动多媒体设备上的本地 应用程序开发者提供了标准化、高性能、低响应时间的音频功能实现方法,同时还实现了软/硬件音频性能的直接跨平台部署,不仅降低了执行难度,而且促进了高级音频市场的发展。
OpenSL ES架构原理
虽然OpenSL ES是基于C语言设计的API,但是其实基于对象和接口提供服务的,采用了面向对象的思想来开发API。
这里简单说一下OpenSL ES里面的对象和接口的概念:
- 对象:类似于C++中类用来提供一组资源极其状态的抽象,也就是我们可以根据特定类型type(例如音频录制type)来获取一个音频录制的对象,但是对于这个对象我们并不能直接操作(换句话讲也就是我们不能直接在这个对象调用开始/结束录制的逻辑)。
- 接口:接口是对象提供一组特定功能方法的抽象,也就是可以从对象中获取接口(例如从录制对象中获取录制接口),然后通过接口来改变对象的状态(例如通过接口设置开始录制)以便使用对象的功能(对于就是录制功能)。
PS:对象可以有一个或者多个接口的实例,但是接口实例肯定只属于一个对象,以上就是OpenSL ES的开发理念。
引用相关库文件以及头文件
怎么导入OpenSL ES库
CMake方式:CMakeList.txt中加入
#找打Android lib库里面的libOpenSLES.so的库
find_library( OpenSLES-lib
OpenSLES )
#链接到你的native工程的库
target_link_libraries( your-native.so
${OpenSLES-lib}
)
NDK Build方式:在Makefile文件Android.mk添加链接选项
LOCAL_LDLIBS = -lOpenSLES
引入头文件
#include <SLES/OpenSLES.h>
#include <SLES/OpenSLES_Android.h>
创建引擎对象
简单介绍下入口slCreateEngine()这个全局方法:
SL_API SLresult SLAPIENTRY slCreateEngine(
SLObjectItf *pEngine, //对象地址,用于传出对象
SLuint32 numOptions, //配置参数数量
const SLEngineOption *pEngineOptions, //配置参数,为枚举数组
SLuint32 numInterfaces, //支持的接口数量
const SLInterfaceID *pInterfaceIds, //具体的要支持的接口,是枚举的数组
const SLboolean *pInterfaceRequired //具体的要支持的接口是开放的还是关闭的,也是一个数组,这三个参数长度是一致的
);
一个较为完整的创建过程代码示例:
SLObjectItf engine_object; //引擎对象
SLEngineItf engine_engine; //引擎接口
//调用全局方法创建一个引擎对象(OpenSL ES唯一入口)
slCreateEngine(&engine_object, 0, NULL, 0, NULL, NULL);
//实例化这个对象
(*engine_object)->Realize(engine_object, SL_BOOLEAN_FALSE);
//从这个对象里面获取引擎接口
(*engine_object)->GetInterface(engine_object, SL_IID_ENGINE, &engine_engine);
当然调用每一个API后要检测其返回值是否等于 SL_RESULT_SUCCESS,限于篇幅就在上面代码没有处理,后续的示例代码也是同理。
设置IO设备(麦克风) 输入输出
我们需要设置采集设备的一些输入输出配置:
//设置IO设备(麦克风)
SLDataLocator_IODevice io_device = {
SL_DATALOCATOR_IODEVICE, //类型 这里只能是SL_DATALOCATOR_IODEVICE
SL_IODEVICE_AUDIOINPUT, //device类型 选择了音频输入类型
SL_DEFAULTDEVICEID_AUDIOINPUT, //deviceID 对应的是SL_DEFAULTDEVICEID_AUDIOINPUT
NULL //device实例
};
SLDataSource data_src = {
&io_device, //SLDataLocator_IODevice配置输入
NULL //输入格式,采集的并不需要
};
//设置输出buffer队列
SLDataLocator_AndroidSimpleBufferQueue buffer_queue = {
SL_DATALOCATOR_ANDROIDSIMPLEBUFFERQUEUE, //类型 这里只能是SL_DATALOCATOR_ANDROIDSIMPLEBUFFERQUEUE
2 //buffer的数量
};
//设置输出数据的格式
SLDataFormat_PCM format_pcm = {
SL_DATAFORMAT_PCM, //输出PCM格式的数据
num_channels, //输出的声道数量
SL_SAMPLINGRATE_44_1, //输出的采样频率,这里是44100Hz
SL_PCMSAMPLEFORMAT_FIXED_16, //输出的采样格式,这里是16bit
SL_PCMSAMPLEFORMAT_FIXED_16, //一般来说,跟随上一个参数
SL_SPEAKER_FRONT_LEFT|SL_SPEAKER_FRONT_RIGHT, //双声道配置,如果单声道可以用 SL_SPEAKER_FRONT_CENTER
SL_BYTEORDER_LITTLEENDIAN //PCM数据的大小端排列
};
SLDataSink audioSink = {
&buffer_queue, //SLDataFormat_PCM配置输出
&format_pcm //输出数据格式
};
创建录制器
主要是创建录制对象和获取录制相关的接口:
SLObjectItf recorder_object; //录制对象,这个对象我们从里面获取了2个接口
SLRecordItf recorder_recoder; //录制接口
SLAndroidSimpleBufferQueueItf recorder_buffer_queue; //Buffer接口
//创建录制的对象,并且指定开放SL_IID_ANDROIDSIMPLEBUFFERQUEUE这个接口
const SLInterfaceID id[1] = {SL_IID_ANDROIDSIMPLEBUFFERQUEUE};
const SLboolean req[1] = {SL_BOOLEAN_TRUE};
(*engine_engine)->CreateAudioRecorder(engine_engine, //引擎接口
&recorder_object, //录制对象地址,用于传出对象
&data_src, //输入配置
&audioSink, //输出配置
1, //支持的接口数量
id, //具体的要支持的接口
req //具体的要支持的接口是开放的还是关闭的
);
//实例化这个录制对象
(*recorder_object)->Realize(recorder_object, SL_BOOLEAN_FALSE);
//获取录制接口
(*recorder_object)->GetInterface(recorder_object, SL_IID_RECORD, &recorder_recoder);
//获取Buffer接口
(*recorder_object)->GetInterface(recorder_object, SL_IID_ANDROIDSIMPLEBUFFERQUEUE, &recorder_buffer_queue);
设置数据回调并且开始录制
设置开始录制状态,并通过回调函数获取录制的音频PCM数据:
int8_t *pcm_data; //数据缓存区
//申请一块内存,注意RECORDER_FRAMES是自定义的一个宏,指的是采集的frame数量,具体还要根据你的采集格式(例如16bit)计算
pcm_data = static_cast<int8_t *>(malloc(sizeof(int8_t) * RECORDER_FRAMES));
//设置数据回调接口bqRecorderCallback,最后一个参数是可以传输自定义的上下文引用
(*recorder_buffer_queue)->RegisterCallback(recorder_buffer_queue, bqRecorderCallback, this);
//设置录制器为录制状态 SL_RECORDSTATE_RECORDING
(*recorder_recoder)->SetRecordState(recorder_recoder, SL_RECORDSTATE_RECORDING);
/在设置完录制状态后一定需要先Enqueue一次,这样的话才会开始采集回调
(*recorder_buffer_queue)->Enqueue(recorder_buffer_queue, pcm_data, RECORDER_FRAMES);
//数据回调函数
static void bqRecorderCallback(SLAndroidSimpleBufferQueueItf bq, void *context)
{
//从pcm_data获取RECORDER_FRAMES长度的PCM数据
//注意这个是另外一条采集线程回调,可能需要加一个变量recodering控制退出采集
if (recodering)
{
pcm_write(pcm_data, RECORDER_FRAMES);
//取完数据,需要调用Enqueue触发下一次数据回调
(*recorder_buffer_queue)->Enqueue(recorder_buffer_queue, pcm_data, RECORDER_FRAMES);
}
}
停止录制和释放OpenSL ES资源
如果我们不需要采集了,需要调用接口停止采集并在适当的时机释放OpenSL ES相关资源。
//设置录制器为停止状态 SL_RECORDSTATE_STOPPED
(*recorder_recoder)->SetRecordState(recorder_recoder, SL_RECORDSTATE_STOPPED);
//只需要销毁OpenSL ES对象,接口不需要做Destroy处理。
(*recorder_object)->Destroy(recorder_object);
(*engine_object)->Destroy(engine_object);
//释放缓存区内存
free(pcm_data);
这样就完整的结束了OpenSL ES的采集业务。
播放PCM文件
Audacity这个工具可以导入pcm原始文件,并且提供了波形图查看和播放功能。
操作流程是:
文件 => 导入 => 原始数据 => 设置PCM数据格式 => 导入
具体效果图如下:
结语
上一篇博客了介绍了Android利用AudioRecord进行录音导出PCM数据。
本文同步发布于简书、CSDN。
End!