Mac 下编译 Kaldi Android (arm) .so 库

话说之前公司里面一直用到的是 PocketSphinx , 但是在新的项目中有一个应用的场景,这时候发现噪声影响以及识别的精确度方面都不是很理想。于是在 Telegram Channel 里面咨询了下,@nshmyrev 回复建议可以利用 Kaldi DNN 模型,应该会有显著提升。于是考虑转向研究 Kaldi

首先碰到的一个问题是跨平台编译。网上搜索后发现,被引用最多的一篇文章(下文简称“编译指南”)是 compile-kaldi-android,但它是基于 Ubuntu 环境来编译的,也看到了编译 Kaldi 可用的 docker file。但是在Mac环境下又可以怎样成功编译呢?让我们分解来看:

1. 配置Android NDK 以及 独立的编译 toolchain

这部分和编译指南中的大体一致,对不同的平台,没有NDK的需要相应的下载,并且配置ANDROID_NDK 路径。

安装 toolchain :

$ANDROID_NDK/build/tools/make_standalone_toolchain.py --arch arm --api 21 --stl=libc++ --install-dir /tmp/my-android-toolchain

以上命令创建 /tmp/my-android-toolchain/ 文件目录,并且已经包含了 android-21/arch-arm sysroot,以及32位 ARM 架构的工具链可执行文件等。

将 toolchain 加入到系统 PATH中:

export ANDROID_TOOLCHAIN_PATH=/tmp/my-android-toolchain
export PATH=${ANDROID_TOOLCHAIN_PATH}/bin:$PATH

2. 编译 Android 版本的 OpenBLAS

注:考虑到 gfortran 已经是GCC的一部分了,可以选择性安装 gfortran。

下载源码:

git clone https://github.com/xianyi/OpenBLAS

选择 ARMV7 进行编译:

make \
    TARGET=ARMV7 \
    ONLY_CBLAS=1 \
    CC=$ANDROID_TOOLCHAIN_PATH/bin/arm-linux-androideabi-clang \
    AR=$ANDROID_TOOLCHAIN_PATH/bin/arm-linux-androideabi-ar \
    HOSTCC=gcc \
    ARM_SOFTFP_ABI=1 \
    -j4

此处与编译指南中有所不同,如果按它上面的操作,会报出 找不到"crtbegin_so"之类的错误。

安装库文件

make install NO_SHARED=1 PREFIX=`pwd`/install

3. 编译 CLAPACK

git clone https://github.com/simonlynen/android_libs.git

cd android_libs/lapack

打开 jni/Android.mk, 注释掉测试相关的编译指令

# remove some compile instructions related to tests

# LOCAL_MODULE:= testlapack
# LOCAL_SRC_FILES:= testclapack.cpp
# LOCAL_STATIC_LIBRARIES := lapack
# include $(BUILD_SHARED_LIBRARY)

打开 jni/Application.mk

APP_STL := gnustl_static 替换为 APP_STL := c++_shared
APP_ABI := armeabi armeabi-v7a 替换为 APP_ABI := armeabi-v7a。armeabi 已经不再支持了。
文件最后增加 NDK_TOOLCHAIN_VERSION := clang

编译

$ANDROID_NDK/ndk-build

编译完成后会在 obj/local/armeabi-v7a/生成库文件。将生成的库文件拷贝到前面你安装OpenBLAS库文件的目录下(e.g: OpenBlas/install/lib)。Kaldi 将会在这个目录下查找相关的依赖项。

4. 编译 Kaldi

下载源码

git clone https://github.com/kaldi-asr/kaldi.git

编译 OpenFST
查看当前的kaldi tools/Makefile 后发现使用的版本是OpenFST-1.6.7。

cd kaldi/tools
wget -T 10 -t 1 http://www.openfst.org/twiki/pub/FST/FstDownload/openfst-1.6.7.tar.gz
tar -zxvf openfst-1.6.7.tar.gz

cd openfst-1.6.7/

CXX=clang++ ./configure --prefix=`pwd` --enable-static --enable-shared --enable-far --enable-ngram-fsts --host=arm-linux-androideabi LIBS="-ldl"

make -j 4

make install

cd ..

ln -s openfst-1.6.5 openfst

编译源码

cd ../src

打开 matrix/Makefile 文件,将其中的测试文件注释掉(似乎与Clang8.0有关的bug)。

#TESTFILES = matrix-lib-test sparse-matrix-test #matrix-lib-speed-tes
CXX=clang++ ./configure --static --android-incdir=/tmp/my-android-toolchain/sysroot/usr/include/ --host=arm-linux-androideabi --openblas-root=/path/to/OpenBLAS/install

make clean -j

make depend -j

make -j 4

按上述配置已经可以生成所有的静态链接库 .a 文件了,它们分别位于 src 下的各个子目录中:

.//tree/kaldi-tree.a
.//gmm/kaldi-gmm.a
.//online2/kaldi-online2.a
.//util/kaldi-util.a
.//feat/kaldi-feat.a
.//lm/kaldi-lm.a
.//sgmm2/kaldi-sgmm2.a
.//rnnlm/kaldi-rnnlm.a
.//nnet/kaldi-nnet.a
.//decoder/kaldi-decoder.a
.//nnet2/kaldi-nnet2.a
.//chain/kaldi-chain.a
.//nnet3/kaldi-nnet3.a
.//cudamatrix/kaldi-cudamatrix.a
.//ivector/kaldi-ivector.a
.//kws/kaldi-kws.a
.//hmm/kaldi-hmm.a
.//lat/kaldi-lat.a
.//fstext/kaldi-fstext.a
.//transform/kaldi-transform.a
.//matrix/kaldi-matrix.a
.//base/kaldi-base.a

等等,说好的.so文件在哪呢 ?

P.S.

  • 打开 kaldi/src/configure 文件,将
--android-incdir=*)
    android=true;
    threaded_math=false;
    static_math=true;
    static_fst=true;
    dynamic_kaldi=false;
    MATHLIB='OPENBLAS';

其中的 dynamic_kaldi=false 改为 dynamic_kaldi=true

  • 更新 configure,指明库类型为 --shared:
CXX=clang++ ./configure --shared --android-incdir=/tmp/my-android-toolchain/sysroot/usr/include/ --host=arm-linux-androideabi --openblas-root=/path/to/OpenBLAS/install
  • 编译kaldi过程中除去 debugging symbols, 打开 src/kaldi.mk 修改其中的CXXFLAGS 为:
CXXFLAGS = -std=c++11 -I.. -I$(OPENFSTINC) -O1 $(EXTRA_CXXFLAGS) \
           -Wall -Wno-sign-compare -Wno-unused-local-typedefs \
           -Wno-deprecated-declarations -Winit-self -Wno-mismatched-tags \
           -DKALDI_DOUBLEPRECISION=$(DOUBLE_PRECISION) \
           -DHAVE_CXXABI_H -DHAVE_OPENBLAS -DANDROID_BUILD \
           -I$(OPENBLASINC) -I$(ANDROIDINC) -ftree-vectorize -mfloat-abi=softfp \
           -mfpu=neon -pthread \
           -O3 -DNDEBUG
        #    -g # -O0 -DKALDI_PARANOID
  • (已提交PR,最新源码已修复) 打开 src/makefiles/default_rules.mk,将第4行起按平台类型进行配置的部分替换为:
ifeq ($(KALDI_FLAVOR), dynamic)
  ifdef LIBNAME
      LIBFILE = lib$(LIBNAME).so
  endif
  LDFLAGS += -Wl,-rpath -Wl,$(KALDILIBDIR)
  EXTRA_LDLIBS += $(foreach dep,$(ADDLIBS), $(dir $(dep))$(notdir $(basename $(dep))).a)

  XDEPENDS =
else
  ifdef LIBNAME
    LIBFILE = $(LIBNAME).a
  endif
  XDEPENDS = $(ADDLIBS)
endif

具体原因在于,src下各个部分编译动态链接库时需要区分不同的平台类型,而 Makefile 中直接根据 shell 环境下 uname 返回的值来判定的。而这在跨平台编译时是不够充分的,此时的 host=arm-linux-androideabi不能以Mac下的动态链接库的条件直接判定,否则会出现动态链接库不匹配的问题 :

clang80++: error: linker command failed with exit code 1 (use -v to see invocation)
make[1]: *** [libkaldi-matrix.dylib] Error 1
  • 重新编译即可,生成的so文件可在 src/lib/下找到。
make -j clean depend; make -j 4

5. 后记

这次解决跨平台的编译问题将近花了4天的时间,故记录整个过程,希望对后来尝试编译的人有所启示。在这期间非常感谢 compile-kaldi-android的指引, @funcwj 在微信上的交流, google group kaldi-help论坛上面大家的热心回复。

6. 引用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,056评论 5 474
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,842评论 2 378
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 148,938评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,296评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,292评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,413评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,824评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,493评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,686评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,502评论 2 318
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,553评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,281评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,820评论 3 305
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,873评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,109评论 1 258
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,699评论 2 348
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,257评论 2 341

推荐阅读更多精彩内容