创建简单序列分类网络
本示例说明了如何创建简单的长期短期记忆(LSTM)分类网络。
要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。 LSTM网络是一种递归神经网络(RNN),用于学习序列数据的时间步长之间的长期依赖关系。
该示例演示如何:•加载序列数据。
•定义网络体系结构。
•指定训练选项。
•训练网络。
•预测新数据的标签并计算分类准确性。
1)导入数据
如[1]和[2]中所述加载日语元音数据集。 预测变量是一个单元阵列,其中包含长度可变的特征维为12的序列。标签是标签1,2,...,9的分类向量。
[XTrain,YTrain] = japaneseVowelsTrainData; [XValidation,YValidation] = japaneseVowelsTestData;
查看前几个训练序列的大小。 序列是具有12行(每个要素一行)和不同列数(每个时间步长一列)的矩阵。
XTrain(1:5)
- 定义网络架构
定义LSTM网络体系结构。 指定输入层中要素的数量,以及完全连接层中的类的数量。
numFeatures = 12;
numHiddenUnits = 100; numClasses = 9;
layers = [ ...
sequenceInputLayer(numFeatures) lstmLayer(numHiddenUnits,'OutputMode','last') fullyConnectedLayer(numClasses) softmaxLayer classificationLayer];
3)训练网络
指定训练选项并训练网络。
由于小批量生产的序列短,因此CPU更适合训练。 将“ ExecutionEnvironment”设置为“ cpu”。 要在GPU上进行训练(如果有),请将'ExecutionEnvironment'设置为'auto'(默认值)。
miniBatchSize = 27;
options = trainingOptions('adam', ...
'ExecutionEnvironment','cpu', ...
'MaxEpochs',100, ...
'MiniBatchSize',miniBatchSize, ...
'ValidationData',{XValidation,YValidation}, ...
'GradientThreshold',2, ...
'Shuffle','every-epoch', ...
'Verbose',false, ...
'Plots','training-progress');
net = trainNetwork(XTrain,YTrain,layers,options);
有关指定训练选项的更多信息,请参见“设置参数和训练卷积神经网络”。
- 测试网络
对测试数据进行分类并计算分类精度。 指定用于训练的相同小批量大小。
YPred = classify(net,XValidation,'MiniBatchSize',miniBatchSize);
acc = mean(YPred == YValidation)
acc=0.9351
对于下一步,您可以尝试使用双向LSTM(BiLSTM)层或创建更深的网络来提高准确性。 有关更多信息,请参见“长短期存储网络”。
有关显示如何使用卷积网络对序列数据进行分类的示例,请参见“使用深度学习的语音命令识别”。
References
1 M. Kudo, J. Toyama, and M. Shimbo. "Multidimensional Curve Classification Using Passing-Through Regions." Pattern Recognition Letters. Vol. 20, No. 11–13, pages 1103–1111.
2 UCI Machine Learning Repository: Japanese Vowels Dataset. https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels
See Also
lstmLayer | trainNetwork | trainingOptions
More About
• “Long Short-Term Memory Networks”
• “Try Deep Learning in 10 Lines of MATLAB Code” on page 1-12
• “Classify Image Using Pretrained Network” on page 1-15
• “Get Started with Transfer Learning” on page 1-18
• “Transfer Learning with Deep Network Designer”
• “Create Simple Image Classification Network” on page 1-22