
上QQ阅读APP看书,第一时间看更新
1.4 如何加载公开数据集:以CIFAR-10为例
CIFAR-10数据集由10个类(飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车)的60000个32×32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。CIFAR-10数据集及其分类示意图如图1-8所示。
【例1-3】 如何下载CIFAR-10数据集并导入MATLAB工作空间。

步骤1:下载CIFAR-10数据集。CIFAR-10数据集的下载地址为https://www.cs.toronto.edu/~kriz/cifar-10-MATLAB.tar.gz。
步骤2:下载之后,CIFAR-10数据集为cifar-10-batches-mat,在C盘的\ Documents\ MAT-LAB的文件夹(注:以读者安装MATLAB的实际路径为准)之中新建一个名为cifar10 Data的文件夹,将cifar-10-batches-mat放到该文件夹下面,如图1-9所示。

图1-8 CIFAR-10数据集及其分类示意图

图1-9 新建cifar10 Data文件夹并将cifar-10-batches-mat放到该文件夹下
步骤3:新建一个名为helperCIFAR10 Data.m的文件,将如下代码输入,并保存,该代码的功能是将CIFAR-10数据集下载并导入,在本节中不作详细讲解。



步骤4:在MATLAB的命令窗口中,输入如下程序代码。

上述程序代码实现了导入CIFAR-10数据集并随机显示其中100幅图像的功能。显示效果如图1-10所示。

图1-10 随机显示的CIFAR-10数据集中的100幅图像