tfdata - juedaiyuer/researchNote GitHub Wiki

tensorflow 实例数据下载与读取

tensorflow提供一个input_data.py文件,专门用于下载mnist数据,我们直接调用就可以了,代码如下:

import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

命令行测试,python2工作空间为家目录,mnist数据在目录,已经下载完成

/home/juedaiyuer/MNIST_data

测试代码如下

>>> import tensorflow as tf
>>> import tensorflow.examples.tutorials.mnist.input_data as input_data
>>> mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz

input_data文件会调用一个maybe_download函数,确保数据下载成功。这个函数还会判断数据是否已经下载,如果已经下载好了,就不再重复下载。

了解mnist数据集

训练数据集,图片部分images和标签部分labels

>>> print mnist.train.images.shape
(55000, 784)

>>> print mnist.train.labels.shape
(55000, 10)

labels是one-hot形式

>>> print mnist.train.labels[0]
[ 0.  0.  0.  0.  0.  0.  0.  1.  0.  0.]

source