tfdata - juedaiyuer/researchNote GitHub Wiki
tensorflow 实例数据下载与读取
tensorflow提供一个input_data.py文件,专门用于下载mnist数据,我们直接调用就可以了,代码如下:
import tensorflow.examples.tutorials.mnist.input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
命令行测试,python2工作空间为家目录,mnist数据在目录,已经下载完成
/home/juedaiyuer/MNIST_data
测试代码如下
>>> import tensorflow as tf
>>> import tensorflow.examples.tutorials.mnist.input_data as input_data
>>> mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz
input_data文件会调用一个maybe_download函数,确保数据下载成功。这个函数还会判断数据是否已经下载,如果已经下载好了,就不再重复下载。
了解mnist数据集
训练数据集,图片部分images和标签部分labels
>>> print mnist.train.images.shape
(55000, 784)
>>> print mnist.train.labels.shape
(55000, 10)
labels是one-hot形式
>>> print mnist.train.labels[0]
[ 0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]