晓查 发自 凹非寺
量子位 出品 | QbitAI
MNIST数据集是图像分类领域的基准测试之一,用于0~9手写数字图像分类任务,包含6万张训练图像和1万张测试图像。它已经有20多年的历史了。
但是官方测试集因为测试集样本太少,MNIST通常被认为不能提供有意义的置信区间。
现在,来自纽约大学两位研究人员给MNIST测试集再增加5万张图片,叫做QMNIST,获得校友、也是MNIST发起者LeCun转发。
LeCun给予了这个数据集很高的评价,认为它“重生、恢复、扩展”了MNIST。
数据集内容
QMNIST扩展数据集包含以下一些文件。
其中,前两个gz压缩文件和标准MNIST数据文件格式相同,不同的是QMNIST包含6万个测试样本。
前10000个QMNIST测试样本与MNIST测试集是逐一匹配的,后50000个示例是根据MNIST用算法重建的数据集。
使用方法
QMNIST的GitHub页上提供了Pytorch平台的QMNIST数据加载器,需要将数据集下载至与pytorch.py相同的文件夹下将网络下载选项设置为download=’True’。
它与标准的Pytorch MNIST数据加载器兼容。
)
传送门
数据集地址:
https://github.com/facebookresearch/qmnist
论文地址:
https://arxiv.org/abs/1905.10498
— 完 —
为您推荐
想要入坑机器学习?这是MIT在读博士的AI心得
仅需10分钟:开启你的机器学习之路
AI高数解题神器:轻轻一拍,答案就来
Pythia:Facebook最新开源的多任务学习框架
机器学习必学10大算法
本篇文章来源于: 深度学习这件小事
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
内容反馈