HCL2000

HCL2000是由北京邮电大学模式识别与智能系统实验室发布的一种大规模离线手写汉字数据库,供研究界使用。该数据库包含3,755个经常使用的简体中文字符,由1,000名不同的手写者撰写,经过数据的清洗、筛选等操作,将数据整理为深度学习框架直接可用格式,共3,750,016个样本,按照约为6:1的比例划分训练集和测试集,具体说明如下:

训练集

  • train-data.npz——训练集图像数据,图像大小(28,28,1),像素取值(0,255),训练集数据大小(3205016,784)
  • train-labels-3755.npz——3755类汉字标签,取值范围(0,3744),训练集标签大小(3205016,)
  • train-labels-1000.npz——1000类手写者标签,取值范围(0,999),训练集标签大小(3205016,)

测试集

  • test-data.npz——训练集图像数据,图像大小(28,28,1),训练集数据大小(545000,784)
  • test-labels-3755.npz——3755类汉字标签,取值范围(0,3744),训练集标签大小(545000,)
  • test-labels-1000.npz——1000类手写者标签,取值范围(0,999),训练集标签大小(545000,)

参考论文:

[1] Zhang H, Guo J, Chen G, et al. HCL2000-A large-scale handwritten Chinese character database for handwritten character recognition[C]//2009 10th International Conference on Document Analysis and Recognition. IEEE, 2009: 286-290.

[2] Hu P, Xu M, Wu M, et al. Handwritten Style Recognition for Chinese Characters on HCL2020 Dataset[C]//Chinese Conference on Pattern Recognition and Computer Vision (PRCV). Springer, Cham, 2020: 138-150.

下载地址:http://aicoco.net/s/hcl2000

HCL2000》上有47个想法

  1. 老师,您好!贵网站上的HCL2000资料无法下载了,可以提供一个可以下载的链接或者直接发给我么?还有对应的显示程序。万分感谢。

  2. 我在数据堂下载了贵实验室的HCL2000,但是缺少相关.hcl读取软件,可以发给我对应程序么。万分感谢!

  3. 关于HCL2000数据库统一回复如下:

    1. 数据库相关介绍请参考如下论文:
    [1] 郭军, 张洪刚, 蔺志青: 一个新的脱机手写汉字数据库模型及其应用, 电子学报, 2000, Vol.28, No. 5, pp.115-116.
    [2] Hong-gang Zhang, Jun Guo, Guang Chen, and Chun-Guang Li, “HCL2000 — A Large-scale Handwritten Chinese Character Database for Handwritten Character Recognition“, ICDAR 2009, pp.286-290.

    2. 数据库下载与使用:
    请http://www.pris.net.cn/introduction/teacher/lichunguang上HCL2000数据库相关论文处下载数据库使用申请表。把信息填写完整且签字后的申请表发送到申请表上的相应邮箱后,即可获得相应下载链接以及数据读取程序等。

  4. 老师,您好!贵网站上的HCL2000资料无法下载了,可以提供一个可以下载的链接或者直接发给我么?还有对应的显示程序。万分感谢。 我邮箱807876904@qq.com

  5. 老师您好!HCL2000资料无法下载了,能否提供一个可下载的链接或者发给我一份,如幸得此库,临表涕零,不知所云。1786074332@qq.com

发表评论

您的电子邮箱地址不会被公开。