学术报告: Hamming classifier: from one-hot to multi-hot classification

报告题目:Hamming classifier: from one-hot to multi-hot classification

报告时间:10月10日 上午10:00-11:00

报告地点:教三 811会议室

报告简介:肖嵘博士,平安财产险科技中心首席研究员、人工智能部总经理,国家特聘专家,深圳市孔雀A类人才,负责人工智能技术在保险领域的创新研究。肖嵘于2001年获南京大学计算机博士学位,曾供职于微软亚洲研究院和微软雷德蒙研究院18年。

报告摘要:对于多分类问题,很多神经网络优化的是LR(Logistic Regression)的损失函数。这样的模型在处理大规模分类的问题时存在一定的局限性。在本次报告中,我们通过对LR损失函数的分析,揭示了模型输出特征在高维空间的分布特性,并在此基础上引入LSH(Locality Sensitive Hashing)算法对样本的类别进行了编码。这种编码方式,不仅能够显著降低模型复杂度,而且可以表征不同类别之间(语义)关系。基于这种编码方式,我们提出一种汉明分类器(Hamming Classifier)算法,并应用于OCR和NLP领域的识别问题中;该方法在基本不影响识别精度性能的情况下,可以显著降低模型尺寸。

发表评论

电子邮件地址不会被公开。 必填项已用*标注