• 作者:何晗
  • 分类: 编程

这是一本务实的入门书,助你零起点上手自然语言处理。

HanLP 作者何晗汇集多年经验,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信 息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。

随着本书的学习,你将从普通程序员晋级为机器学习工程师,最后进化到自然语言处理工程师。

何晗(@hankcs)

自然语言处理类库 HanLP 作者(GitHub 加星超过 14 600),“码农场”博主(日活跃读者数超过 3000),埃默里大学计算机博士生,研究方向是句法分析、语义分析与问答系统。

HanLP 和“码农场”是 NLP 领域实用的学习资源,何晗大约每周处理一次 HanLP GitHub上的 Issues。