pinyin-plus 是一个汉字转拼音的库,有如下特点:
- 拼音数据基于
cc-cedict
、kaifangcidian
开源词库 - 基于拼音词库的数据初始化分词引擎进行
分词
,准确度高,解决多音字
的问题 - 支持繁体字
- 支持自定义词库,词库格式同
cc-cedict
字典格式 - api 简单,分为普通模式、索引模式
使用场景
汉字转拼音,常用于索引引擎场景创建拼音的索引,这个场景的问题一般由两种实现路径,一种是直接使用带拼音的的分词 插件,会自动帮你创建出拼音的索引,还有一种就是自己将汉字转换为拼音字符串,采用空格分隔分词来达到定制化索引的目的。 不论哪种实现路径,都离不开分词和拼音转换。pinyin-plus
的特点是,索引分词的词库和拼音的词库是基于同一套词库, 所以多音词的准确度特别高,而且词库的格式保留了开源词典的格式,词库可以轻松的定时更新。同时也预留了自定义词库的扩展 接口,保留定制化需求的高优先级