字数:
新字数: 分词数:
搜索模式:
;
输出分隔符:
;
其它选项:
中文词性标注对照表
词性 | 词性 | 词性 | |||
a | 形容词 | Ag | 形语素 | an | 名形词 |
ad | 副形词 | b | 区别词 | c | 连词 |
d | 副词 | Dg | 副语素 | e | 叹词 |
f | 方位名词 | g | 语素 | h | 前接成分 |
i | 成语 | j | 简称略语 | k | 后接成分 |
l | 习用语 | m | 数词 | Ng | 名语素 |
n | 名词 | nr | 人名 | ns | 地名 |
nt | 机构团体 | nz | 其他专名 | o | 拟声词 |
p | 介词 | q | 量词 | r | 代词 |
s | 处所名词 | t | 时间名词 | Tg | 时语素 |
u | 助词 | Vg | 动语素 | v | 动词 |
vd | 副动词 | vn | 名动词 | w | 标点符号 |
x | 非语素字 | y | 语气词 | z | 状态词 |
nx | 字符串 |
关于中文分词工具
基本介绍
本工具的词法分析模块向用户提供精确模式分词、搜索引擎模式分词、词性标注三大功能。该服务能够识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性
技术原理
基于大数据和用户行为的分词、词性标注,定位基本语言元素,消除歧义,支撑自然语言的准确理解
中文分词
中文分词是将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列的过程
词性标注
词性标注主要被应用于文本挖掘和NLP领域,是各类基于文本的机器学习任务,例如语义分析和指代消解的预处理步骤。
开源说明
"Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word
segmentation module.