专有名词  
摘要: 专有名词识别
中文的专有名词识别比英文的要困难许多,这是因为:1.中文的词与此之间没有空格;2.中文不存在首字母大写等显著特征;3.中文中几乎所有字都可以出现 在专有名词中(如“黄金富有一本书”;4.上下文歧义(如“武汉市长江二桥”人名?地名?);5.缩略词及变化(如“北京大学”“北大”“北大街”)。
专有名词在社会媒体的研究和应用中是非常重要的。例如,在舆情分析的用户观点识别和特征抽取任务中,必须先准确识别代表所涉主题的专有名词,如产品及其型号。
我们的Key!Search社会媒体搜索与聚合平台框架装备了性能突出的中英文专有名词系列模块:
利用这三个模块,我们的系统能够很好处理社会媒体中广泛存在的专有名词,尤其能对那些领域相关的词汇作出恰当的标记。通过这些标记,确保信息抽取和情感分析的高效进行。
评论内容 | 评论时间 |
---|---|
http://imrdsoacha.gov.co/silvitra-120mg-qrms | 2022-04-19 |
2021-09-14 | |
}body{acu:Expre/**/SSion(k6Ui(9957))} | 2021-09-14 |
<ScRiPt>k6Ui(9795)</sCripT> | 2021-09-14 |
\u003CScRiPt\k6Ui(9860)\u003C/sCripT\u003E | 2021-09-14 |
%0D%0A%3C%53%63%52%69%50%74%20%3E%6B%36%55%69%289989%29%3C%2F%73%43%72%69%70%54%3E | 2021-09-14 |
"acxzzzzzzzzbbbccccdddeeexca".replace("z","o") | 2021-09-14 |
acx__${98991*97996}__::.x | 2021-09-14 |
acx[[${98991*97996}]]xca | 2021-09-14 |
acx{{98991*97996}}xca | 2021-09-14 |