监测语料库系统工作

目前系统的功能模块:监测语料库、特征趋势分析、地域分析、用户画像。

监测语料库:根据日期区间,查看数据库中语料的具体情况。

特征趋势分析:对三种语料(微博、博客、论坛)在三个特征上分别按月份算出平均得分,并以趋势图的形式描述了出来,趋势图下方是对应特征的前 100 篇得分最高的文章。

地域分析:对微博语料按中国 34 个省份统计,用柱状图分别把三种特征的平均得分从高到低展示出来;并在下方以中国地图的形式展示每个省份的情况,地图可以对得分按区间选中相应省份。

用户画像:用户画像首页以表格的形式展示出了相应语料下,发表文章数量降序排列的用户信息,点击相应用户后面的用户画像链接,进入该用户的画像页面,该页面展示了该用户的三种特征得分按月均分的趋势图,该用户按时间降序发表的文章信息,包括其对应的各个特征的得分。

现阶段主要的工作是整合了打分程序,把博客、微博的三种特征(暴力指数、不规范指数、文化水平)的论坛数据解析,然后将得分插入到了数据库以及后台数据库的整理工作。

最后根据大家的反馈,修改页面、完善系统。


Copyright © 2015 国家社科基金重大项目 互联网环境下的语言生活方式与建设和谐的网络语言生活研究课题组版权所有
联系方式:华中师范大学计算机学院 邮政编码:430000 总访问量:117354次,当日访问:117354次 [管理入口]