网上基本上都是处理英文数据的。这个是我之前的一个作业,中文的,供大家参考。
cntext 是专为社会科学实证研究者设计的中文文本分析 Python 库。它不止于词频统计式的传统情感分析,还拥有词嵌入训练、语义投影计算,可从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。 cntext 不追求黑箱预测,而致力于让 ...