本文主要讲统计分词。 中文预处理的一个重要的环节就是对语料进行分词,将一句话或者一个段落拆分成许多独立个体的词,然后方便向量化,接着进行TF-IDF的特征处理。 ...

关注我们的公众号

微信公众号