本文主要讲统计分词。 中文预处理的一个重要的环节就是对语料进行分词,将一句话或者一个段落拆分成许多独立个体的词,然后方便向量化,接着进行TF-IDF的特征处理。 在英语中,单词本身就是“词 … Continue reading NLP(一):jieba分词
本文主要讲统计分词。 中文预处理的一个重要的环节就是对语料进行分词,将一句话或者一个段落拆分成许多独立个体的词,然后方便向量化,接着进行TF-IDF的特征处理。 在英语中,单词本身就是“词 … Continue reading NLP(一):jieba分词