去重后,依据原来列表的顺序进行排序
a = [1,1,4,5,2,2,9,9] m = list(set(a)) m.sort(key=a.index)
处理自然语言,去除停用词
import nltk
nltk.download('stopwords')
[nltk_data] Error loading stopwords: <urlopen error [WinError 10054]
[nltk_data] 远程主机强迫关闭了一个现有的连接。>
输入from nltk.book import *:
手动下载nltk数据集(所有的)https://pan.baidu.com/s/1oUsf-FgVAZnQAtZWRwiK4w 提取码:9sor
然后把下载好的压缩包解压至上图中Searched in的一个目录下。重新输入from nltk.book import *: