机器学习使用tokenizer.fit_on_texts报‘float‘ object has no attribute ‘lower‘错解决办法 - 走看看

zoukankan html css js c++ java

机器学习使用tokenizer.fit_on_texts报‘float‘ object has no attribute ‘lower‘错解决办法
机器学习使用tokenizer.fit_on_texts报'float' object has no attribute 'lower'错解决办法

最近在学习机器。在学习过程中使用kaggle中的Womens Clothing E-Commerce Reviews.csv数据集，用Keras分词器Tokenizer，使用tokenizer.fit_on_texts生成词典报'float' object has no attribute 'lower' 错。
```
from keras.preprocessing.text import Tokenizer 
X_train_lst = df_train["Review Text"] 
y_train = df_train["Rating"].values 
dictionary_size = 20000 
tokenizer = Tokenizer(num_words=dictionary_size) 
tokenizer.fit_on_texts( X_train_lst) 
X_train_tokenized_lst = tokenizer.texts_to_sequences(X_train_lst)
```
分析原因：是数据集中"Review Text"中存在字段为空的情况，pandas导入的时候自动转成NaN了，所以报没有lower的属性的错误。

解决方法：增加fillna函数转换将NaN转成空字符串。
```
X_train_lst = df_train["Review Text"].fillna("")
```
查看全文

相关阅读:
RAD Studio XE2/XE3 官方 ISO 下载地址 (20120905更新)
delphi调用webservice接口时返回result element expected的解决办法
 delphi 线程使用
 App数据格式之解析Json
android 改变文字的大小和字体
 [最新]Visual Assist X 破解版下载(10.7.1929_Patched)
[解决]Win7 操作系统不能安装VMware
android 获取已安装程序列表
 unidac 执行Execute后取得受影响行数。
android 获取所有传感器数据

原文地址：https://www.cnblogs.com/xiejava/p/15541901.html

Copyright © 2011-2022 走看看