R读取中文文件的问题 - 走看看

zoukankan html css js c++ java

R读取中文文件的问题
用R读取中文文本（UTF-8），经常无端出错，常常指定了sep=" “，结果仍然有字段内部仍然包含" "。分隔符换成 ”,"也不行！

更郁闷的是，read.table 读出来的域数量，竟然比 count.fields 返回的少。

最终解决的方法是，在分隔符前后加上空格。读取的时候再把空格去掉，这样问题就解决了。有相同问题的可以试试。
cat data.csv | iconv -f UTF-16 -t UTF-8 | sed "s/ / /g" > df.csv read.csv("df.csv", sep=" ", header=TRUE, encoding="UTF-8", strip.white=TRUE)
查看全文

相关阅读:
IBM实习
 软件测试——一些想法
 ftp文件上传下载实用命令
 Json解析，Json-lib
eclipse Swt编程—窗口小部件widget
Java 泛型
 我的理想与现实
 Java泛型介绍——HashMap总结
 Java语言面向对象的一些基本特点
 Java的一些常见问题，JRE,JDK,JVM,包等概念理解

原文地址：https://www.cnblogs.com/kidoln/p/3876140.html

Copyright © 2011-2022 走看看