zoukankan      html  css  js  c++  java
  • spark-4-文件读写

    hdfs文件读写报错:

    AccessControlException: Permission denied: user=root, access=WRITE, inode="/user/chaojunwang":chaojunwang:supergroup:drwxr-xr-x

     

    【解决方法】

    1. 不要sudo启动hadoop或pyspark

    2. 在hadoop路径下  ./bin/hdfs dfs -chmod 777 /user   修改 hdfs 文件系统中/user/chaojunwang 路径的权限

    3. 在pyspark中即可完成 hdfs 的文件读写

    >>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/word.txt")
    >>> textFile.saveAsTextFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
    >>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
    >>> textFile.first()
    'It is a start for me to pyspark learning.'
    

      

     

  • 相关阅读:
    SQL SELECT DISTINCT 语句
    SQL SELECT 语句
    SQL 语法
    Linux 命令大全
    MySQL 安装
    Nginx 安装配置
    linux yum 命令
    Linux 磁盘管理
    Linux 文件与目录管理
    Linux 用户和用户组管理
  • 原文地址:https://www.cnblogs.com/chaojunwang-ml/p/13285061.html
Copyright © 2011-2022 走看看