环境
centos
安装PyCharm和py4j
下载安装最新版本的PyCharm,官网地址: https://www.jetbrains.com/pycharm/download/
安装步骤:
- tar -xzvf XXXX.tar.gz
2.避免出现pycharm只读文件的情况
进入到bin目录下
sudo ./pycharm.sh 安装
并且在最后一步安装界面的时候,要选择for all users
3.安装pip (yum install pip)
4.安装py4j:
sudo pip install py4j
配置PyCharm
选择“Run” ->“Edit Configurations” ->“Environment variables”
增加SPARK_HOME目录与PYTHONPATH目录。 - SPARK_HOME:Spark安装目录 - PYTHONPATH:Spark安装目录下的Python目录
因为我的spark集群建立在hadoop上
我还添加了HADOOP_HOME、JAVA_HOME
问题
no ascii in /usr/bin/pythn2.7
解决
添加了两个/usr/bin/pythn2.7
未解决问题
kafka需要引入jar
pycharm 不知道如何引用