问题描述
最近利用python
构建工作脚本的时候,需要把混用之前的shell
脚本。但是在互相调用的时候,发现原本运行完好的python
脚本出现了寻找文件上的问题。
在python
脚本中,利用了ConfigParser
模块来使用config
文件。
# ...
config = ConfigParser.ConfigParser()
config.read("config.ini")
# ...
config.ini
文件和这个python
脚本处于同一目录中,因此单独运行此脚本的时候,没有任何问题。
之后,由于需要在一个shell
脚本中使用这个脚本,而shell
脚本在另一个目录中,这个时候就出现了找不到文件的问题,表现为config
解析错误。因此,这里我使用了脚本文件的路径来试图补全config
文件的路径。
# ...
config = ConfigParser.ConfigParser()
config.read(os.path.dirname(sys.argv[0]) + "config.ini")
# ...
暂时这个文件表现良好。但是随后这个python
文件需要调用同一文件夹下的另一个模块,这个模块中也使用了config
文件,因此如法炮制,我又使用了上面的方法来加载config.ini
,结果发生了之前同样的错误。经过在网上研究,最终改成如下形式:
# ...
config = ConfigParser.ConfigParser()
config.read(os.path.dirname(os.path.realpath(__file__)) + "config.ini")
# ...
这样最终达成了需求。
原理分析
最开始使用的方法是使用系统搜索路径直接寻找这个文件,在该目录中使用的时候没问题,因为python
会将sys.argv[0]
自行加入sys.path
中。因此可以寻找到本目录的文件。但是换一个目录就找不到这个文件了,因此报错。
第二次使用sys.argv[0]
寻找文件。在被其他模块使用的时候,sys.argv[0]
会变成只有文件名没有路径的形式,因此找不到文件。
第三次使用__file__
,这个是直指本文件路径的,因此可以使用。
相关扩展
os模块的使用
os.sep 可以取代操作系统特定的路径分割符。
os.name字符串指示你正在使用的平台。比如对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'。
os.getcwd()函数得到当前工作目录,即当前Python脚本工作的目录路径。
os.getenv()和os.putenv()函数分别用来读取和设置环境变量。
os.listdir()返回指定目录下的所有文件和目录名。
os.remove()函数用来删除一个文件。
os.system()函数用来运行shell命令。
os.linesep字符串给出当前平台使用的行终止符。例如,Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'。
os.path.split()函数返回一个路径的目录名和文件名。
os.path.isfile()和os.path.isdir()函数分别检验给出的路径是一个文件还是目录。
os.path.existe()函数用来检验给出的路径是否真地存在
os和os.path模块
os.listdir(dirname):列出dirname下的目录和文件
os.getcwd():获得当前工作目录
os.curdir:返回但前目录('.')
os.chdir(dirname):改变工作目录到dirname
os.path.isdir(name):判断name是不是一个目录,name不是目录就返回false
os.path.isfile(name):判断name是不是一个文件,不存在name也返回false
os.path.exists(name):判断是否存在文件或目录name
os.path.getsize(name):获得文件大小,如果name是目录返回0L
os.path.abspath(name):获得绝对路径
os.path.normpath(path):规范path字符串形式
os.path.split(name):分割文件名与目录(事实上,如果你完全使用目录,它也会将最后一个目录作为文件名而分离,同时它不会判断文件或目录是否存在)
os.path.splitext():分离文件名与扩展名
os.path.join(path,name):连接目录与文件名或目录
os.path.basename(path):返回文件名
os.path.dirname(path):返回文件路径
os.path.realpath():返回文件的路径
sys模块的使用
sys.argv
一个包含了脚本名称和传入参数的list
。
sys.path
搜索路径的list,可以通过插入路径的方式添加搜索路径。
sys.builtin_module_names
所有的内建模块。
sys.modules
所有已经导入的模块。
sys.platform
系统平台。
sys.stdout
标准输出。
sys.stderr
标准错误输出。
sys.exit
退出程序。
sys.exitfunc
退出程序的时候调用的函数,可以自己替换。
常用python模块的私有变量
__file__
该脚本的路径
__name__
该脚本的名称。直接调用这个脚本的时候会被给一个省缺值__main__
。可以借此判断执行方式和编写单元测试。
__doc__
这个对象的描述。在模块起始或者类起始用形如
"""
description
"""
这样的方式写出的描述文字。
三种获取路径方式的区别
在之前的介绍中,涉及到了三种获取路径的方式。分别是os.getcwd()
,__file__
和sys.argv[0]
。这三种方式在直接使用脚本的时候返回是基本一致的。但是也有区别。
os.getcwd()
获得的是当前工作目录的路径。与脚本所在路径可能不一致。
__file__
则是脚本的文件名,有时是绝对路径,有时是相对路径,但是都指向了使用该变量的脚本。
sys.argv[0]
是调用脚本的时候使用的文件名。其实相当于调用python
命令的时候的第一个参数。因此,有时候可能没有路径只有文件名。
在使用文件名之前一定要分辨清楚,否则可能会有这次一样,时有时无的报错。