python中以一个.py文件作为一个模块,可以在其他模块中使用import语句导入,从而达到代码复用的目的。
多个.py文件放在一个文件夹下,可以作为一个包来统一管理,需要在文件夹下放置一个__init__.py的文件,来控制该包下各个模块的导入。
模块导入时,python编译器会依次查找
1)、程序的主目录
2)、PTYHONPATH目录(如果已经进行了设置)
3)、标准连接库目录(一般在/usr/local/lib/python2.X/)
4)、任何的.pth文件的内容(如果存在的话).新功能,允许用户把有效果的目录添加到模块搜索路径中去。.pth后缀的文本文件中一行一行的地列出目录。
这四个组建组合起来就变成了sys.path了,来寻找对应名称的包和模块。
当需要导入的模块所在的路径不在以上路径下时会报 python ImportError: No module named 'xxx'的错误。我们可以将该目录直接加到PYTHONPATH目录中,这样以后使用是就不用再出现该问题了。如果我们要导入的当前主目录的上级目录,可以使用sys.path.append('..')将上级目录动态添加到查询路径中,这个设置在程序结束后会失效。
使用sys.path.append('..')添加自定义模块时,我使用了一个名为common的包,发现导入不了。改了其他名字又可以了,目前不知道原因。
python应用程序执行中sys.modules会以字典的形式存储导入的所有包、模块的信息,包名、模块的名称为字典的key值。此时导入模块方式和应用程序执行的目录会影响包、模块的名称。即:内部导入时会是部分包名;完全包名对应的模块和部分包名对应的模块会同时存在。即:模块可能会导入两次。
总结:
python的一个优势在于每个python文件都可以直接执行,并给出结果。这对于测试有着很大的好处。但是,同一个项目中的多个自定义的包之间相互引入时,就会出现问题。
一个python项目有着一个顶层包,我们整体执行项目的时候,会从顶层包名称开始,定义内部的各种包,这样我们在内部使用完全包名引入就不会有问题。但是在内部包中,的模块自己执行的时候,顶层包是不存在的,我们只能使用文件夹路径或者绝对引入来引入其他包,这种方法在项目整体执行的时候又会有问题。
python开发脚本和开发项目是不同的。