我们正在使用部署在Windows和Linux上的代码存储库-有时在不同的目录中。项目中的一个模块应该如何引用项目中的一个非python资源(CSV文件等)?

如果我们这样做:

thefile = open('test.csv')

or:

thefile = open('../somedirectory/test.csv')

只有当脚本从一个特定目录或目录的一个子集运行时,它才会工作。

我想做的是:

path = getBasePathOfProject() + '/somedirectory/test.csv'
thefile = open(path)

这可能吗?


当前回答

尝试使用相对于当前文件路径的文件名。'./my_file'示例:

fn = os.path.join(os.path.dirname(__file__), 'my_file')

在Python 3.4+中,你也可以使用pathlib:

fn = pathlib.Path(__file__).parent / 'my_file'

其他回答

既然你说你有一些代码要部署到不同的地方,你应该使用python生态系统来分发资源,而不仅仅局限于文件。它还支持访问zip归档中的文件,这可以很好,这样您就不必为此烦恼了。

以前,这是通过setuptools中的pkg_resources来处理的,但是随着越来越多的工具出现,生态系统已经发生了变化。从python 3.7开始,你应该使用importlib.resources

import importlib.resources
with importlib.resources.open_text('mypackage.somedirectory','text.csv') as f:
    print(f.read()) # or whatever

但是您还必须指示安装程序包含包资源。否则,pip install mypackage不会捆绑数据文件。

有很多方法可以做到这一点,但其中一种方法是添加

[options.package_data]
mypackage = 
    "somedirectory/*.csv"

进入你的setup.cfg。当使用setup.py或pyproject.toml时,有等效的方法。更完整的帐户可以在setuptools主页上找到

尝试使用相对于当前文件路径的文件名。'./my_file'示例:

fn = os.path.join(os.path.dirname(__file__), 'my_file')

在Python 3.4+中,你也可以使用pathlib:

fn = pathlib.Path(__file__).parent / 'my_file'

你可以使用build in __file__变量。它包含当前文件的路径。我将在项目根的一个模块中实现getBaseOfProject。在那里,我将获得__file__的路径部分,并将返回它。然后可以在项目中的任何地方使用此方法。

如果您正在使用安装工具或分发(setup.py安装),那么访问这些打包资源的“正确”方式似乎是使用package_resources。

对你来说,这个例子就是

import pkg_resources
my_data = pkg_resources.resource_string(__name__, "foo.dat")

当然,是哪个读取了资源,读取的二进制数据是my_data的值

如果你只是需要文件名,你也可以使用

resource_filename(package_or_requirement, resource_name)

例子:

resource_filename("MyPackage","foo.dat")

这样做的好处是,即使它是一个像鸡蛋一样的存档发行版,它也能保证工作。

看到http://packages.python.org/distribute/pkg_resources.html resourcemanager-api

import os
cwd = os.getcwd()
path = os.path.join(cwd, "my_file")
f = open(path)

你也可以尝试使用os.path.abspath(os.getcwd())来规范化你的cwd。更多信息请点击这里。