我试图使用python从web获取数据。我导入了urllib。请求包,但在执行时,我得到错误:

certificate verify failed: unable to get local issuer certificate (_ssl.c:1045)

我在Mac OS High Sierra上使用Python 3.7。 我试图从CSV文件: https://s3.amazonaws.com/assets.datacamp.com/production/course_1606/datasets/winequality-red.csv

当我将URL更改为“http”时-我能够获得数据。但是,我认为这避免了检查SSL证书。

所以我在网上找到了一个解决方案: 运行/Applications/Python\ 3.7/Install\ certificates .命令

这解决了我的问题。但是我没有SSL之类的知识。你能帮我理解一下它到底是怎么解决我的问题的吗?

如果可能的话,请给我推荐一些好的资源来了解安全与证书。我是新手。

谢谢!

注意:我确实通过链接openssl, python请求错误:“证书验证失败”

我的问题与链接中的问题不同,因为我想知道当我安装certifi包或运行install \ Certificates.command来修复错误时实际发生了什么。我对证券的理解很差。


当前回答

环境:Mac, Python 3.10, iTerm,

在查找器中搜索:安装证书 得到信息 打开:iTerm.app 双击'Install Certificates.command'

等待安装证书。解决它。

其他回答

对于那些这个问题仍然存在的人:- MacOS上的Python 3.6(还有其他版本吗?)附带了自己的私有OpenSSL副本。这意味着系统中的信任证书不再被Python ssl模块用作默认值。要解决这个问题,您需要在系统中安装一个证书包。

你可以尝试两种方法:

1)通过PIP:

pip install --upgrade certifi

2)如果它不起作用,尝试运行Python 3.6 for Mac附带的certificates .command:

open /Applications/Python\ 3.6/Install\ Certificates.command

无论如何,您现在应该已经安装了证书,并且Python应该能够通过HTTPS进行连接而不会出现任何问题。

希望这对你有所帮助。

我在OSX上遇到了同样的问题,而我的代码在Linux上完全没问题,你在你的问题中给出了答案!

在检查您指向/Applications/Python 3.7/Install certificates .command的文件后,发现该命令将默认Python安装的根证书替换为通过certifi包提供的根证书。

Certifi是根证书的集合。每个SSL证书都依赖于一个信任链:您信任一个特定的证书,因为您信任该证书的父证书,因此您信任该证书的父证书,等等。在某些情况下,没有“父”证书,这些是“根”证书。对于这些问题,除了捆绑普遍信任的根证书(通常是大型信托公司,如eg。“DigiCert”)。

例如,您可以在浏览器安全设置中看到根证书(例如Firefox->首选项->隐私和安全->视图证书->权威)。

回到最初的问题,在运行.command文件之前,在干净的安装上执行这个命令会返回一个空列表:

import os
import ssl                                        
openssl_dir, openssl_cafile = os.path.split(      
    ssl.get_default_verify_paths().openssl_cafile)
# no content in this folder
os.listdir(openssl_dir)
# non existent file
print(os.path.exists(os.path.join(openssl_dir, openssl_cafile)))

这意味着OSX上的Python安装没有默认的证书颁发机构。可能的默认值正是证书包提供的。

在此之后,您只需创建一个具有正确默认值的SSL上下文,如下所示(certificate .where()给出了证书颁发机构的位置):

import platform
# ...

ssl_context = ssl.SSLContext(ssl.PROTOCOL_TLS)
ssl_context.verify_mode = ssl.CERT_REQUIRED
ssl_context.check_hostname = True
ssl_context.load_default_certs()

if platform.system().lower() == 'darwin':
    import certifi
    ssl_context.load_verify_locations(
        cafile=os.path.relpath(certifi.where()),
        capath=None,
        cadata=None)

然后像这样从python请求一个url:

import urllib
# previous context
https_handler = urllib.request.HTTPSHandler(context=ssl_context)

opener = urllib.request.build_opener(https_handler)
ret = opener.open(url, timeout=2)

在我的例子中,这个错误的原因是OPENSSLDIR被设置为一个不包含实际证书的路径,可能是由于一些升级/重新安装造成的。

要验证这一点,如果这可能是你的情况,试着运行:

openssl s_client -CApath /etc/ssl/certs/ -connect some-domain.com:443

如果您删除了-CApath /etc/ssl/certs/并得到一个20的错误代码,那么这可能是原因。您也可以通过执行openssl version -a命令查看OPENSSLDIR设置为什么。

由于修改OPENSSLDIR需要重新编译,我发现最简单的解决方案就是在现有路径中创建一个符号链接:ln -s /etc/ssl/certs your-openssldir/certs

环境:Mac, Python 3.10, iTerm,

在查找器中搜索:安装证书 得到信息 打开:iTerm.app 双击'Install Certificates.command'

等待安装证书。解决它。

警告:我对证书不是很了解,但我认为这值得尽早检查。

在花时间重新配置代码/包/系统之前,请确保您试图下载的服务器没有问题。

我认为这个错误可能会产生误导,因为“无法获得本地发行者证书”看起来好像是本地机器出了问题,但事实未必如此。

尝试将您正在尝试加载的页面更改为可能不错的页面,例如https://www.google.com,然后查看问题是否仍然存在。此外,使用https://www.digicert.com/help/上的搜索工具检查出问题的域名。

在我的例子中,DigiCert的工具告诉我“证书不是由受信任的权威签署的(根据Mozilla的根存储进行检查)。”这就解释了为什么我似乎已经安装了根证书,但仍然出现错误。当我测试用HTTPS加载一个不同的网站时,我没有遇到任何问题。

如果这种情况适用于你,那么我认为你可能有3个逻辑选项(按优先级排序):1)修复服务器(如果它在你的控制之下),2)禁用证书检查,同时继续使用HTTPS, 3)跳过HTTPS转到HTTP。