Python大数据分析4:案例-安装第三方库出问题怎么办?

这个内容属于选学内容,大家可以根据需求酌情学习。不少同学都反映,在后期课程的学习中,使用到的pandas和tushare等第三方库无法顺利安装,这里我们简单说明下。

首先对于任何第三方库,我们都可以在PyCharm项目中安装。比如我们使用pandas这个库来学习数据查询分析,大家可以在数据查询分析章节的第一节课中详细了解标准安装方法,这里简单先说明下。

在当前项目中选择文件菜单——设置,在打开的界面中,选择当前项目下的项目解释器,并点击右上角的加号,此时可以在新打开的界面上方的输入框中输入,比如pandas,此时应该能够看到左边访问网络,加载显示基本信息的内容,如果可以正常显示这样的详细信息,那么建议大家选择下版本类型。在右下方,选择指定版本,建议选择1.0.1,因为课程介绍使用该版本,主要为了避免因为版本差异可能带来的不同,也方便大家调试和交流。此时即可点击安装按钮安装。

安装好应该没有任何错误提示,底部显示绿色的成功提示,并且这个按钮将变为灰色。此时你会发现安装的不仅有pandas,还有其他的一些必需的配套库,这些都是自动安装,非常方便。

但是也有可能出现错误,原因很多。简单的处理方法可以尝试换个时间、换个网络。也建议大家使用最新的Windows系统,比如我们这里测试的环境都是Win10,安装过程一般都没有问题。但是如果确实存在问题,我们该怎么办呢?

可以尝试在PyCharm终端直接安装,这是第二种方法。选中PyCharm下方的Terminal(终端),输入:

pip install pandas

你会发现同样的安装过程,而且还能提示下载的库文件名称、进度等等信息。

我们也可以通过指定版本号来安装,方法是加上双等于号和版本号:

pip install pandas==1.0.1

不过,这样安装可能与前面的方法区别不大,因为在很多情况下,可能是因为这些第三方库所在的网站访问不稳定导致无法安装。所以利用这种方法,我们可以自由选择所需的文件镜像源:

pip install -i  https://mirrors.aliyun.com/pypi/simple/ pandas

请注意这里-i参数后两个,分别是镜像文件网站,和准备安装的pandas库。你会发现速度非常快,而且很稳定。这里我们使用的是国内阿里云的镜像文件。关于镜像网站,这是一些常见的镜像文件站点:

加州大学:https://www.lfd.uci.edu/~gohlke/pythonlibs

清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple

豆瓣:http://pypi.douban.com/simple

第三种,可以利用独立的whl文件来安装。Whl文件就是第三方库的原始文件,前面的方法也就是通过网络去下载这些文件自动安装,如果网络存在问题,那么我们可以利用专门得到的whl文件直接安装。

比如你有一个别人给你的pandas安装文件,你可以直接粘贴到你的项目中。你选中文件复制,并粘贴到PyCharm的项目中。此时会有一个提示,直接点击OK即可。你将能看到这个文件。还是在终端窗格中输入:

pip install pandas-1.0.1-cp37-cp37m-win_amd64.whl

后面就是完整的文件名称。

很快你也能看到安装的过程。

当然,你可能会好奇如何得到这个安装文件?其实,在刚才介绍的镜像文件网站中,这些都可以找到,比如这是阿里云的镜像,文件很多,加载要等一会,我们还是以pandas为例。全部加载完毕后,可以拖拽寻找下pandas,再次点击,即可看到各种版本的文件。比如按下Ctrl+F查找1.0.1,但是哪一个才是我们所需要的呢?这里有两个关键信息:一是个Python的版本,一个是自己操作系统的版本。大家应该记得我们使用的是3.7版本,因此应该选择cp3.7那几个文件。当前我使用的是Windows操作系统,而且是64位的Win10。这是目前最为常见的配置。于是就可以选择win_amd64,到此文件就已经只有一个了。大家可以根据自己的情况做出合理的选择。当然,我们也可以从一些其他可靠的来源单独获得此类whl文件。

第四种方法可以使用复制全局环境。所谓全局环境,是指电脑系统已经安装好了一些第三方库,只是PyCharm项目还没有安装。因此我们必须将系统安装好的第三方库应用于这些PyCharm项目中。

我们还是在项目中,选择设置,找到项目解释器,点击右上角的那个齿轮按钮,选择添加,在新建环境中,增加了新的名称,比如在现有的名称后修改下。同时选中下面的继承全局站点包,点击OK。即可看到全部系统已有的包都加进来了。

可能大家会问,系统这些全局包是怎么加的?比较方便的方法是安装Anaconda,它会自动安装所有常见的相关第三方包,这些本课程不再深入讲解。

第五种方法可以说是最为原始,但是一定是最有效的方法。那就是直接将已经安装好的电脑上项目的库直接复制过来。

比如这是别人给我们的项目中库文件,我们全部选中复制,在当前PyCharm项目中,右击项目选择在文件夹显示,可以看到当前的项目,双击打开,再双击venv,双击Lib,双击site-packages,将刚才那些库文件直接粘贴过来即可。此时打开项目的项目解释器,你就发现已经全部加载成功了!

当然,大家可以很好奇这些库文件哪里来的?其实就是其他项目中site-packages下的文件,因此,你只需在可以使用的其他电脑或者项目中找到site-packages文件夹,将其中的文件全部复制,就可以粘贴到所需的其他项目中。

退一步说,如果在自己的电脑上,已有项目已经加载过所需的库,那么对于其他新建的项目,也可以直接使用。比如再次打开项目解释器,点击右上角的齿轮按钮,选中显示全部。根据需要,选择已经安装好第三方库的其他项目,即可直接将它们的库文件全部导入进来。

很难说,这里哪个方法更好用,大家可以根据自己的问题,有选择的使用,其实这也是深入了解Python第三方库使用方法的有效途径。遇到这些问题,大家不妨好好的试一试!

发表评论

电子邮件地址不会被公开。 必填项已用*标注