Skip to content

Latest commit

 

History

History
167 lines (99 loc) · 6.15 KB

setup-python-environment-machine-learning.md

File metadata and controls

167 lines (99 loc) · 6.15 KB

如何为机器学习设置 Python 环境

原文:www.kdnuggets.com/2019/02/setup-python-environment-machine-learning.html

c 评论

Header image

设置您的 Python 环境以进行机器学习可能是一项棘手的任务。如果您以前从未设置过这样的环境,可能会花费数小时尝试不同的命令来使其正常工作。但我们只想直接进入机器学习!


我们的前三个课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业的快车道。

2. 谷歌数据分析专业证书 - 提升您的数据分析技能

3. 谷歌 IT 支持专业证书 - 支持您组织的 IT


在本教程中,您将学习如何设置一个稳定的Python 机器学习开发环境。您将能够直接深入到机器学习中,再也不必担心安装软件包的问题。

(1) 设置 Python 3 和 Pip

第一步是安装 pip,一个 Python 包管理工具:

sudo apt-get install python3-pip

使用 pip,我们可以通过简单的pip install *your_package*安装任何在Python 包索引中的 Python 包。很快您将看到我们如何用它来设置我们的虚拟环境*。

接下来,我们将设置 Python 3 为运行pippython命令时的默认版本。这使得使用 Python 3 更加方便。如果我们不这样做,那么如果我们想使用 Python 3,就必须记住每次输入pip3python3

为了强制将 Python 3 设置为默认版本,我们将修改~/.bashrc文件。从命令行执行以下命令来查看该文件:

nano ~/.bashrc

向下滚动到**# 一些更多的 ls 别名**部分,并添加以下行:

alias python='python3'

保存文件并重新加载您的更改:

source ~/.bashrc

哇!Python 3 现在是您的默认 Python!您可以通过简单地在命令行运行python *your_program*来使用它。

(2) 创建一个虚拟环境

现在我们将设置一个虚拟环境。在这个环境中,我们将安装进行机器学习所需的所有 Python 包。

我们使用虚拟环境来分隔我们的编码设置。想象一下,如果你在某个时刻想在电脑上做两个不同的项目,而这两个项目需要不同版本的不同库。如果将它们都放在同一个工作环境中可能会很混乱,你可能会遇到库版本冲突的问题。你的项目 1 的 ML 代码需要numpy的 1.0 版本,但项目 2 需要 1.15 版本。糟糕!

虚拟环境允许我们隔离工作区域,以避免这些冲突。

首先,安装相关的包:

sudo pip install virtualenv virtualenvwrapper

一旦我们安装了 virtualenv 和 virtualenvwrapper,我们将需要再次编辑我们的~/.bashrc文件。将这 3 行放在文件底部并保存。

export WORKON_HOME=$HOME/.virtualenvs
export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python3
source /usr/local/bin/virtualenvwrapper.sh

保存文件并重新加载更改:

source ~/.bashrc

很好!现在我们可以像这样创建我们的虚拟环境:

mkvirtualenv ml

我们刚刚创建了一个名为ml的虚拟环境。要进入它,请执行以下操作:

workon ml

很棒!在ml虚拟环境中进行的任何库安装都会被隔离在其中,不会与其他环境冲突!因此,每当你想运行依赖于ml环境中安装的库的代码时,只需首先使用workon命令进入该环境,然后像平常一样运行你的代码。

如果你需要退出虚拟环境,请运行以下命令:

deactivate

(3) 安装机器学习库

现在我们可以安装我们的 ML 库了!我们将使用最常用的库:

  • numpy: 处理矩阵,尤其是数学运算

  • scipy: 科学和技术计算

  • pandas: 数据处理、操作和分析

  • matplotlib: 数据可视化

  • scikit learn: 机器学习

这是一个简单的小技巧,可以一次性安装所有这些库!创建一个requirements.txt文件,并列出你希望安装的所有包,如下所示:

numpy
scipy
pandas
matplotlib
scikit-learn

一旦完成,只需执行以下命令:

pip install -r requirements.txt

看!Pip 会一次性安装文件中列出的所有包。

恭喜,你的环境已设置好,你准备好进行机器学习了!

想要学习?

关注我 twitter,我会发布最新最精彩的 AI、技术和科学内容!

Bio: George Seif 是一名认证极客和 AI / 机器学习工程师。

原文。转载已获许可。

相关:

  • 为你的回归问题选择最佳机器学习算法

  • 数据科学家需要了解的 5 种聚类算法

  • Python 中的 5 种快速简单的数据可视化(附代码)

更多相关主题