由 Nick Walsh 撰写
无论你是第一次设置 TensorFlow 的新手数据科学爱好者,还是处理数 TB 数据的资深 AI 工程师,安装库、包和框架总是一项挑战。
尽管像 Docker 这样的容器化工具确实彻底革新了软件的可重复性,但在数据科学和 AI 社区中尚未得到广泛采用,这也是有原因的!随着机器学习框架和算法的不断演变,找到时间来学习另一个开发工具,尤其是那些与模型构建过程无直接关联的工具,可能会很困难。
在这篇博客文章中,我将展示如何使用一个简单的 Python 包通过几个简单步骤来设置你环境,以适配任何流行的数据科学和 AI 框架。Datmo 在底层利用 Docker,简化了过程,帮助你快速、轻松地启动,无需陡峭的学习曲线。
-
安装并启动 Docker
-
(如果使用 GPU)安装 CUDA 9.0
-
(如果使用 GPU)安装 nvidia-docker(步骤 3)
就像任何 Python 包一样,我们可以通过终端使用以下命令来安装 datmo:
$ pip install datmo
在终端中,进入你想开始构建模型的文件夹。然后,输入以下命令:
$ datmo init
然后系统会要求你为项目提供名称和描述——你可以随意命名!
在输入名称和描述后,datmo 会询问你是否希望设置环境——输入 y
并按回车键。
CLI 将会询问你希望为你的环境选择哪些系统驱动程序。如果你不打算使用 GPU,选择 cpu
。
接下来,你需要从许多预打包环境中进行选择。只需在提示中输入你想使用的环境的编号或 ID。
以上许多环境根据你计划使用的语言和版本有不同的版本。
例如,在选择 keras-tensorflow
环境后,我会看到如下提示,询问我是否希望使用 Python 2.7 或 Python 3.5。
你已经正确选择了你的环境,现在是时候启动你的工作区了。选择你想使用的工作区,并在终端中输入相应的命令。
Jupyter Notebook -- $ datmo notebook
JupyterLab -- $ datmo jupyterlab
RStudio -- $ datmo rstudio
(在 R-base 环境中可用)
终端 -- $ datmo terminal
打开 Jupyter Notebook 并导入 TensorFlow
你准备好了! 第一次为新环境初始化工作区时,会花费一些时间,因为需要获取所有资源,但在后续运行中会显著加快。
一旦你的工作区启动,你就可以开始导入你选择的环境中包含的软件包和框架!例如,如果用户选择了 keras-tensorflow
环境,那么在你的 Jupyter Notebook 中 import tensorflow
将立即生效!
如果你使用 TensorFlow,可以尝试我们文档中的这个示例来运行你的第一个 TensorFlow 图。
如果你希望帮助贡献、报告问题或请求功能,你可以在 GitHub 上找到我们!
个人简介: Nick Walsh 是 Datmo 的开发者推广员,致力于构建开发者工具以帮助数据科学家提高效率。他还在全国各地的学生黑客马拉松中担任 Major League Hacking 的教练。
相关内容:
1. Google 网络安全证书 - 快速进入网络安全职业生涯。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你的组织 IT