在人工智能和深度学习飞速发展的今天,拥有一套稳定高效的本地开发环境至关重要。对于初学者来说,在 Ubuntu 系统上搭建深度学习环境可能看起来复杂,但只要按照步骤操作,其实并不难。本教程将手把手带你完成整个过程,即使你是 Linux 小白也能轻松上手。
一、准备工作
首先,确保你使用的是 Ubuntu 20.04 LTS 或 Ubuntu 22.04 LTS 版本(推荐 22.04)。同时,你的电脑最好配备 NVIDIA 显卡,这样才能利用 GPU 加速训练模型。如果没有独立显卡,也可以用 CPU 模式运行,但速度会慢很多。
二、安装 Anaconda(推荐使用 conda 管理环境)
conda 是一个强大的 Python 环境和包管理工具,非常适合管理多个深度学习项目。我们先安装 Anaconda:
打开终端(Ctrl + Alt + T) 下载 Anaconda 安装脚本(以 2023 年版本为例):wget https://repo.anaconda.com/archive/Anaconda3-2023.07-2-Linux-x86_64.sh
然后运行安装脚本:
bash Anaconda3-2023.07-2-Linux-x86_64.sh
安装过程中按提示操作,遇到 “Do you accept the license terms?” 输入
yes,最后建议初始化 conda(输入
yes)。
安装完成后,重启终端或运行:
source ~/.bashrc
验证是否安装成功:
conda --version
三、安装 NVIDIA 驱动与 CUDA(GPU加速关键)
如果你有 NVIDIA 显卡,这一步非常关键。CUDA 是 NVIDIA 提供的并行计算平台,能极大提升深度学习训练速度。
首先查看你的显卡型号:
lspci | grep -i nvidia
推荐使用 Ubuntu 自带的驱动安装方式(简单安全):
打开“软件和更新” → “附加驱动” 选择推荐的 NVIDIA 驱动(通常标有 “tested”) 点击“应用更改”,等待安装完成并重启验证驱动是否安装成功:
nvidia-smi
如果看到显卡信息和驱动版本,说明成功了!
接下来安装 CUDA Toolkit。注意:PyTorch 和 TensorFlow 通常自带 CUDA 运行时,因此不一定需要单独安装完整 CUDA Toolkit。但为了兼容性,建议安装与 PyTorch 匹配的 CUDA 版本(如 CUDA 11.8 或 12.1)。
你可以通过 conda 直接安装 cudatoolkit:
conda install cudatoolkit=11.8 -c nvidia
四、创建深度学习环境并安装 PyTorch
现在我们用 conda 创建一个独立的 Python 环境,避免包冲突:
conda create -n dl python=3.10 -yconda activate dl
激活环境后(命令行前缀会变成
(dl)),安装 PyTorch。请根据你的 CUDA 版本选择命令,这里以 CUDA 11.8 为例:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
如果是 CPU 模式,则使用:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
五、验证安装
在 Python 中测试 PyTorch 是否能调用 GPU:
python3 -c "import torch; print(torch.__version__); print(torch.cuda.is_available())"
如果输出类似:
2.0.1+cu118True
恭喜你!Ubuntu深度学习环境 已成功搭建!
六、常用工具推荐
Jupyter Notebook:交互式编程神器 VS Code:轻量级但功能强大的代码编辑器 TensorBoard:可视化训练过程你可以通过以下命令安装 Jupyter:
conda activate dlpip install jupyterjupyter notebook
总结
通过以上步骤,你已经成功在 Ubuntu 上搭建了包含 conda配置、CUDA安装 和 PyTorch安装 的完整深度学习环境。后续你可以根据项目需求安装 TensorFlow、OpenCV、scikit-learn 等其他库。记住,良好的环境管理是高效开发的第一步!
关键词:Ubuntu深度学习环境, CUDA安装, conda配置, PyTorch安装
