1. Giới thiệu
Mình đã cài đặt được tensorflow-gpu trên windows 10 và ubuntu 20.04:
Cấu hình hiện tại
CPU: Intel core I7 9750H
GPU: Nvidia gtx1050ti max-q
Để sử dụng được GPU trong tensorfow bạn cần cài rất nhiều thứ nhưng mình sẽ chỉ các bạn cách dễ nhất là dùng anaconda
2. Windows
Trong windows các bạn cài thư viện anaconda: https://docs.anaconda.com/anaconda/install/windows/
Sau đó các bạn chạy lệnh sau
conda create -n tf-gpu tensorflow-gpu
conda activate tf-gpu
Lệnh này sẽ tạo một môi trường có tên tf-gpu
và cài các gói cần thiết
Để vào môi trường này:
activate tf-gpu
Các gói trong tf-gpu
conda list
Khi bạn chạy mà vẫn gặp lỗi không nhận GPU thì bạn có thể fix như sau:
Python 3.7: conda install tensorflow-gpu=2.3 tensorflow=2.3=mkl_py37h936c3e2_0
Python 3.8: conda install tensorflow-gpu=2.3 tensorflow=2.3=mkl_py38h1fcfbd6_0
Tham khảo từ:
- https://github.com/ContinuumIO/anaconda-issues/issues/12194#issuecomment-751700156
- https://stackoverflow.com/questions/65273118/why-is-tensorflow-not-recognizing-my-gpu-after-conda-install
3. Ubuntu
Ubuntu các bạn cũng cài anaconda và tensorflow như ở windows. các lệnh cũng tương tự.
Ngoài ra nếu muốn dùng nvidia docker để sử dụng GPU trong container thì các bạn cần cài thêm một số package nữa:
Link tham khảo và cài đặt:
- https://github.com/NVIDIA/nvidia-docker
- https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker
- https://www.tensorflow.org/install/docker
4. Cài trực tiếp:
Cài trực tiếp cũng được nhưng việc cài đặt khá khó khăn vì mỗi phiên bản tensorflow lại tương thích riêng với một phiên bản cuda và cudnn. Mình đã thử bằng cách này nhưng vẫn bị lỗi và không nhận GPU.
Code test tensorflow
import timeit
import tensorflow as tf
# device_name = tf.test.gpu_device_name()
# # print(device_name)
# if device_name != '/device:GPU:0':
# raise SystemError('GPU device not found')
# print('Found GPU at: {}'.format(device_name))
device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
'\n\nThis error most likely means that this notebook is not '
'configured to use a GPU. Change this in Notebook Settings via the '
'command palette (cmd/ctrl-shift-P) or the Edit menu.\n\n')
raise SystemError('GPU device not found')
def cpu():
with tf.device('/cpu:0'):
random_image_cpu = tf.random.normal((100, 100, 100, 3))
net_cpu = tf.keras.layers.Conv2D(32, 7)(random_image_cpu)
return tf.math.reduce_sum(net_cpu)
def gpu():
with tf.device('/device:GPU:0'):
random_image_gpu = tf.random.normal((100, 100, 100, 3))
net_gpu = tf.keras.layers.Conv2D(32, 7)(random_image_gpu)
return tf.math.reduce_sum(net_gpu)
# We run each op once to warm up; see: https://stackoverflow.com/a/45067900
# Run the op several times.
print('Time (s) to convolve 32x7x7x3 filter over random 100x100x100x3 images '
'(batch x height x width x channel). Sum of ten runs.')
print('CPU (s):')
cpu_time = timeit.timeit('cpu()', number=10, setup="from __main__ import cpu")
print('GPU (s):')
gpu_time = timeit.timeit('gpu()', number=10, setup="from __main__ import gpu")
print('GPU speedup over CPU: {}x'.format(int(cpu_time/gpu_time)))
Minh test bằng code trên và thầy trên linux hiêu năng của tensorflow tăng đáng kể. tỉ lể cpu/gpu
windows: x6
ubuntu : x30
Nếu máy bạn yếu hoặc không có GPU rời thì hãy dùng google colab