消费级显卡
- GeForce GT系列:定位入门级,适合基础办公、高清视频播放以及轻度游戏等场景。
- GeForce GT 1030:CUDA核心数384,基础频率1227 MHz,加速频率1468 MHz,显存2GB GDDR5,显存带宽48 GB/s,功耗30W。算力相对较弱,大致在几个TFLOPS以内(如在一些简单应用场景下可能达到1 - 2 TFLOPS左右),可满足日常基本图形处理需求。
- GeForce GTX系列:包含从入门到中高端不同定位的型号。
- GeForce GTX 1050:CUDA核心数640,基础频率1354 MHz,加速频率1455 MHz,显存2GB GDDR5,显存带宽112 GB/s,功耗75W。算力大概在2 - 3 TFLOPS左右,能在1080p分辨率下流畅运行一些较为轻量的游戏,如《英雄联盟》等。
- GeForce GTX 1060(以常见的6G版本为例):CUDA核心数1280,基础频率1506 MHz,加速频率1708 MHz,显存6GB GDDR5,显存带宽192 GB/s,功耗120W。其算力一般能达到4 - 6 TFLOPS左右,可以较好地应对1080p分辨率下的主流游戏。
- GeForce GTX 1070:CUDA核心数1920,基础频率1506 MHz,加速频率1683 MHz,显存8GB GDDR5,显存带宽256 GB/s,功耗150W。算力大致在7 - 9 TFLOPS左右,在1080p和1440p分辨率下运行游戏能有不错表现。
- GeForce GTX 1080:CUDA核心数2560,基础频率1607 MHz,加速频率1733 MHz,显存8GB GDDR5X,显存带宽320 GB/s,功耗180W。算力通常在9 - 12 TFLOPS左右,可支持较高分辨率游戏及一些简单的内容创作任务。
- GeForce GTX 1080Ti:CUDA核心数3584,基础频率1480 MHz,加速频率1582 MHz,显存11GB GDDR5X,显存带宽484 GB/s,功耗250W。算力能达到11 - 15 TFLOPS左右,属于当时高端游戏及部分专业应用的可选型号。
- GeForce GTX 1650:CUDA核心数896,基础频率1485 MHz,加速频率1665 MHz,显存4GB GDDR5,显存带宽128 GB/s,功耗75W。算力大约在3 - 5 TFLOPS左右,可在1080p分辨率下流畅运行大多数游戏,适合普通游戏玩家。
- GeForce GTX 1660:CUDA核心数1408,基础频率1530 MHz,加速频率1785 MHz,显存6GB GDDR5,显存带宽192 GB/s,功耗120W。算力大概在5 - 7 TFLOPS左右,适合在1080p和1440p分辨率下运行主流游戏。
- GeForce GTX 1660Ti:CUDA核心数1536,基础频率1500 MHz,加速频率1770 MHz,显存6GB GDDR6,显存带宽288 GB/s,功耗120W。算力一般在6 - 8 TFLOPS左右,适合1440p分辨率下的高画质游戏和一些基础的内容创作任务。
- GeForce RTX系列:引入了实时光线追踪等新技术,性能较强。
- GeForce RTX 2060:CUDA核心数1920,基础频率1365 MHz,加速频率1680 MHz,显存6GB GDDR6,显存带宽336 GB/s,功耗160W。算力大致在6 - 8 TFLOPS左右,支持光线追踪技术,适合1440p高画质游戏以及入门级内容创作和视频编辑。
- GeForce RTX 2070:CUDA核心数2304,基础频率1410 MHz,加速频率1620 MHz,显存8GB GDDR6,显存带宽448 GB/s,功耗175W。算力通常在8 - 10 TFLOPS左右,能较好支持1440p和部分4K分辨率下的游戏及内容创作。
- GeForce RTX 2080:CUDA核心数2944,基础频率1515 MHz,加速频率1710 MHz,显存8GB GDDR6,显存带宽448 GB/s,功耗215W。算力大概在10 - 13 TFLOPS左右,专为4K分辨率的高端游戏设计,适合重度游戏玩家和专业内容创作者。
- GeForce RTX 2080Ti:CUDA核心数4352,基础频率1350 MHz,加速频率1545 MHz,显存11GB GDDR6,显存带宽616 GB/s,功耗250W。算力能达到13 - 17 TFLOPS左右,提供了很强的图形处理能力。
- GeForce RTX 3050:CUDA核心数2560,基础频率1552 MHz,加速频率1777 MHz,显存8GB GDDR6,显存带宽224 GB/s,功耗130W。算力大约在7 - 9 TFLOPS左右,适合1440p分辨率的高画质游戏,同时支持光线追踪和DLSS,是希望在中等预算下获得高画质游戏体验的玩家的最佳选择。
- GeForce RTX 3060:CUDA核心数3584,基础频率1320 MHz,加速频率1777 MHz,显存12GB GDDR6,显存带宽360 GB/s,功耗170W。算力一般在9 - 12 TFLOPS左右,适合1440p甚至4K分辨率的高画质游戏,具有优秀的内存容量,支持复杂场景的渲染,适合重度游戏玩家和内容创作者。
- GeForce RTX 3070:CUDA核心数5888,基础频率1500 MHz,加速频率1725 MHz,显存8GB GDDR6,显存带宽448 GB/s,功耗220W。算力大致在14 - 18 TFLOPS左右,支持4K分辨率的高画质游戏和内容创作,适合追求高性能和长寿命的用户,能够在高画质下流畅运行大多数最新游戏。
- GeForce RTX 3080:CUDA核心数8704,基础频率1440 MHz,加速频率1710 MHz,显存10GB GDDR6X,显存带宽760 GB/s,功耗320W。算力大概在20 - 25 TFLOPS左右,专为4K分辨率的高端游戏设计,适合重度游戏玩家和专业内容创作者,提供无与伦比的游戏体验和性能。
专业级显卡(Quadro系列)
主要用于专业工作站,如设计、动画、影视后期、工程建模等领域,对图形精度、稳定性等要求较高。
- Quadro P系列(以部分常见型号为例):
- Quadro P2000:CUDA核心数1024,基础频率1440 MHz,加速频率1590 MHz,显存5GB GDDR5,显存带宽140 GB/s,功耗75W。算力大致在3 - 5 TFLOPS左右,可满足一些中低端专业图形处理需求,如小型设计项目、简单的动画制作等。
- Quadro P4000:CUDA核心数1792,基础频率1545 MHz,加速频率1700 MHz,显存8GB GDDR5,显存带宽240 GB/s,功耗140W。算力大概在5 - 8 TFLOPS左右,适合处理较为复杂的设计、动画和影视后期任务。
- Quadro P6000:CUDA核心数3840,基础频率1500 MHz,加速频率1750 MHz,显存24GB GDDR5,显存带宽480 GB/s,功耗250W。算力通常在12 - 18 TFLOPS左右,可应对大型设计项目、高分辨率影视后期制作等高端专业应用。
- Quadro RTX系列(以部分常见型号为例):在专业领域引入了光线追踪等新技术。
- Quadro RTX 4000:CUDA核心数2304,基础频率1395 MHz,加速频率1620 MHz,显存8GB GDDR6,显存带宽448 GB/s,功耗160W。算力大致在8 - 10 TFLOPS左右,适用于建筑设计、工业设计、影视制作等领域的中等复杂程度项目。
- Quadro RTX 8000:CUDA核心数4608,基础频率1350 MHz,加速频率1545 MHz,显存48GB GDDR6,显存带宽616 GB/s,功耗300W。算力大概在16 - 22 TFLOPS左右,可用于超大型设计项目、高分辨率影视后期制作等极为复杂的专业应用。
数据中心级显卡(Tesla系列、Ampere架构相关数据中心卡等)
主要用于大规模数据处理、深度学习训练、高性能计算等场景。
- Tesla V100:CUDA核心数5120,基础频率1290 MHz,加速频率1390 MHz,显存16GB HBM2,显存带宽900 GB/s,功耗250W。算力大致在15 - 20 TFLOPS左右,曾是数据中心广泛应用的高性能计算卡,在深度学习等领域发挥重要作用。
- Tesla A100:CUDA核心数6912,基础频率1410 MHz,加速频率1675 MHz,显存40GB HBM2,显存带宽1550 GB/s,功耗400W。算力大概在20 - 30 TFLOPS左右,是一款性能非常强大的数据中心级显卡,广泛应用于深度学习训练、高性能计算等领域。
- A800:CUDA核心数6144,基础频率1410 MHz,加速频率1665 MHz,显存40GB HBM2,显存带宽1550 GB/s,功耗300W。算力大致在18 - 25 TFLOPS左右,在数据中心的深度学习、高性能计算等场景有应用。
- H100:CUDA核心数8268,基础频率1510 MHz,加速频率1750 MHz,显存80GB HBM2,显存带宽3072 GB/s,功耗700W。算力大概在30 - 40 TFLOPS左右,是目前性能极为强大的数据中心级显卡,广泛应用于大规模深度学习训练、高性能计算等高端场景。