1. fpga
    +关注
    关注 256
    文章 6759
    浏览量 361222
  2. gpu
    gpu
    +关注
    关注 9
    文章 565
    浏览量 40257

GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了

FPGA极客空间 2018-06-10 11:44 次阅读
GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 我知道,我对与电子有关的所有事情都很着迷,但不论从哪个角度看,今天的现场可编程门阵列(FPGA),都显得“鹤立鸡群”,真是非常棒的器件。如果在这个智能时代,在这个领域,想拥有一技之长的你还没有关注FPGA,那么世界将抛弃你,时代将抛弃你。 从几个方面来介绍一下GPU和FPGA。 从峰值性能来说,GPU(10Tflops)远远高于FPGA(<1TFlops)。GPU上面成千上万个core同时跑在GHz的频率上还是非常壮观的,最新的GPU峰值性能可达10TFlops以上。GPU的架构经过仔细设计(例如使用深度流水线,retiming等技巧),在电路实现上是基于标准单元库而在critical path上可以用手工定制电路,甚至在必要的情形下可以让半导体fab依据设计需求微调工艺制程,因此可以让许多core同时跑在非常高的频率。相对而言,FPGA首先设计资源受到很大的限制,例如GPU如果想多加几个core只要增加芯片面积就行,但FPGA一旦你型号选定了逻辑资源上限就确定了(浮点运算在FPGA里会占用很多资源)。而且,FPGA里面的逻辑单元是基于SRAM-查找表,其性能会比GPU里面的标准逻辑单元差好多。最后,FPGA的布线资源也受限制(有些线必须要绕很远),不像GPU这样走ASIC flow可以随意布线,这也会限制性能。 除了芯片性能外,GPU相对于FPGA还有一个优势就是内存接口。GPU的内存接口(传统的GDDR,最近更是用上了HBM和HBM2)的带宽远好于FPGA的传统DDR接口,而众所周知服务器端机器学习算法需要频繁访问内存。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 但是从灵活性来说,FPGA远好于GPU。FPGA可以根据特定的应用去编程硬件(例如如果应用里面的加法运算非常多就可以把大量的逻辑资源去实现加法器),但是GPU一旦设计完那就没法改动了,没法根据应用去调整硬件资源。目前机器学习大多数适合使用SIMD架构(即只需一条指令可以平行处理大量数据),因此用GPU很适合。但是有些应用是MISD(即单一数据需要用许多条指令平行处理,微软在2014年ISCA paper里面就举了一个MISD用于并行提取feature的例子),这种情况下用FPGA做一个MISD的架构就会比GPU有优势。不过FPGA的编程对于程序员来说并不容易,所以为了能让机器学习程序员能方便地使用FPGA往往还需要在FPGA公司提供的编译器基础上进行二次开发,这些都是只有大公司才能做。 FPGA实现的机器学习加速器在架构上可以根据特定应用优化所以比GPU有优势,但是GPU的运行速度(>1GHz)相比FPGA有优势(~200MHz)。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 所以,对于平均性能,看的就是FPGA加速器架构上的优势是否能弥补运行速度上的劣势。如果FPGA上的架构优化可以带来相比GPU架构两到三个数量级的优势,那么FPGA在平均性能上会好于GPU。例如,百度在HotChips上发布的paper显示,GPU的平均性能相比FPGA在矩阵运算等标准batch data SIMD bench上远好于FPGA;但是在处理服务器端的少量多次处理请求(即频繁请求但每次请求的数据量和计算量都不大)的场合下,平均性能会比GPU更好。 GPU和FPGA优缺点的对比详细概述你现在要开始了解FPGA了 功耗方面,虽然GPU的功耗(200W)远大于FPGA的功耗(10W),但是如果要比较功耗应该比较在执行效率相同时需要的功耗。如果FPGA的架构优化能做到很好以致于一块FPGA的平均性能能接近一块GPU,那么FPGA方案的总功耗远小于GPU,散热问题可以大大减轻。反之,如果需要二十块FPGA才能实现一块GPU的平均性能,那么FPGA在功耗方面并没有优势。 能效比的比较也是类似,能效指的是完成程序执行消耗的能量,而能量消耗等于功耗乘以程序执行的时间。虽然GPU的功耗远大于FPGA的功耗,但是如果FPGA执行相同程序需要的时间比GPU长几十倍,那FPGA在能效比上就没有优势了;反之如果FPGA上实现的硬件架构优化得很适合特定的机器学习应用,执行算法所需的时间仅仅是GPU的几倍或甚至于接近GPU,那么FPGA的能效比就会比GPU强。

热门推荐

  1. 电子书 电源开关设计秘笈 第2部
  2. 如何构建高效NFC设计以支持各种应用(附代码)
  3. 【干货】全自动AI移动机器人开源资料
  4. 电子书 中美人工智能行业生态比较
  5. 电子书 电源开关设计秘笈 第一部
原文标题:谈谈GPU与FPGA的一些看法 文章出处:【微信号:ALIFPGA,微信公众号:FPGA极客空间】欢迎添加关注!文章转载请注明出处。
收藏 人收藏
分享:

评论

相关推荐

FPGA资源怎么平民化?阿里云的新改造

FPGA (现场可编程门阵列)由于其硬件并行加速能力和可编程特性,在传统通信领域和IC设计领域大放异....
发表于 06-23 09:44 14次 阅读
FPGA资源怎么平民化?阿里云的新改造

FPGA中的冒险现象和如何处理毛刺

通过改变设计,破坏毛刺产生的条件,来减少毛刺的发生。例如,在数字电路设计中,常常采用格雷码计数器取代....
发表于 06-23 08:49 12次 阅读
FPGA中的冒险现象和如何处理毛刺

面向数据包处理的Xilinx智能解决方案

在开放式协作服务爆炸性增长以及移动和社交网络不断发展的推动下,结合智能设备的普及以及不同服务供应商和....
发表于 06-22 15:13 17次 阅读
面向数据包处理的Xilinx智能解决方案

NVIDIA宣布推出全新的数据增强库和图像解码库

基于深度学习的计算机视觉应用程序包括复杂的多阶段预处理数据管道,该管道包括诸多计算密集型步骤,如:从....
的头像 英伟达NVIDIA企业解决方案 发表于 06-22 15:10 212次 阅读
NVIDIA宣布推出全新的数据增强库和图像解码库

NGcodec谈FPGA编码在HEVC和AV1上现状与未来

随着HEVC、AV1等更复杂算法的Codec份额逐步增长,实现高质量视频编解码需要硬件支持,软件的方....
发表于 06-22 15:01 16次 阅读
NGcodec谈FPGA编码在HEVC和AV1上现状与未来

关于基于分数低阶协方差谱的频谱感知算法研究及其FPGA实现

长期以来,传统的频谱管理与划分采用静态频谱分配方式[1],导致无线频谱利用率低下,同时研究发现,即使....
的头像 电子设计 发表于 06-22 14:58 88次 阅读
关于基于分数低阶协方差谱的频谱感知算法研究及其FPGA实现

Xilinx FPGA对数字信号处理的性能

Xilinx FPGA 可提供卓越的数字信号处理 (DSP) 性能,能够满足音频处理、接口、压缩、嵌....
发表于 06-22 14:57 26次 阅读
Xilinx FPGA对数字信号处理的性能

关于基于分段多项式近似的DDFS研究及FPGA实现

感应式磁力仪基于法拉第电磁感应原理,用于探测近地空间的低频交变磁场[1],它通常自带标准信号源,用于....
的头像 电子设计 发表于 06-22 14:55 91次 阅读
关于基于分段多项式近似的DDFS研究及FPGA实现

分布式算法是一项重要的FPGA技术

式中:xb(n) 表示第n个数据的第b位。由于x(n)为有限位数据,且xb(n)的取值为[0,1],....
的头像 FPGA极客空间 发表于 06-22 14:53 141次 阅读
分布式算法是一项重要的FPGA技术

关于基于前导的OFDM系统信道估计及FPGA实现

正交频分复用(OFDM)由于具有抗多径衰落,频谱利用率高等特点,因而被广泛用于无线通信系统中。但是由....
的头像 电子设计 发表于 06-22 14:51 86次 阅读
关于基于前导的OFDM系统信道估计及FPGA实现

获得高校、专家一致认可的小脚丫FPGA开发板到底有何神奇的地方?——小脚丫STEP-MXO2 二代评测

背景 微控制器作为目前嵌入式系统设计的主力军在各行各业得到了广泛的应用,但随着物联网、智能硬件、VR....
发表于 06-22 11:35 40次 阅读
获得高校、专家一致认可的小脚丫FPGA开发板到底有何神奇的地方?——小脚丫STEP-MXO2 二代评测

三星计划打造自有设计的GPU

从2015年开始推出代号“Mongoose”、自主架构设计的Exynos 8890处理器之后,虽然三....
的头像 半导体动态 发表于 06-22 11:14 326次 阅读
三星计划打造自有设计的GPU

FPGA仿真问题

发表于 06-22 09:56 46次 阅读
FPGA仿真问题

FPGA电源设计挑战

发表于 06-22 09:38 151次 阅读
FPGA电源设计挑战

关于IPIPEIF和ISIF对RAW数据的处理,请问是什么原因改变了RAW数据的附加信息?

发表于 06-22 07:56 100次 阅读
关于IPIPEIF和ISIF对RAW数据的处理,请问是什么原因改变了RAW数据的附加信息?

请问dm385 ar0331摄像头的fpga起什么作用?

发表于 06-22 06:04 18次 阅读
请问dm385 ar0331摄像头的fpga起什么作用?

请问DM355可以做视频叠加吗?需要加FPGA吗?

发表于 06-22 02:39 11次 阅读
请问DM355可以做视频叠加吗?需要加FPGA吗?

请问fpga+7002把24bit或者30bit的数据转化为8bit的数据如何实现?

发表于 06-22 00:33 15次 阅读
请问fpga+7002把24bit或者30bit的数据转化为8bit的数据如何实现?

华为P20即将适配GPU Turbo 畅快玩游戏就在今夏!

作为一种视觉动物,人类对于画质的追求是永无止境的。而在业界硬件趋同的情况下,如何让手机显示画质突破瓶....
发表于 06-21 15:38 47次 阅读
华为P20即将适配GPU Turbo 畅快玩游戏就在今夏!

基于FPGA的异步FIFO的实现

大家好,又到了每日学习的时间了,今天我们来聊一聊基于FPGA的异步FIFO的实现。 一、FIFO简介....
的头像 FPGA学习交流 发表于 06-21 11:15 493次 阅读
基于FPGA的异步FIFO的实现

基于单片机对FPGA进行编程配置

本文实现了基于遗传算法的硬件演化过程。通过Mcu随机产生种群,选择好的基因进行交叉变异产生后代,然....
发表于 06-21 10:45 84次 阅读
基于单片机对FPGA进行编程配置

揭秘造芯黑马的神秘面纱

如果说目前高端集成电路的落后现状是因为我国相关产业起步晚、积累少导致的,对于如今再次兴起的人工智能浪....
的头像 88lifa利发国际娱乐网工程师 发表于 06-21 08:02 262次 阅读
揭秘造芯黑马的神秘面纱

请问谁有XILINX FPGA 7系列的原理图封装?

发表于 06-21 02:14 101次 阅读
请问谁有XILINX  FPGA 7系列的原理图封装?

【晚间三分钟】:LG广州OLED工厂即将开建;特斯拉在帐篷里组装Model 3;三星纯自主GPU取得进展

特斯拉Model 3的产能问题,一直备受外界关注,这不为了产能特斯拉在帐篷里组装Model 3了,马....
的头像 肖青梅 发表于 06-20 17:56 983次 阅读
【晚间三分钟】:LG广州OLED工厂即将开建;特斯拉在帐篷里组装Model 3;三星纯自主GPU取得进展

谷歌云端可抢占GPU,普遍降价40%

谷歌表示,抢占式GPU(Preemptible GPUs)非常适合短期、容错和批处理工作负载,比如机....
的头像 新智元 发表于 06-20 17:41 318次 阅读
谷歌云端可抢占GPU,普遍降价40%

Nvidia为何迟迟不发布新GPU?

目前台湾的报道显示Nvidia存在游戏GPU库存问题。
的头像 39度创意研究所 发表于 06-20 17:03 203次 阅读
Nvidia为何迟迟不发布新GPU?

FPGA和CPU如何搭配?

如下图,FPGA作为协处理器,CPU把指令写入内存,FPGA从内存读取指令执行,并把计算结果写入内存....
的头像 ssdfans 发表于 06-20 15:17 250次 阅读
FPGA和CPU如何搭配?

PCB设计过程中需要考虑的因素

千兆位级串行I/O技术有着极其出色的优越性能,但这些优越的性能是需要条件来保证的,即优秀的信号完整性....
发表于 06-20 14:24 72次 阅读
PCB设计过程中需要考虑的因素

FPGA和ASIC之间界限正在模糊,FPGA为未来的ASIC提供设计架构

该系列器件现在包括从基本的可编程逻辑一直到复杂的SoC。在各种应用领域(包括汽车,AI,企业网络,航....
发表于 06-20 14:13 49次 阅读
FPGA和ASIC之间界限正在模糊,FPGA为未来的ASIC提供设计架构

可编程在辅助驾驶系统中的应用

通过消除繁琐的驾驶动作,辅助驾驶还可提供更高的舒适水平。例如,传统的巡航控制允许司机设定一个固定的行....
发表于 06-20 14:01 26次 阅读
可编程在辅助驾驶系统中的应用

Xilinx的7系列FPGA高速收发器:TX发送端的介绍

每一个收发器拥有一个独立的发送端,发送端有PMA(Physical Media Attachment....
发表于 06-20 13:48 40次 阅读
Xilinx的7系列FPGA高速收发器:TX发送端的介绍

FPGA学习系列:21. 自动售货机的设计

设计背景: 我们从开始学习 FPGA。到现在也慢慢的学到了血多的东西,那么我们就应该慢慢的去学习深一....
的头像 FPGA学习交流 发表于 06-20 10:41 638次 阅读
FPGA学习系列:21. 自动售货机的设计

关于FFT硬件实现,设计中RAM输出端为何没有使用REG

以2048点为例,根据理论值计算,计算一次2048点的IFFT的时间应为130us。在采用流水线的方....
的头像 FPGA极客空间 发表于 06-20 09:05 366次 阅读
关于FFT硬件实现,设计中RAM输出端为何没有使用REG

小米6月25日公开招股 三星GPU率先用于入门级Exynos芯片

小米宣布进行IPO以来,估值一直一波三折,最新香港经济日报消息,小米CDR发行紧急煞停,有消息人士引....
的头像 章鹰 发表于 06-20 08:59 538次 阅读
小米6月25日公开招股 三星GPU率先用于入门级Exynos芯片

华为P20 系列即将搭载GPU Turbo,成就性能提升+续航零压力

GPU Turbo技术彻底火了!从华为对外公布GPU Turbo之后,这一技术立刻成为专业科技类媒体....
发表于 06-19 16:56 146次 阅读
华为P20 系列即将搭载GPU Turbo,成就性能提升+续航零压力

关于PIC和FPGA的区别及优缺点总结

FPGA是逻辑门器件,可以配置成为并行逻辑模块。FPGA最大优点是并行处理。例如构建一百个与非门,F....
的头像 FPGA极客空间 发表于 06-19 16:20 215次 阅读
关于PIC和FPGA的区别及优缺点总结

增强机器学习能力的“左膀右臂”的GPU、FPGA芯片

FPGA是帮助公司和研究人员解决问题的芯片。FPGA是一种集成电路,可以编程为多种用途。它有一系列“....
的头像 人工智能学家 发表于 06-19 15:27 343次 阅读
增强机器学习能力的“左膀右臂”的GPU、FPGA芯片

基于FPGA的PCIe设备如何才能满足PCIe设备的启动时间的要求?

根据PCIe的协议,当设备启动后,PCIe设备必须满足启动时间的要求,即上电后100ms内,完成PC....
发表于 06-19 10:24 57次 阅读
基于FPGA的PCIe设备如何才能满足PCIe设备的启动时间的要求?

如何避免升级失败而使FPGA变砖呢?

如果升级过程中出现意外情况,FLASH里面原有的固件被破坏,那么FPGA能够从备份固件区启动配置,即....
发表于 06-19 10:09 46次 阅读
如何避免升级失败而使FPGA变砖呢?

单片机中按键消抖程序

效率上来说,延时消抖花费时间在无意义延时上,而相对较好的定时轮询还是不可避免的在轮询,而现在这种方式....
的头像 电子工程专辑 发表于 06-19 08:55 286次 阅读
单片机中按键消抖程序

DE1的SoC开发工具包的用户手册详细资料免费下载

DE1的SoC开发工具包提供了一个强大的硬件设计平台建立在片上系统(SoC)FPGA公司,它结合了最....
发表于 06-19 08:00 21次 阅读
DE1的SoC开发工具包的用户手册详细资料免费下载

如何建立OpenCL开发环境编译和执行DE1 SoC的示例项目的详细概述

DE1 SoC是Altera片上系统(SOC)FPGA构建的一个健壮的硬件设计平台,它是Altera....
发表于 06-19 08:00 15次 阅读
如何建立OpenCL开发环境编译和执行DE1 SoC的示例项目的详细概述

SOPC和FPGA的介绍和基础实验的详细资料概述

本文档的主要内容详细介绍的是SOPC和FPGA的介绍和基础实验的详细资料概述包括了:FPGA基础实验....
发表于 06-19 08:00 31次 阅读
SOPC和FPGA的介绍和基础实验的详细资料概述

DE2-115板的详细介绍和实验指导的详细资料概述

这个练习的目的是学习如何将简单的输入和输出设备连接到FPGA芯片上,并实现使用这些设备的电路。我们将....
发表于 06-19 08:00 26次 阅读
DE2-115板的详细介绍和实验指导的详细资料概述

LabVIEW状态图模块的详细介绍和使用手册详细概述

该模块在 LabVIEW 中增加了创建状态图的功能,以开収基于事件的控制与测试系统。状态图编程模块迚....
发表于 06-19 08:00 22次 阅读
LabVIEW状态图模块的详细介绍和使用手册详细概述

使用FPGA在C6678的外部实现中断控制器,这样的结构是否可以实现外部设备给指定的core发送中断?为什么?

发表于 06-19 05:20 23次 阅读
使用FPGA在C6678的外部实现中断控制器,这样的结构是否可以实现外部设备给指定的core发送中断?为什么?

请问若DSP和FPGA通过SRIO通信,若FPGA做主设备,DSP可以自己想FPGA发起读写操作吗?

发表于 06-19 03:02 26次 阅读
请问若DSP和FPGA通过SRIO通信,若FPGA做主设备,DSP可以自己想FPGA发起读写操作吗?

简谈FPGA的上电复位

大家好,博主最近有事忙了几天,没有更新,今天正式回来了。那么又到了每日学习的时间了,今天咱们来聊一聊....
的头像 FPGA学习交流 发表于 06-18 19:24 627次 阅读
简谈FPGA的上电复位

FPGA学习系列:18. 数码管的设计

设计背景: 数码管是一种半导体发光 器件 ,其基本单元是发光二极管。 数码管在我们的许多设计中都又用....
的头像 FPGA学习交流 发表于 06-18 19:24 652次 阅读
FPGA学习系列:18. 数码管的设计

FPGA学习系列:19. rom到数码管显示设计

设计背景: rom是读写的的静态存储单元,在我们的设计中我们会经常用到,数码管模块同样的大大小小的设....
的头像 FPGA学习交流 发表于 06-18 19:24 530次 阅读
FPGA学习系列:19. rom到数码管显示设计

FPGA学习系列:20. ram控制器的设计(调用IP核)

设计背景: 随机存取存储器 (random access memory,RAM)又称作随机存储器,是....
的头像 FPGA学习交流 发表于 06-18 19:24 642次 阅读
FPGA学习系列:20. ram控制器的设计(调用IP核)

Verilog实现开方运算(自己编写的)

发表于 06-18 16:08 226次 阅读
Verilog实现开方运算(自己编写的)

重磅!2018年中国人工智能产业展望 四大亮点和四大问题

展望2018年,人工智能软硬件技术创新将持续推进,认知智能渐行渐近;产业进入稳步增长阶段,行业内资源....
的头像 章鹰 发表于 06-15 14:24 5878次 阅读
重磅!2018年中国人工智能产业展望 四大亮点和四大问题

你一定想知道FPGA的那些事...

作者:张泽小脚丫STEP 导读:FPGA(Field Programmable Gate Array....
发表于 06-14 13:35 325次 阅读
你一定想知道FPGA的那些事...

厉害了我的华为!华为Mate 10系列搭载GPU Turbo

华为手机为国产机代言,其中P20销量破600万台了,最近还有个令人惊叹的旗舰机发布了,那就是华为Ma....
的头像 肖青梅 发表于 06-14 11:44 1603次 阅读
厉害了我的华为!华为Mate 10系列搭载GPU Turbo

苹果计划投资300亿美元在美国建立新园区 英特尔计划2020年推出首款GPU

据彭博社北京时间6月13日报道,苹果CEO蒂姆·库克(TimCook)在接受彭博社采访时表示,苹果计....
的头像 章鹰 发表于 06-14 10:32 933次 阅读
苹果计划投资300亿美元在美国建立新园区 英特尔计划2020年推出首款GPU

Skylaking服务器升级 支持Optane缓存和GPU

Hitachi Vantara利用Skylake处理器升级了更多服务器,并增加支持Optane SS....
的头像 存储界 发表于 06-14 09:13 204次 阅读
Skylaking服务器升级 支持Optane缓存和GPU

回顾台北GTC的重要发布

计算系统将为全球范围内数万亿美元的产业带来改变,而GPU在计算生态系统中处于核心位置。
的头像 英伟达NVIDIA企业解决方案 发表于 06-13 11:36 414次 阅读
回顾台北GTC的重要发布

英特尔进军显卡市场,预计2020年推出独立GPU

英特尔在CPU的地位已经难以撼动,尤其是在电脑端,可以说是称霸已久,但是在GPU方面却没有占据领导地....
的头像 肖青梅 发表于 06-13 11:05 609次 阅读
英特尔进军显卡市场,预计2020年推出独立GPU

IBM全新AI芯片设计登上Nature,解决GPU的算力瓶颈

现如今的人工智能的神经网络与GPU密不可分,但是GPU的算力对于未来神经网络的发展是不够用的,好在I....
发表于 06-13 09:28 91次 阅读
IBM全新AI芯片设计登上Nature,解决GPU的算力瓶颈

88lifa利发国际娱乐

百度360搜索搜狗搜索