高通吧 关注:173,401贴子:4,219,312

这代GPU性能提升有限讨论Adreno瓶颈在何处

只看楼主收藏回复

Adreno6系架构是新架构,不同于上代5系,A630相对A540性能提升44%,比较可观,到了A640相对上代仅提升20%,不禁让人疑惑。
现在目前有两种说法,一种说法是Adreno6系由于Rops/Tmus跟不上Shader ALU规模,多堆的ALU对性能提升不大。Adreno的Rops/Tmus数量无从所知,由于高通多年都没公布过Adreno架构细节,我们只知道ALU规模,不过也有人推测A630可能有16Rops/24Tmus,那么A640架构不变,应该有24Rops/36Tmus。
具体另一种是内存带宽不够,双通道LPDDR4x@1866MHz带宽为29.9GB/s,提升到2133MHz带宽来到了34.1GB/s,虽然带宽有提升但这带宽未必够了。
我个人更倾向于第二种说法,隔壁果子发布XS系列特别说到A12 GPU支持无损内存压缩,而高通还没有提到这样的技术,没有内存无损压缩的Adreno被不够的内存带宽限制成为性能提升的瓶颈。
那么第一种说法我的看法呢,我先拿桌面显卡举例,这里贴出GTX1050Ti核心,(因为不知NV会不会推出图灵架构50Ti/50显卡) 768个CUDA,32个Rops,48个Tmus,7Gbps GDDR5 128Bit显存,(即使推出新一代图灵同级别显卡,那也是配4组光栅单元,一组8个总共32个Rops;然后可能类似2080的GPC配两组,64个Tmus)。那么A630、A640的Rops/Tmus数量可以说对上Shader ALU规模不算是瓶颈,和N卡的同流处理器比例GP107核心相比为75%。(768 or 690ALU,24Rops/36Tmus;512 or 460ALU,16Rops/24Tmus相对于同流处理器比例GP107核心都为75%) 而1050Ti拥有4GB的GDDR5显存,显存带宽112.1GB/s,比目前这代旗舰移动SOC仅有的34.1GB/s高出一大截。
◎技术讨论,小白别过度水,甚至和主帖无关的话题!
本人作为通粉多年,搭载高通SOC机器可没少买过,这次S855发布GPU提升20%的确很有限,确实想了很多分析原因,欢迎各方有见解吧有讨论


IP属地:广西来自Android客户端1楼2019-01-25 20:12回复
    大跃进应该在7系吧


    IP属地:广东来自Android客户端2楼2019-01-25 20:22
    回复
      事实上Adreno640多堆出来的那部分规模是用于提升AI机能的,我们应该把640看作是630的完整版更合适一点。


      IP属地:广东来自Android客户端3楼2019-01-25 20:27
      收起回复
        我想是希望下一代用上LPDDR5内存解决瓶颈或是Adreno也开始支持无损内存压缩技术,性能能有挺大提升


        IP属地:广西来自Android客户端4楼2019-01-25 20:30
        回复(3)
          不是早就说过多出来规模用来跑ai了嘛?


          IP属地:江苏来自Android客户端5楼2019-01-25 20:32
          回复
            我倒很想看看8cx上那颗680的表现,那个应该才是6系上最顶级的表现。不知道会不会上手机,集成基带的封装面积居然比麒麟960还小一点点。


            IP属地:广东来自Android客户端6楼2019-01-25 20:34
            收起回复
              吃瓜的表示应该是很久没和农企py了,得不到新技术


              来自Android客户端7楼2019-01-25 22:41
              回复
                看看8cx吧,那个带宽够应该。。而且如果a640的768alu-585MHz是真的的话,算下来性能提升本来就不到30%再算上效率,20%多点应该是正常的


                来自Android客户端8楼2019-01-25 22:51
                回复
                  而且630比540效率下降了不少,不知道是不是跑ai去了,但是a640感觉很奇怪,能效比好像才提升30%左右,和10lpp-7ff的提升幅度差不了多少,还降了不少频率,难道准备再造一个835那样的性能功耗平衡神Soc?530-540提升幅度也不大,但是效率提高不少,但是630-640效率也没高,甚至还想下降,除非说是拿出来一大波专门跑ai,但跑ai和图像冲突么(这里我真的不懂)。。


                  来自Android客户端9楼2019-01-25 22:57
                  回复(24)
                    我现在看到有些说法是adreno630 640跑3D时都只启用了一半ALU


                    IP属地:山东来自Android客户端10楼2019-01-25 23:23
                    回复(1)
                      有些alu是用来跑ai的 精度可能不够吧 不能用来跑3d什么的 而且可能cpu提升很大 发热功耗什么的gpu让了点 说不定更新个驱动就提升了 但我估计这一代是赶不上苹果了


                      IP属地:浙江来自iPhone客户端11楼2019-01-26 00:56
                      回复
                        高通从adreno 500开始有UBWC的通用频宽压缩,并不是没有


                        IP属地:中国台湾来自Android客户端12楼2019-01-26 02:46
                        回复(3)
                          a640还有个问题是能耗进步太少,换了7nm+堆核降频能耗竟然没翻翻?才进步30%,mali g76 用上7nm能耗直接大跃进,查太多了


                          IP属地:中国台湾来自Android客户端13楼2019-01-26 02:54
                          回复(6)
                            和gcn一样吧,几何前端rops吞吐量无法满足流处理器需求,控制单元和流处理器比列不到位,流处理器利用率低下


                            IP属地:四川来自Android客户端14楼2019-01-26 08:18
                            回复
                              20%还不知足,你也不看看530和540


                              IP属地:北京来自Android客户端15楼2019-01-26 08:37
                              回复(2)