Adreno6系架构是新架构,不同于上代5系,A630相对A540性能提升44%,比较可观,到了A640相对上代仅提升20%,不禁让人疑惑。
现在目前有两种说法,一种说法是Adreno6系由于Rops/Tmus跟不上Shader ALU规模,多堆的ALU对性能提升不大。Adreno的Rops/Tmus数量无从所知,由于高通多年都没公布过Adreno架构细节,我们只知道ALU规模,不过也有人推测A630可能有16Rops/24Tmus,那么A640架构不变,应该有24Rops/36Tmus。
具体另一种是内存带宽不够,双通道LPDDR4x@1866MHz带宽为29.9GB/s,提升到2133MHz带宽来到了34.1GB/s,虽然带宽有提升但这带宽未必够了。
我个人更倾向于第二种说法,隔壁果子发布XS系列特别说到A12 GPU支持无损内存压缩,而高通还没有提到这样的技术,没有内存无损压缩的Adreno被不够的内存带宽限制成为性能提升的瓶颈。
那么第一种说法我的看法呢,我先拿桌面显卡举例,这里贴出GTX1050Ti核心,(因为不知NV会不会推出图灵架构50Ti/50显卡) 768个CUDA,32个Rops,48个Tmus,7Gbps GDDR5 128Bit显存,(即使推出新一代图灵同级别显卡,那也是配4组光栅单元,一组8个总共32个Rops;然后可能类似2080的GPC配两组,64个Tmus)。那么A630、A640的Rops/Tmus数量可以说对上Shader ALU规模不算是瓶颈,和N卡的同流处理器比例GP107核心相比为75%。(768 or 690ALU,24Rops/36Tmus;512 or 460ALU,16Rops/24Tmus相对于同流处理器比例GP107核心都为75%) 而1050Ti拥有4GB的GDDR5显存,显存带宽112.1GB/s,比目前这代旗舰移动SOC仅有的34.1GB/s高出一大截。
◎技术讨论,小白别过度水,甚至和主帖无关的话题!
本人作为通粉多年,搭载高通SOC机器可没少买过,这次S855发布GPU提升20%的确很有限,确实想了很多分析原因,欢迎各方有见解吧有讨论
现在目前有两种说法,一种说法是Adreno6系由于Rops/Tmus跟不上Shader ALU规模,多堆的ALU对性能提升不大。Adreno的Rops/Tmus数量无从所知,由于高通多年都没公布过Adreno架构细节,我们只知道ALU规模,不过也有人推测A630可能有16Rops/24Tmus,那么A640架构不变,应该有24Rops/36Tmus。
具体另一种是内存带宽不够,双通道LPDDR4x@1866MHz带宽为29.9GB/s,提升到2133MHz带宽来到了34.1GB/s,虽然带宽有提升但这带宽未必够了。
我个人更倾向于第二种说法,隔壁果子发布XS系列特别说到A12 GPU支持无损内存压缩,而高通还没有提到这样的技术,没有内存无损压缩的Adreno被不够的内存带宽限制成为性能提升的瓶颈。
那么第一种说法我的看法呢,我先拿桌面显卡举例,这里贴出GTX1050Ti核心,(因为不知NV会不会推出图灵架构50Ti/50显卡) 768个CUDA,32个Rops,48个Tmus,7Gbps GDDR5 128Bit显存,(即使推出新一代图灵同级别显卡,那也是配4组光栅单元,一组8个总共32个Rops;然后可能类似2080的GPC配两组,64个Tmus)。那么A630、A640的Rops/Tmus数量可以说对上Shader ALU规模不算是瓶颈,和N卡的同流处理器比例GP107核心相比为75%。(768 or 690ALU,24Rops/36Tmus;512 or 460ALU,16Rops/24Tmus相对于同流处理器比例GP107核心都为75%) 而1050Ti拥有4GB的GDDR5显存,显存带宽112.1GB/s,比目前这代旗舰移动SOC仅有的34.1GB/s高出一大截。
◎技术讨论,小白别过度水,甚至和主帖无关的话题!
本人作为通粉多年,搭载高通SOC机器可没少买过,这次S855发布GPU提升20%的确很有限,确实想了很多分析原因,欢迎各方有见解吧有讨论