引言进阶篇的核心是让你从“会写”到“会优化”。本专题精选20道面试真题,聚焦CUDA内存层次、合并访问、共享内存、寄存器压力等进阶篇核心内容,帮你系统检验学习成果。一、选择题(6题)1.1 关于CUDA内存层次,下列说法正确的是?(⭐⭐)A. 寄存器的访问速度比共享内存慢B. 全局内存的访问延迟约400周期,共享内存约30周期C. 常量内存的容量比全局内存大D. 本地内存(local memory)位于片上存储正确答案:B深度解析:寄存器最快(1周期),共享内存约30周期,全局内存约400周期。本地内存虽然线程私有,但物理上位于全局内存(显存),访问速度与全局内存相当。常量内存容量仅64KB,远小于全局内存。本题考察对内存层次速度的基本认知。1.2 关于寄存器溢出,下列说法错误的是?(⭐⭐⭐)A. 寄存器溢出会导致变量被存入本地内存B. 编译时加-Xptxas=-v可以查看是否溢出C. 寄存器溢出后,访问速度从1周期降到约400周期D. 寄存器溢出通常发生在每个线程使用寄存器太少时正确答案:D深度解析:寄存器溢出发生在每个线程需要的寄存器超过