^-^
人工智能、计算机、机器学习、linux、程序员
FFT的CUDA实现
最近更新:2021-06-05   |   字数总计:10.7k   |   阅读估时:47分钟   |   阅读量:
  1. 算法原理及设计思路
    1. 常规FFT实现(Cooley-Tukey)
      1. 公式推导与计算结构
      2. 倒序计算
      3. 倒序存储
      4. 非向量化的数据抽取方式
    2. 向量化的DFT分解方法(Stockham Autosort Framework)
      1. 计算分解与结构
      2. 算法实现与数据抽取
  2. 4096点STFFT基本实现
    1. 计算框架与工程方法
    2. CUDA实现
      1. C语言验证
      2. CUDA C实现
  3. 大点数FFT的计算方法
    1. 以16384点DIF-FFT为例分析计算结构
    2. 65536*4以上大点数的处理方法
      1. 时间测试