more >>SGEMM:Single precision floatiing General Matrix Multiply
本文的SGEMM实现思路整理于MaxAs wiki和对MaxAs项目SGEMM汇编代码的理解。
MaxAs是一个开源的Maxwell架构GPU汇编器: Github链接
作者Scott Gray提到两篇相关论文MAGMA paper和Kepler sgemm paper
more >>SGEMM:Single precision floatiing General Matrix Multiply
本文的SGEMM实现思路整理于MaxAs wiki和对MaxAs项目SGEMM汇编代码的理解。
MaxAs是一个开源的Maxwell架构GPU汇编器: Github链接
作者Scott Gray提到两篇相关论文MAGMA paper和Kepler sgemm paper
more >>随着海量数据的出现和模型参数的增多,我们必然需要更大的集群来运行模型,这样最大的好处在于把原本可能需要周级别的训练时间缩短到天级别甚至小时级别。未来的模型训练面对的都是上亿数据和上亿参数,稳定的计算能力和管理便捷的集群环境至关重要。Kubernetes 是目前应用最广泛的容器集群管理工具之一,它可以为对分布式TensorFlow 的监控、调度等生命周期管理提供所需的保障。
more >>CUDA是一种通用的并行计算平台和编程模型,是在C语言上扩展的。借助于CUDA,你可以像编写C语言程序一样实现并行算法。你可以在NIVDIA的GPU平台上用CUDA为多种系统编写应用程序,范围从嵌入式设备、平板电脑、笔记本电脑、台式机工作站到HPC集群。在CUDA编程平台中,GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,可以看成是CPU的协处理器,因此当我们在说GPU并行计算时,其实是指的基于CPU+GPU的异构计算架构。在异构计算架构中,GPU与CPU通过PCIe总线连接在一起来协同工作,CPU所在位置称为为主机端(host),而GPU所在位置称为设备端(device)。
more >>第一次看高光谱相关的paper,大概?由于光谱波段之间的高度相关特性,高光谱图像受到信息冗余的影响,这可能会降低在某些极端条件的情况下对材质的判别能力。此外,高光谱纬度沿着光谱域的逐渐增加,需要大存储功能和高性能计算。因此,对高光谱图像进行降维处理,具有重要的研究和实际意义。
本文从无监督、监督和半监督模型三个方面介绍基于非凸模型的高光谱图像降维方法。
more >>之前写过jupyter notebook如何远程炼丹,今天给憨憨姐姐写一个远程炼丹指南,介绍一下PyCharm的SFTP功能
SFTP有两点要注意:
- 配置远程连接信息。
- 设置本地和远程路径的映射。
除了SFTP的映射外,PyCharm还支持直接使用远程的解释器,这样就多了一步:
- 设置远程解释器。
more >> 《Combinatorial Optimization Theory and Algorithms(6th,2018)》是一本内容相当广泛而全面的教材,但因其证明的晦涩使人望而却步,本文的目的是整理本学期所学内容涉及的相关结果,仅给出概括性描述,如对相关结果感兴趣,可从此书中找到相关内容及引文。
more >>记录一次kaggle比赛,这次比赛的场景主要是Jane Street日内高频交易,是短线模型,使用夏普率衡量模型效果,但是提供的数据并非原始数据,不清楚feature含义。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true