王颖:认知存储器(Cognitive SSD):一种近数据深度学习系统
发布时间:2019-08-26 发布人:王墨林
报告题目:认知存储器(Cognitive SSD):一种近数据深度学习系统
时间:2019 年 8 月 27 日(周二)下午 2:00
地点:翡翠湖校区科教楼第一会议室
报告人:王颖 副研究员
工作单位:中科院计算所
举办单位:电子科学与应用物理学院、微电子学院
报告人简介:
王颖博士,中科院计算所副研究员,硕导,中国科学院大学获得计算机体系结构博士学位。主要研究方向包括集成电路设计自动化,容错体系结构,物端人工智能系统,高能 效芯片片设计与存储系统设计。共发表 30 余包含 IEEE TCAD,TPDS,TVLSI 等在内的 SCI 论 文,以及 60 余篇包含 DAC, ICCAD,DATE,ATC 等在内的重要集成电路与计算机系统结构领域国际会议论文。王颖博士曾于 2017 年入选中国科协青年人才托举计划,并于同年 获得 Intel-CCF 青年学者奖。2016 年获得 IEEE Rebooting LPIRC 低功耗图像识别赛冠军, 以及 2018 年 DAC SDC 图像识别挑战赛一项冠军。此外,他还担任多个国际期刊如 IEEE TVLSI, TCAD, TC 等期刊审稿人,以及多个国际会议的程序委员会委员。
摘要:
数据的爆炸式增长对存储系统的容量,性能等要求不断提高,也使得快速定位目标数 据,以及高效地从大规模存储数据中分析提取关键信息成为目前的迫切需求。然而,在传统的以计算为中心的体系结构中,数据请求在下发到底层存储之前,需要经过系统复杂且 冗长的 I/O 软件栈,并穿越缓存,I/O 接口,DRAM,以及多级 Cache,才能到达数据处理 单元,数据搬运所造成的性能与功耗开销已成为提高数据处理系统性能亟需解决的障碍,因 此如何利用近数据计算技术(Near Data Processing)提升存储系统能效成为新一代的研究热点。 目前,深度学习在各个领域的突破使得深度学习芯片大放异彩,然而,目前深度学习 芯片部署在以计算为中心的结构中无法解决冗长的数据搬运路径和软件栈导致的问题。因此,我们提出了基于固态硬盘的 Cognitive SSD 系统,通过利用近数据深度学习加速技术 (Near Data Deep Learning,NDDL),将深度学习处理器嵌入到存储设备中,设计了认知存储系统的控制与访问接口,并实现了集成低功耗深度学习加速器的认知存储主控芯片, 使得计算单元能够直接从存储介质中获取数据,缩短数据的传输路径,减少数据的迁移次数。同时,通过优化存储内部数据布局,该系统可以充分利用存储内部带宽来满足深度学习处理器的带宽要求。另一方面,该系统可以独立响应数据分析处理请求,简化了上层软件栈,降低了系统的功耗,提高了数据处理系统的性能。目前,该系统可以用于为高能效数据中心乃至边缘计算设备提供高能效的图像/视频检索,文件分类,数据格式转换等功能解决方案。
时间:2019 年 8 月 27 日(周二)下午 2:00
地点:翡翠湖校区科教楼第一会议室
报告人:王颖 副研究员
工作单位:中科院计算所
举办单位:电子科学与应用物理学院、微电子学院
报告人简介:
王颖博士,中科院计算所副研究员,硕导,中国科学院大学获得计算机体系结构博士学位。主要研究方向包括集成电路设计自动化,容错体系结构,物端人工智能系统,高能 效芯片片设计与存储系统设计。共发表 30 余包含 IEEE TCAD,TPDS,TVLSI 等在内的 SCI 论 文,以及 60 余篇包含 DAC, ICCAD,DATE,ATC 等在内的重要集成电路与计算机系统结构领域国际会议论文。王颖博士曾于 2017 年入选中国科协青年人才托举计划,并于同年 获得 Intel-CCF 青年学者奖。2016 年获得 IEEE Rebooting LPIRC 低功耗图像识别赛冠军, 以及 2018 年 DAC SDC 图像识别挑战赛一项冠军。此外,他还担任多个国际期刊如 IEEE TVLSI, TCAD, TC 等期刊审稿人,以及多个国际会议的程序委员会委员。
摘要:
数据的爆炸式增长对存储系统的容量,性能等要求不断提高,也使得快速定位目标数 据,以及高效地从大规模存储数据中分析提取关键信息成为目前的迫切需求。然而,在传统的以计算为中心的体系结构中,数据请求在下发到底层存储之前,需要经过系统复杂且 冗长的 I/O 软件栈,并穿越缓存,I/O 接口,DRAM,以及多级 Cache,才能到达数据处理 单元,数据搬运所造成的性能与功耗开销已成为提高数据处理系统性能亟需解决的障碍,因 此如何利用近数据计算技术(Near Data Processing)提升存储系统能效成为新一代的研究热点。 目前,深度学习在各个领域的突破使得深度学习芯片大放异彩,然而,目前深度学习 芯片部署在以计算为中心的结构中无法解决冗长的数据搬运路径和软件栈导致的问题。因此,我们提出了基于固态硬盘的 Cognitive SSD 系统,通过利用近数据深度学习加速技术 (Near Data Deep Learning,NDDL),将深度学习处理器嵌入到存储设备中,设计了认知存储系统的控制与访问接口,并实现了集成低功耗深度学习加速器的认知存储主控芯片, 使得计算单元能够直接从存储介质中获取数据,缩短数据的传输路径,减少数据的迁移次数。同时,通过优化存储内部数据布局,该系统可以充分利用存储内部带宽来满足深度学习处理器的带宽要求。另一方面,该系统可以独立响应数据分析处理请求,简化了上层软件栈,降低了系统的功耗,提高了数据处理系统的性能。目前,该系统可以用于为高能效数据中心乃至边缘计算设备提供高能效的图像/视频检索,文件分类,数据格式转换等功能解决方案。