实习四年,发表国际核心会议论文3篇;山西姑娘韩淑捷变身“硬盘医生”
【实习四年,发表国际核心会议论文3篇;山西姑娘韩淑捷变身“硬盘医生”】本文转自:山西晚报
文章图片
文章图片
3月8日消息 , 阿里巴巴集团公布2022“研究型实习生”计划 , 面向海内外高校学生开放200多个科研选题 , 入选者将与达摩院、阿里云等团队合作探索前沿技术 。阿里为大家提供场景、资源、补助等支持 , 优秀实习生有望获得阿里巴巴集团首席技术官(CTO)程立的推荐信 。
研究型实习生项目始创于2017年 , 旨在将产业界的场景和资源化作象牙塔外的另一处科研土壤 , 帮助青年学子开拓科研视野、实现学术目标 。目前 , 全球已有200多所高校的1000多名学生参与该项目 , 他们绝大部分来自计算机相关领域 , 博士生占比超7成 。
山西姑娘韩淑捷 , 2021年在香港中文大学计算机科学与工程系获得博士学位 , 现在在北京大学计算机学院从事博雅博士后研究 。2018年6月到阿里实习 , 可能是阿里最资深的实习生 , 也是优秀实习生中为数不多的女性 。实习选题是“大规模数据中心存储系统硬盘故障分析和预测” , 实习期间发表国际核心会议论文3篇 , 两篇一作分别被存储系统领域排名第一的顶会FAST’21和ICDCS'20接收 , 一篇通讯作者被DSN'21接收 。
做“硬盘医生” , 根据“临终”状态判断它什么时候挂
韩淑捷说 , 2018年6月开始实习 , 当时我还是博士一年级生 , 现在已经博士毕业 , 在北大做博后了 。我的博士研究方向是智能运维 , 实习期分了一期二期三期 , 每年的选题都有变化 。第一年来产业界时 , 我本科刚毕业 , 升了直博 , 正在寻找博士研究方向 。第一年实习比较辛苦 , 经历了和团队的磨合 , 也沉淀了科研经验 。到第二年就上正轨了 。
最终 , 我确定了研究方向:数据中心存储系统智能运维 。在部署了超百万机械硬盘和固态硬盘的阿里云数据中心 , 开展这个研究再合适合适 , 这里有学术界所没有的真实场景 , 有大量来自现实的问题和需求 。
关于我的领域 , 这么解释吧:阿里云提供遍布全球的云服务 , 云服务的背后是位于全球多个位置的超大规模数据中心 , 我们研究数据中心的存储系统 , 比如硬盘、内存等等 。以前 , 这些存储介质都靠人工维护 , 如果一个盘坏了 , 就要找到盘所在的位置 , 把它换掉 。今天数据中心规模这么庞大 , 靠人肯定是不行了 , 成本太高了 。所以几年前我们开始探索用智能化手段来分析预测硬盘故障 。
做故障预测 , 首先要分析硬盘的特性 , 在硬盘初步显露“病症”时就识别出问题 。硬盘濒临损坏时 , 跟人快生病的状态差不多 , 硬盘彻底坏掉就相当于人快要挂掉的状态 。我们要从硬盘的运行数据中判断它会不会生病 , 也就是发现故障前征兆 , 比如小的扇区出现的小错误 , 并且从硬盘的“临终”前状态判断它什么时候挂 。
我们通过采集存储介质的状态数据 , 搭建机器学习算法 , 对全球数据中心硬盘的运行状态进行监测 , 让机器自动寻找故障前征兆 。一旦预测到哪些硬盘会坏 , 就提前做好数据搬运和硬盘替换 。
愿意踩没人踩过的坑 , “干一行爱一行”
研究智能运维 , 既要懂存储 , 也要懂AI算法 , 这是个交叉学科 。韩淑捷读博期间 , 学校的实验室是做存储系统研究的 , 但那以前只研究传统方法 。智能运维是她的博导和阿里团队一起想到的方向 , 在学校实验室 , 没人有这方面的研究经验 , 换句话说 , 没人开过这坑 。
- 浦江创新论坛寻找“青年的声音”,邀青年科学家和创业者发表“3V”
- Geekbench指责三星操纵基准测试,将过去四年的Galaxy旗舰机除名
- 西安电子科技大学王军利教授团队在国际顶级期刊发表研究论文
- 6G盛会,要来了!
- 网易云音乐如何发表动态(网易云音乐发表状态步骤分享)
- 淘宝怎么不能删评价了(淘宝发表评价删除步骤分享)
- 期刊独家回应,还原韩春雨最新论文发表过程
- 去年全球智能手机出货量四年来首次增长:三星苹果小米分列前三
- 2022今日头条怎么看自己发表的评论(2022今日头条历史评论查看步骤)
- 佳能石井俊幸发表2022年新春祝语祝中国消费者虎年行大运