来来的爸爸不睡觉no-sleep Lailai's father |
|
星期四 五月 14, 2009
发表在Sun SDN上的DISK FMA系列文章
SCSI DISK FMA Project Part 1: SCSI Device Drivers as FMA Telemetry Detectors 介绍如何利用设备驱动程序正常运转的同时当做磁盘错误侦测器(in-band)
介绍如果根据系统产生的错误信息进行分析定位
SCSI DISK FMA Project Part 3: FMA Behavior of Retired Faulted SCSI Disks 介绍系统在发生致命磁盘错误时候的行为和建议修复的步骤
SCSI DISK FMA Project Part 4: SD Fault Injection 做这个项目的时候,为了方便测试在SD(SCSI Disk Driver)内核程序中加入的debug交互程序。这个是顺手做的(呵呵)
我们这几篇文章虽然没有费多少时间,但是是近1年来几位工程师通力合作的成果,这种半创新的项目比做一个纯粹的设备驱动反而要难(我在项目遇到困难的时候,老外就这样鼓励我,最终我们还是按时完成了)
顺便说一下我们下一步的计划: 1)增强在没有设备id情况下对多路径的支持 - 在多路径传输情况下,传输层错误是很难对应到具体设备id的,这时候需要想一个办法表示错误的发生地点,以及具体定位错误的方法。 2)增强对通用平台的支持-前期工作只是针对sun的7000产品系列平台,如果要做到所有安装了opensolaris机器都支持此功能,还需要加入通用平台支持算法。 3)增强对JBOD设备的错误诊断和表示-JBOD和7000系列是sun增长最快的业务,便宜呗,嘿嘿。 4)思考如何针对SSD固态硬盘错误侦测,比如“wear leveling”。
Posted at 10:49下午 五月 14, 2009 by ydzhang in Sun | 评论[0] |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||