为了安装一台即将到货的SUN 4800和T3,我仔细看了一下SUN FIRE 6800/4810/4800/3800 System Manager Manual,并做了笔记,为了便于和原文对照,笔记严格按照原文的体系结构。对一些不必要的废话,都省略,力求精炼。 这一章概括地介绍了SUN 6800、4800、4810、3800的一些概念。目的是让你对这些系统特征有个基础的了解。不提供系统的设置,对系统的设置操作在第三章介绍。 这一章描述了: 分区(Partitions) 域(Domains ) 系统控制器(System Controller ) 冗余组件和最小配置(Redundant Components and Minimum Configurations) 可靠性、有效性和适用性(RAS) SUN 的管理中心软件(针对SUN 6800、4810、4800、3800) FrameManager(这个词不知道怎么翻译合适) 概括介绍 对于涉及的所有被管理的共享资源, 系统控制软件提供了一个中心控制的入口,使用术语platform 来标识。例如系统控制器 setupplatform 命令用来配置平台,具体怎么使用在后面介绍。 一个分区是一组转发板(a group of repeater boards),每个分区最大扩展到两个域。因为域在同一个分区里共享转发板,所以这个域不是完全隔离的。配置分区的数量的命令使用setupplatform来完成。你可以逻辑上划分一组系统板(CPU/内存板、I/O集)到一个域。一个域可以运行一个SOLARIS操作环境,不受其他域的影响。 系统控制器是板上内含的一个系统,连接到中央系统,它为域和平台的配置管理提供了一个指针,并且提供了到DOMAIN CONSOLES的一个入口。这个系统控制器由硬件和软件组成。这个系统控制器的命令让你可以配置平台、每个域,还有很多其他功能。
分区介绍: 你可以使用setupplatform命令来配置分区的数量,如果值被设置为SINGLE,这个系统被设置为一个分区,使用所有的转发板。如果被设置为DUAL,系统被设置为两个分区,在双分区模式下,两个小分区被建立,每个分区使用系统总转发板数量的一半。在6800上,在双分区模式下,每个分区可以设置有2个转发板。在4800、4810、3800上,在双分区模式下,每个分区可以有1个转发板,在单分区模式下,每个分区拥有所有的转发板。 分区和域如下所示: 6800 4810/4800/3800 分区数量: 2 2 在双分区模式激活的域 4 (ABCD) 2 (A、C) 在单分区模式下激活的域 2 (A、B) 2 (A、B)
域介绍 域包含下列特征: 每个域都能够运行SOLARIS操作系统环境 域之间彼此不会受到影响 每个域有它自己的外围设备和网络连接 每个域有它自己的唯一的主机ID和SOLARIS操作环境主机名 所有的系统在工厂都被默认配置为一个域(DOMAIN A) 一个域能够做到: 运行SOLARIS系统 进入 OPENBOOT PROM 进行POST 自检 要建立域,你既可以使用系统控制器的命令,也可以使用SUN 管理中心软件(FOR 6880/4800/4810/3800),一个大的域由系统的所有CPU/内存板、I/O集组成。一个小的域由一块CPU/内存板、I/O集组成。 一个激活的域(有开关可设置为ON,DIAG,SECURE)必须具备: 最少一块CPU/内存板 最少一个带有I/O卡的I/O集 最少一块转发板 充足的供电电源(不分配到单个域) 充足的冷切系统(不分配到单个域) 系统控制器(不分配到单个域) 今天先看到这
系统控制器介绍 系统控制器功能包括; 管理平台和域资源 监控平台和域资源 配置域 提供域CONSOLES 提供虚拟时间TOD(TIME OF DATE)到域 提供日期和时间到SOLARIS操作环境 提供时钟信号为所有使用的板 提供CONSOLES安全 执行域初始化 提供命令来升级firmware 执行环境监控 系统支持扩展到两块系统控制板,第二块控制板在主控制板时钟失效后使用。 串口和以太网端口介绍 在系统控制器上有两个端口: 串口(RS-232):使用串口(RS-232)来直接连接ASCII终端或网络终端 以太网端口:用来连接网络 TTYa 和TTYb 连接介绍 6800有一个内建的电缆从系统控制器连接到串行端口,使用TTYa连接到CONSOLE ,使用TTYb连接到framemanager。4810/4800/3800使用Y电缆提供TTYa和TTYb的连接。 到每个域和平台的连接 系统控制器允许到多个平台的连接(最大16个),但是到每个域的连接只允许有一个。 板状态 CPU/内存板和I/O集有四种不同的状态,所有的板都会处于其中的一种状态。 状态一:可用 板子未被分配到任何域,域通过适当的方式能够看到板子 状态二:被分配 扳子被分配给一个域,但还未激活,因为扳子没有被配置好。 状态三:活动的 板子被一个活动的域使用,一个活动的板子不能再分配,直到域被关闭为止 状态四:未应用 没有应用 使用showboards命令可显示板子的状态。你在platform shell下输入showboards –V ,可列出平台上所有的设备,在DOMAIN shell下 使用这个命令可显示出在域中所有的设备。 例如:在platform shell下 schostname:SC> showboards Slot Pwr Component Type State Status Domain ---- --- -------------- ----- ------ ------ /N0/SB0 On CPU Board Active Passed A /N0/SB2 On CPU Board Active Passed C /N0/SB4 On CPU Board Active Passed D /N0/IB6 On PCI I/O Board Active Passed A /N0/IB7 On PCI I/O Board Active Passed C /N0/IB8 On PCI I/O Board Active Passed D
schostname:SC> showboards -v Slot Grd Pwr Component Type State Status Domain ---- --- --- --------------- ----- ------ ------ SSC0 - On System Controller - Passed - SSC1 - On System Controller - - - ID0 - On Sun Fire 6800 Centerplane- - - PS0 0 On A152 Power Supply - OK - PS1 0 On A152 Power Supply - OK - PS2 0 On A152 Power Supply - OK - PS3 1 On A152 Power Supply - OK - PS4 1 On A152 Power Supply - OK - PS5 1 On A152 Power Supply - OK - FT0 0,1 On Fan Tray Low Speed OK - FT1 0,1 On Fan Tray Low Speed OK - FT2 0,1 On Fan Tray Low Speed OK - FT3 0,1 On Fan Tray Low Speed OK - RP0 0 On Repeater Board - OK - RP1 0 On Repeater Board - OK - RP2 1 On Repeater Board - OK - RP3 1 On Repeater Board - OK - /N0/SB0 0 On CPU Board Active Passed A /N0/SB1 1 On CPU Board Active Passed A /N0/SB2 0 On CPU Board Active Passed A /N0/SB3 1 On CPU Board Active Passed B /N0/SB4 0 On CPU Board Active Passed C /N0/SB5 1 On CPU Board Active Passed D /N0/IB6 0 On PCI I/O Board Active Passed A /N0/IB7 1 On PCI I/O Board Active Passed B /N0/IB8 0 On PCI I/O Board Active Passed C /N0/IB9 1 On PCI I/O Board Active Passed D
平台管理介绍 平台管理管理配置平台和系统的硬件组件,这个平台管理能够越过域管理硬件资源,包括: 配置平台(NETWORK、LOGS、SNMP) 设置系统控制口令 监控和控制平台内的电源 配置系统能够支持的最大数量的域 通过系统控制命令逻辑地划分硬件组到建立的域,如使用addboard and deleteboard,在 domain shell下也可执行 对域对CPU/内存板、I/O集的控制使用进行配置 Platform Shell platform shell是一种平台管理的操作环境,在这个shell下管理任务能够被执行,它不提供CONSOLE的信息 platform shell下的提示符是 schostname:SC>. Platform Console platform console通过串口进行连接,它提供了错误和一些信息消息。它不显示SOLARIS环境的CONSOLE消息,要看SOLARIS环境的CONSOLE消息只有到DOMAIN CONSOLE 下,它的提示符和 platform shell相同。 系统控制任务通过System Power-On执行 当你打开系统电源时,系统控制引导,并且开始系统控制的应用。包括: 打开各组件,例如(CPU/内存板、I/O集、风扇、转发板、电源) 恢复建立的域并激活
域管理介绍 系统控制器允许域管理执行以下任务: 通过逻辑划分系统板建立域,每个域有自己的SOLARIS操作系统,不受其他域的影响 对域进行设置 引导域 附加地,系统控制软件可以执行以下任务
对环境问题进行报警,例如温度过高 当发生紧急情况时自动关闭,例如当一个域的CPU温度过高时系统控制器软件自动关闭那个域。系统控制器会监控和显示所有的部件的温度和电压 依赖于你的设置,如果设置打开,当SOLARIS 内部发生问题。系统控制器会重新启动一个域。
Domain Shell domain shell是一种域管理的操作环境,在这个shell下域任务能够被执行,有四种domain shell(A-D) domain shell下的提示符是 schostname:domainID>. Domain Console 当域是活动的(SOLARIS在运行、PROM或POST在运行),你能访问到Domain Console,当你连接到Domain Console时,将会出现下面中的一种操作模式: SOLARIS 环境 (%或#提示符) PROM 环境(OK> 提示符) 域正在POST自检,你可以看到POST输出 域管理任务 在系统控制器上你可以访问到Domain Console来执行域管理任务,域管理任务包括: 系统控制器域管理任务 使用的系统控制命令 配置域 setupdomain 从一个域中添加或删除一个板子 addboard, deleteboard 关闭或开启板子 poweron, poweroff 检测CPU/内存板 testboard 设置域开关位置(这个开关可被设置为OFF、STANDBY、DIAG、SECURE) setkeyswitch 显示域的开关设置 showkeyswitch, showdomain 设置日期、时间、区域 setdate 显示日期和时间 showdate 显示环境控制源 showenvironment
虚拟域键开关 这个domain shell为每个域提供了一个虚拟键开关命令(setkeyswitch)。有5种开关设置off (default), on,standby, diag, and secure.这个命令的详细信息见后面的章节。当你把键开关从不活动状态(off, standby),改变为活动状态(on, diag, secure),按次序将会发生如下事件: 属于域的系统板打开 POST通电自检开始进行 所有的OpenBoot PROM都被配置以便这个域使用 SOLARIS操作系统开始运行,如果OpenBoot PROM auto-boot 被设置为TRUE。
环境监控 有传感器监控着温度、电压和电流。系统控制器以某种方式关注着这些传感器,确保环境数据维持在正常的水平。如果需要,系统控制器就关闭部件,以保证系统不被损坏,这将导致域自动关闭。
日志主机(LOGHOST) 系统控制器有永久存储器,存储错误、警告和其他信息。这些信息和SOLARIS的信息相隔离,为便于管理维护,这些信息可以发送到日志主机(LOGHOST)。要查看系统控制器的日志事件可通过系统控制器的showlogs 命令。这个LOGHOST可以是SUN 6800/4810/4800的管理中心软件。要使用SUN 6800/4810/4800中心管理软件,系统控制器必须连接到网络。SUN 6800/4810/4800中心管理软件已经出厂时安装,不需要另外安装。
冗余部件和最小配置介绍 CPU/内存板 所有的系统都支持多个CPU/内存板,每个域至少包含一块CPU/内存板,在一块CPU/内存板上的CPU数量最多是4个,最少是2个,你在订购时,在一块CPU/内存板上可订购2个CPU,也可订购4个CPU。
系统 最大CPU/内存板数 最大CPU数 Sun Fire 6800 system 6 24 Sun Fire 4810 system 3 12 Sun Fire 4800 system 3 12 Sun Fire 3800 system 2 8 在CPU/内存板上有4个内存区,每个内存区需要一个CPU,CPU是内存管理单元。每个内存区有8个插槽,这个内存模块必须4根内存条一组进行安装,为了对一个域进行操作在订购时,需要订购的内存条最小数量是4根。
冗余CPU/内存板 一个CPU失效或内存发生故障时,将会被域通过POST进行隔离,只要有一块CPU控制一个内存区能够正常工作,那么这个域就能够一直运行下去。
I/O集 所有的系统支持多个I/O集,每个系统只支持一种类型的I/O集。3800只支持CompactPCI I/O集,其他系统只支持PCI I/O集,如下所示: I/O集数量 CompactPCI插槽数量 PCI插槽数量 Sun Fire 6800 system 4 (PCI only) N/A 8 slots—6 slots for fulllength PCI cards and 2 short slots for short PCI cards
Sun Fire 4810 system 2 (PCI only) N/A 8 slots—6 slots for fulllength PCI cards and 2 short slots for short PCI cards
Sun Fire 4800system 2 (PCI only) N/A 8 slots—6 slots for fulllength PCI cards and 2 short slots for short PCI cards
Sun Fire 3800system 2 (CompactPCI only) 6 N/A 你可以安装短的PCI卡到6个长的PCI槽里,长的PCI卡工作在33MHZ(5V)短的PCI卡工作在33MHZ(5V)或66MHZ(3.3V)。
冗余风扇 当有风扇发生故障时,其他的风扇就会提高转速。当更换风扇时,不需要中断系统。 主机 风扇组最小数量 最大数量 Sun Fire 6800 system 3 4 Sun Fire 4810 system 2 3 Sun Fire 4800 system 2 3 Sun Fire 3800 system 3 4
冗余电源 要想使电源冗余,你必须为每组电源安装附加的一定数量的冗余电源。如果一个电源组中的一个或多个电源发生故障,那么系统部件就不能全部加载。系统控制板和I/O板能够从系统中的任一电源得到电源,风扇能够从任一电源组得到电源。
最小电源支持和需要冗余的配置见下表 系统 每系统支持的电源组 每电源组的最小电源数 实现冗余的电源数 Sun Fire 6800 2 2 (grid 0) 3 2 (grid 1) 3
Sun Fire 4810 1 2 (grid 0) 3
Sun Fire 4800 1 2 (grid 0) 3
Sun Fire 3800 1 2 (grid 0) 3
ps0, ps1, and ps2被分配到grid 0,ps3, ps4, and ps5被分配到grid 1,如果一个电源组失效了,剩下的电源组将会继续工作。 下表列出了6800部件供电的情况,其余主机系统参考grid 0就可以了。 部件 grid 0 grid 1 CPU/Memory boards SB0, SB2, SB4 SB1, SB3, SB5 I/O assemblies IB6, IB8 IB7, IB9 Power supplies PS0, PS1, PS2 PS3, PS4, PS5 Repeater boards RP0, RP2 RP1, RP3 Redundant Transfer Switch (RTS) RTS0 (back) RTS1 (front)
转发板 转发板通过交叉矩阵的方式连接到多个CPU/内存板和I/O集,需要一定数量的转发板来为主机系统提供操作支持。转发板不是完全冗于的,当一个SOLARIS正在运行时,如果转发板失效了,那么被转发板承载的那个域的SOLARIS系统将会失效。这个域不能在剩余的转发板上继续操作,如下是在 6800上对每个域转发板的分配: 分区模式 转发板 域 单分区 RP0、RP1、RP2、RP3 A、B 双分区 RP0、RP1 A、B 双分区 RP2、RP3 C、D
在 4800、4810上对每个域转发板的分配: 分区模式 转发板 域 单分区 RP0、RP2 A、B 双分区 RP0 A 双分区 RP2 C 如果一个转发板失效了,为了隔离故障它可能转变成双分区模式。例如:如果你的系统运行在单分区模式下在一个域(DOMAIN A),转发板RP2失效了,那么它就转变成双分区模式允许(DOMAIN A)继续引导。
可靠性、可用性和适用性 这些感觉都是可有可无的东西,就不说了。
|