由于中心计算系统规模增长很快,如何管理好、用好这些大机器已经成为焦点,目前东方公司已经开始利用数字化技术来实现有效的软硬件资源管理。
在前面三篇文章中(点击1、2、3),不但讲述了如何准备适合虚拟化的硬件、软件,以及如何使用现有的硬件、软件搭建一套实验环境,还讲述了通过VC Server如何添加主机和ISCSI存储。这三篇文章是实现VMwareHA所不可少的。它构成了整个实验的很重要的第一步,同时也循序渐进的提供了创建VMwareHA的渐进步骤,如果你在看本章节前,你仍没有阅读以上三篇内容,建议您返回去阅读。
在上篇内容中(点击阅读),讲述了进行VMware HA实验所必需的软硬件条件。接下来将使用这些来搭建实验环境。主要内容为依据拓图安装ESX主机系统、软ISCSI存储系统。
虚拟化技术灾备解决方案的核心思想是双向复制,数据在其他地方实时产生一份可用的副本,此副本不需要做数据恢复,即可投入使用,当中断恢复后再还原回去。
在Windows HPC Server 2008群集中,作业和任务可能会因多种原因失败。
进行VMware HA的实验,不只是Step By Step的安装及测试,还是一种学习、查询、发现及解决问题的过程。这个过程持续了近两个月的时间,期间,翻阅了很多资料,也依着资料做了很多实验。同时,在这个期间,自己的硬件也是依据实验的进度进行了多次的升级。出于一种学习的精神,更是一种负责任的态度把这些"经历"行成文字,和各位同行交流学习。
Windows HPC Server 2008 为运行、管理和开发并行计算应用程序提供了一个集成的应用程序平台。HPC 作业管理器是将作业提交至群集的主要界面。
在"图表和报告"中,可以收集和显示有关 HPC 群集的信息。该信息可以帮助您了解群集随时间变化的使用情况、吞吐量、周转时间和可用性。您可以查看图表和修改图表的显示方式,还可以打印和保存报告。
Windows HPC Server 2008 提供一组常用诊断测试。可以使用这些测试帮助验证部署、解决故障、检测性能降级和检查软件更新。
在 Windows HPC Server 2008 中,群集管理员可以使用 clusrun 跨群集中的一组节点并行运行命令行命令,并在客户端计算机上收集节点输出。使用 clusrun 命令可以完成诸如下面这些任务
Windows HPC Server 2008 群集作业是对群集上的资源的请求,并且是要运行在这些资源上的任务的负载。群集作业可以很简单,只有一项任务,也可以包括很多任务。最常见的作业类型是 MPI 作业、参数清除作业和任务流作业。
在"作业管理"中,可以监视和管理提交到群集的作业。在作业列表中,每一行列出一个作业,各列分别显示作业属性、作业状态和指标值。作业列表提供了向下钻取到作业详细信息和对一个或多个作业执行操作的起点。