Windows Server 2012 R2,iSCSI 目标服务器 80 个无盘客户端,挂起故障挂起等等

Windows Server 2012 R2,iSCSI 目标服务器 80 个无盘客户端,挂起故障挂起等等

我承担的事情已经超出了我能够咀嚼的范围。

最近购买了一台 80 无盘 PC 网吧/游戏吧。运行的系统是破解的 CCBoot,乍一看似乎会导致随机挂起,这显然不是破解的 CCBoot 的错,尽管他们声称破解的许可证会导致随机蓝屏。

我需要指导和一般技巧来设置 Windows Server 2012 R2、iSCSI 目标服务器以启动和运行 80 台无盘 PC

经过 3 个不眠之夜 + 7 天的常规监控和重新配置,linux 服务器,摆弄 gPXE || iPXE,学习它的脚本,多次谷歌搜索,DHCP 服务器配置,来自网络的点点滴滴,天知道有多少个全新格式的 Ubuntu、windows server 2008、windows server 2012、windows server 2012 R2 的安装,结合当前的规格如下:

眼镜

软件

服务器:

  • Windows Server 2012 R2
  • iSCSI 目标服务器
  • 1 个父 VHDx
  • 80 个子差异 VHDx
  • 每个 VHDx 有 80 个 iSCSI 目标
  • MPIO 功能/选中 iSCSI 复选框/
  • DHCP 服务器角色
  • Hyper-V 角色/未设置虚拟以太网适配器/
  • SolarWinds TFTP 服务器
  • iPXE 自定义脚本映像

客户:

  • Windows 7 x32 /未经 sysprep-ed/
  • 1gbps已建立局域网
  • 几场比赛

iSCSI 设置:

  • 1 个主 VHDx
  • 4 个父级差异 VHDx 由安装在 4 台不同硬件 PC 上的主启动和自动驱动程序生成
  • 由 4 个父 VHDx 衍生出 80 个子 VHDx
  • 主服务器和 4 个父服务器位于 SSD 上
  • 所有子级位于软 RAID/存储池/卷上

技术

服务器:

  • 1x120GB 固态硬盘
  • 1x500GB SSD
  • 3x500GB HDD /存储池化至 1.36 TB 软 RAID0/
  • 1gpbs 网卡
  • i7 4770

客户:

  • 1gbps LAN 卡/不确定是否支持 10gpbs/
  • 2 或 3 个不同供应商但 GPU 和型号相同的显卡,nVidia GTS 450
  • 华擎 P55M Pro
  • 2x 2048MB 三星 RAM

网络:

  • 1gbps 工作连接
  • 1xCisco 路由器/100mbps LAN 端口,仅用于 WAN 访问/
  • DVR 系统
  • 3z DGS-1024D级联交换机

由于具备一些软件工程背景,设置该装置的软件方面,令人尴尬的是,我花了 3 天时间。

当前的问题:

  • PC 完全冻结,但很少在启动时冻结
  • 正在运行的 PC 随机冻结,需要硬重置,假设客户端存在硬件问题,尚未检查或隔离。假设原因:之前的 CCBoot 设置存在问题。
  • 整个系统仅由 10 个人同时在 10 台客户端 PC 上进行测试,并且超过一半的客户端都完全关闭,所有问题都出现在正在运行的客户端上。

问题:

  • DVR系统会影响网络吗?
  • Windows 7 是否比 Windows XP 发出更多磁盘 i/o 请求?如果是这样,我非常愿意在主 VHDx 上切换 WinXP。
  • iSCSI 目标服务器需要调整
  • 选择该网络的交换机是否有一个特定的关键词,我相信 DGS-1024D 丢失了很多数据包。

我只设置了测试子 VHDx,编写了一个脚本来删除、生成和将子 VHDx 连接到目标,并在最后一天在客户端 PC 上运行它们,我希望系统能够正常工作,因为我花在设置服务器和配置 DHCP 和 iPXE 以及格式化上的所有其他时间。对我来说,每一步都需要服务器 PC 的不同操作系统。请记住,在所有这些中只有 1 个 SATA DVD-ROM 和 1 个 4GB 闪存盘。

总的来说,只要你能给我正确的提示,请打我、骂我。非常绝望。

更新: 在为不同的硬件机器准备不同的映像后,启动已恢复正常。最近,负责设置网络和 WAN 的人过来重置路由器,并将服务器重新连接到路由器,当我问为什么连接到服务器网卡的 LAN 线“消失”在某个地方,而不是连接到附近的交换机或至少是路由器本身/最靠近服务器的东西/他不知道时。那是 2 或 3 天前,通过任务管理器查看并进行一般监控,我发现路由器不是 1gbps!使用旧的 1gbps 连接重新连接服务器后(该连接显然位于级联交换机的另一端),修复了蓝屏/这是几个小时前的事情,我并没有真正强调整个系统,只同时运行 10 台电脑/在运行的 10 台电脑中,有 1 台经历了冻结或蓝屏,我现在的假设是主板或 RAM 或过热导致冻结,明天在不启动任何其他电脑/没有网络负载的情况下/我要对上次冻结的一台电脑进行压力测试,它会再次冻结。如果确实如此,那么肯定不是网络或 iSCSI 问题。总而言之,当收到有问题的系统问题时,不要相信任何人,假设任何事情都是错误的,并从基础开始。当然,“如果它没有坏,就不要修理它”

附言有一次,我以为有些 PC 有 RAM 问题,以为只有少数 PC 遇到了问题。因此,我拿出问题最多的 PC,通过 USB 对其进行了内存测试,当我返回检查时,它出现了 19,000 个错误并且冻结了。我自动假设所有 PC 都有 RAM 问题,并认为必须检查所有 RAM;第二天,我拿出 1 台 PC / 认为没有硬件问题 / 并对其进行了一次内存测试。没有问题,因此我拿出“有问题”PC 的 RAM 1 台,将它们插入这台“测试”PC 并进行内存测试;令我惊讶的是,没有错误!我非常愤怒,同时又非常失落。

目前,我认为以下一个或多个因素导致了问题:客户端主板 AsRock P55M Pro、过热以及不太常见的 GPU 散热器脏污,和/或 DGS-1024D 开关 / 高度怀疑 /。

更新2。如果有人在读。做了压力测试,使用 FurMark 在 GPU 压力下崩溃,几乎使主板变砖。但这不太可能是所有崩溃的原因,因为大多数时候崩溃都是随机的,而不是由于高 GPU 使用率。但是因为我几乎使主板变砖/局域网启动不再工作/我移除了电脑并将其插入另一个地方以运行一些测试,看看积累了多少灰尘,然后在其上运行了 memtest。局域网启动神奇地自行修复了/我猜它需要完全耗尽电量/。Memtest 最后失败了,出现 100k 个错误,因此我在各个内存条上分别运行了 memtest,测试通过了,然后为了重现故障,在两个内存条上同时运行了 memtest,测试再次通过。在这些三星 RAM 条上运行的主板似乎存在问题,我相信我已将问题范围缩小到 RAM,一旦我能找到这些 RAM 条的正确配置/即 mhz 和电压设置/我就可以继续并测试 iSCSI 系统,在使用约 10 台 PC 时,在 100mbps -> 1gbps 发现之后运行良好。

PS 远离华擎和三星 RAM,多用华擎

最后,如果我能稳定系统,我一定会编写一个指南来设置这个系统。

相关内容