如何加快在 SQL Server 中向大型表添加列的速度

Question 1

根据您的行大小、表大小、索引等，我看到 SQL Server 2000 需要磨合几个小时（4-5 个小时）才最终完成。

你现在能做的最糟糕的事情就是“惊慌失措”并强行杀死它。让它自己跑出去。

将来，您可能希望尝试按照 Farseeker 所提到的操作，创建第二个（空）结构并以此方式复制您的记录。

表格行越长，花费的时间越长。
该表上的索引越多，所需的时间就越长。
如果您添加默认值（您已添加），则需要更长时间。
如果服务器使用量很大，则需要更长时间。
如果您不锁定该数据库或将其置于单用户模式，则需要更长时间。

当我不得不做这种丑陋的事情时，我会尝试在晚上做...比如凌晨 2 点，那时没人在（并且服务器没有进行维护）。

祝你好运！：-）

Answer

根据您的行大小、表大小、索引等，我看到 SQL Server 2000 需要磨合几个小时（4-5 个小时）才最终完成。

你现在能做的最糟糕的事情就是“惊慌失措”并强行杀死它。让它自己跑出去。

将来，您可能希望尝试按照 Farseeker 所提到的操作，创建第二个（空）结构并以此方式复制您的记录。

表格行越长，花费的时间越长。
该表上的索引越多，所需的时间就越长。
如果您添加默认值（您已添加），则需要更长时间。
如果服务器使用量很大，则需要更长时间。
如果您不锁定该数据库或将其置于单用户模式，则需要更长时间。

当我不得不做这种丑陋的事情时，我会尝试在晚上做...比如凌晨 2 点，那时没人在（并且服务器没有进行维护）。

祝你好运！：-）

Question 2

嗯，1000 万行是相当多的，但它并不超出 MSSQL 的范围，而且似乎非常慢。

我们有一张表，行数非常大（设计不佳），超过 1000 万行。当我们必须修改结构时，速度确实非常慢，所以我们做的是（让表保持在线，这是记忆中的粗略记录，因为那是很久以前的事了）：

创建了带有后缀“C”（表示转换）和新结构（即与旧结构相同，但具有新的列/索引/等）的新表
SELECT * INTO 表 C FROM 表
sp_rename ‘表’ ‘表旧’
sp_rename ‘表 C’ ‘表’

这样，转换需要多长时间就无关紧要了，因为旧数据是在线的。不过，在转换过程中，这可能会导致行写入表时出现问题（这对我们来说不是问题，因为数据每天只写入一次，但每小时查询数千次），所以您可能需要调查一下。

Answer

嗯，1000 万行是相当多的，但它并不超出 MSSQL 的范围，而且似乎非常慢。

我们有一张表，行数非常大（设计不佳），超过 1000 万行。当我们必须修改结构时，速度确实非常慢，所以我们做的是（让表保持在线，这是记忆中的粗略记录，因为那是很久以前的事了）：

创建了带有后缀“C”（表示转换）和新结构（即与旧结构相同，但具有新的列/索引/等）的新表
SELECT * INTO 表 C FROM 表
sp_rename ‘表’ ‘表旧’
sp_rename ‘表 C’ ‘表’

这样，转换需要多长时间就无关紧要了，因为旧数据是在线的。不过，在转换过程中，这可能会导致行写入表时出现问题（这对我们来说不是问题，因为数据每天只写入一次，但每小时查询数千次），所以您可能需要调查一下。

Question 3

您可以尝试在单独的批处理中执行操作的每个步骤，例如

alter table T add mycol bit null
go
update T set mycol = 0
go
alter table T alter column mycol bit not null
go
alter table T add default 0 for mycol
go

优点是：

您可以获得有关操作进度的更好的反馈，因为现在有 4 个单独的批次，每个批次大约需要 1/4 的时间。
它降低了从客户端代码运行时出现超时错误的可能性。
我发现它有时可以提高性能。

您还可以尝试在进行更改之前删除表上的所有非聚集索引，然后恢复它们。添加列可能会涉及大规模页面拆分或其他低级重新排列，并且您可以在此过程中避免更新非聚集索引的开销。

Answer

您可以尝试在单独的批处理中执行操作的每个步骤，例如

alter table T add mycol bit null
go
update T set mycol = 0
go
alter table T alter column mycol bit not null
go
alter table T add default 0 for mycol
go

优点是：

您可以获得有关操作进度的更好的反馈，因为现在有 4 个单独的批次，每个批次大约需要 1/4 的时间。
它降低了从客户端代码运行时出现超时错误的可能性。
我发现它有时可以提高性能。

您还可以尝试在进行更改之前删除表上的所有非聚集索引，然后恢复它们。添加列可能会涉及大规模页面拆分或其他低级重新排列，并且您可以在此过程中避免更新非聚集索引的开销。

Question 4

我曾经在至少有 6500 万行的表中做过类似的事情，而且并没有花那么长时间。你的磁盘系统是否有足够的内存和足够的性能

如果您想加快该过程，您可以在更改表之前删除除聚集索引和外键约束之外的所有索引，但这必须在系统未使用时进行，否则您可能会得到不一致的数据。但最终您需要在完成之前应用外键和索引，但这样可以减轻事务日志的痛苦，至少如果您在简单恢复模式下运行的话。在 SQL Server 2008 中，您可以使用 ONLINE=on 和 SORT_IN_TEMPDB=on 构建索引

哈坎·温瑟

Answer

我曾经在至少有 6500 万行的表中做过类似的事情，而且并没有花那么长时间。你的磁盘系统是否有足够的内存和足够的性能

如果您想加快该过程，您可以在更改表之前删除除聚集索引和外键约束之外的所有索引，但这必须在系统未使用时进行，否则您可能会得到不一致的数据。但最终您需要在完成之前应用外键和索引，但这样可以减轻事务日志的痛苦，至少如果您在简单恢复模式下运行的话。在 SQL Server 2008 中，您可以使用 ONLINE=on 和 SORT_IN_TEMPDB=on 构建索引

哈坎·温瑟

如何加快在 SQL Server 中向大型表添加列的速度

答案1

答案2

答案3

答案4

相关内容