我曾经在许多数据库系统上工作过,如果所有的数据库键都是GUID / UUID值,那么在数据库之间移动条目就会容易得多。我考虑过几次采用这种方法,但总有一些不确定性,特别是在性能和无法通过电话读出的url方面。

有人在数据库中大量使用guid吗?这样做会有什么好处,可能的陷阱是什么?


当前回答

primary-keys-ids-versus-guids

guid作为主键的成本(SQL Server 2000)

神话,GUID vs. Autoincrement (MySQL 5)

这就是你真正想要的。

UUID优点

每个表,每个数据库,每个服务器都是独一无二的 允许轻松合并来自不同数据库的记录 允许跨多个服务器轻松分布数据库 您可以在任何地方生成id,而不必往返于数据库 大多数复制场景都需要GUID列

GUID笨蛋

它比传统的4字节索引值大了4倍;如果不小心,这可能会对性能和存储造成严重影响 调试很麻烦(其中userid='{BAE7DF4-DDF-3RG-5TY3E3RF456AS10}') 生成的guid应该是部分顺序的,以获得最佳性能(例如,SQL 2005上的newsequentialid()),并允许使用聚集索引

其他回答

为什么没人提性能?当你有多个连接时,都是基于这些讨厌的guid,性能将通过地板,一直在那里:(

@Matt谢泼德:

假设你有一桌子的顾客。当然,您不希望一个客户在表中存在多次,否则整个销售和物流部门将会发生许多混乱(特别是当关于客户的多行包含不同的信息时)。

因此,您有一个唯一标识客户的客户标识符,并确保客户(在发票中)知道该标识符,以便客户和客户服务人员在需要沟通时有一个共同的参考。为了保证没有重复的客户记录,可以通过客户标识符上的主键或通过客户标识符列上的NOT NULL + UNIQUE约束向表中添加唯一性约束。

接下来,出于某种原因(我想不出是什么原因),要求您向客户表添加一个GUID列,并将其作为主键。如果客户标识符列现在没有惟一性保证,那么您将在整个组织中引起未来的麻烦,因为guid将始终是惟一的。

Some "architect" might tell you that "oh, but we handle the real customer uniqueness constraint in our app tier!". Right. Fashion regarding that general purpose programming languages and (especially) middle tier frameworks changes all the time, and will generally never out-live your database. And there is a very good chance that you will at some point need to access the database without going through the present application. == Trouble. (But fortunately, you and the "architect" are long gone, so you will not be there to clean up the mess.) In other words: Do maintain obvious constraints in the database (and in other tiers, as well, if you have the time).

换句话说:向表中添加GUID列可能有很好的理由,但请不要因此降低了在真实(==非GUID)信息中保持一致性的目标。

primary-keys-ids-versus-guids

guid作为主键的成本(SQL Server 2000)

神话,GUID vs. Autoincrement (MySQL 5)

这就是你真正想要的。

UUID优点

每个表,每个数据库,每个服务器都是独一无二的 允许轻松合并来自不同数据库的记录 允许跨多个服务器轻松分布数据库 您可以在任何地方生成id,而不必往返于数据库 大多数复制场景都需要GUID列

GUID笨蛋

它比传统的4字节索引值大了4倍;如果不小心,这可能会对性能和存储造成严重影响 调试很麻烦(其中userid='{BAE7DF4-DDF-3RG-5TY3E3RF456AS10}') 生成的guid应该是部分顺序的,以获得最佳性能(例如,SQL 2005上的newsequentialid()),并允许使用聚集索引

有一件事没有真正解决,即使用随机(UUIDv4) id作为主键将损害主键索引的性能。无论表是否围绕键聚集,都会发生这种情况。

RDBMs通常确保主键的唯一性,并确保在一种名为BTree的结构中按键进行查找,这是一种具有较大分支因子的搜索树(二叉搜索树的分支因子为2)。现在,一个连续整数ID将导致插入只发生在树的一侧,而大多数叶节点不受影响。添加随机uuid将导致插入拆分整个索引中的叶节点。

同样地,如果存储的数据主要是临时的,通常情况下需要访问最新的数据,并根据最新的数据进行连接。对于随机uuid,模式将无法从中受益,并将访问更多的索引行,因此需要内存中更多的索引页。如果最需要最近的数据,那么使用顺序id,热索引页将需要更少的RAM。

优点:

UUID值在表和数据库之间是唯一的。这就是为什么它可以合并两个数据库或分布式数据库之间的行。 UUID在url中传递比整型数据更安全。 如果一个UUID通过url传递,攻击者无法猜测下一个id。但是如果我们传递Integer类型,例如10,那么攻击者可以猜测下一个id是11,然后是12等等。 UUID可以离线生成。