SQL Server的排序规则很多人使用的并不是很多,对于初学者来讲会感觉特别陌生,但其中有一个错误很多人都是经常碰到的: SQL Server数据库,在跨库多表连接查询时,若两数据库默认字符集不同,系统就会返回这样的错误: “无法解决 equal to 操作的排序规则冲突。” 一、错误分析: 这个错误是因为排序规则不一致造成的,测试如下: create table #t1( name varchar(20) collate Albanian_CI_AI_WS, value int) create table #t2( name varchar(20) collate Chinese_PRC_CI_AI_WS, value int ) 表建好后,再来执行连接查询: 0select * from #t1 A inner join #t2 B on A.name=B.name 此时,错误就出现了: 服务器: 消息 446,级别 16,状态 9,行 1 无法解决 equal to 操作的排序规则冲突。 要排除这个错误,最简单方法是,表连接时指定它的排序规则,这样错误就不再出现了。语句这样写: 0select * from #t1 A inner join #t2 B on A.name=B.name collate Chinese_PRC_CI_AI_WS 二.排序规则简介: 什么叫排序规则呢?MS是这样描述的:"在 Microsoft SQL Server 2000 中,字符串的物理存储由排序规则控制。排序规则指定表示每个字符的位模式以及存储和比较字符所使用的规则。"在查询分析器内执行下面语句,可以得到SQL SERVER支持的所有排序规则。 0select * from ::fn_helpcollations() 排序规则名称由两部份构成,前半部份是指本排序规则所支持的字符集。如: Chinese_PRC_CS_AI_WS 前半部份:指UNICODE字符集,Chinese_PRC_指针对大陆简体字UNICODE的排序规则。 排序规则的后半部份即后缀 含义: _BIN 二进制排序 _CI(CS) 是否区分大小写,CI不区分,CS区分 _AI(AS) 是否区分重音,AI不区分,AS区分 _KI(KS) 是否区分假名类型,KI不区分,KS区分 _WI(WS) 是否区分宽度 WI不区分,WS区分 区分大小写:如果想让比较将大写字母和小写字母视为不等,请选择该选项。 区分重音:如果想让比较将重音和非重音字母视为不等,请选择该选项。如果选择该选项,比较还将重音不同的字母视为不等。 区分假名:如果想让比较将片假名和平假名日语音节视为不等,请选择该选项。 区分宽度:如果想让比较将半角字符和全角字符视为不等,请选择该选项。 三.排序规则的应用: SQL Server提供了大量的Windows和SQLSERVER专用的排序规则,但它的应用往往被开发人员所忽略。其实它在实践中大有用处。 例1:让表NAME列的内容按拼音排序: create table #t(id int,name varchar(20)) insert #t 0select 1, 中 union all 0select 2, 国 union all 0select 3, 人 union all 0select 4, 阿 0select * from #t order by name collate Chinese_PRC_CS_AS_KS_WS 0drop table #t /*结果: id name ----------- -------------------- 4 阿 2 国 3 人 1 中 */ 例2:让表NAME列的内容按姓氏笔划排序: create table #t(id int,name varchar(20)) insert #t 0select 1, 三 union all 0select 2, 乙 union all 0select 3, 二 union all 0select 4, 一 union all 0select 5, 十 0select * from #t order by name collate Chinese_PRC_Stroke_CS_AS_KS_WS 0drop table #t /*结果: id name ----------- -------------------- 4 一 2 乙 3 二 5 十 1 三 */ 四.在实践中排序规则应用的扩展 SQL Server汉字排序规则可以按拼音、笔划等排序,那么我们如何利用这种功能来处理汉字的一些难题呢?我现在举个例子: 用排序规则的特性计算汉字笔划 要计算汉字笔划,我们得先做准备工作,我们知道,Windows多国汉字,UNICODE目前收录汉字共20902个。简体GBK码汉字UNICODE值从19968开始。 首先,我们先用SQLSERVER方法得到所有汉字,不用字典,我们简单利用SQL语句就可以得到: 0select top 20902 code=identity(int,19968,1) into #t from syscolumns a,syscolumns b 再用以下语句,我们就得到所有汉字,它是按UNICODE值排序的: 0select code,nchar(code) as CNWord from #t 然后,我们用Select语句,让它按笔划排序。 0select code,nchar(code) as CNWord from #t order by nchar(code) collate Chinese_PRC_Stroke_CS_AS_KS_WS,code