PostgreSQL的中文拼音排序案例-巨人网络通讯

主页 > 知识库 > PostgreSQL的中文拼音排序案例

PostgreSQL的中文拼音排序案例

前一段时间开发人员咨询，说postgresql里面想根据一个字段做中文的拼音排序，但是不得其解

环境：

OS：CentOS 6.3

DB：PostgreSQL 9.2.4

TABLE: tbl_kenyon

场景：

postgres=# \d tbl_kenyon 
  Table "public.tbl_kenyon"
 Column | Type |  Modifiers  
--------+------+---------------
 vname | text |

--使用排序后的结果，不是很理想

postgres=# select vname from tbl_kenyon order by vname;
 vname 
-------
 上海
 北京
 杭州
 浙江
(4 rows)

说明：

postgresql的排序除了受到数据库的编码影响外，还有一个初始化参数是locale也会影响(initdb)，,通常我的选择是C，这可以让postgres数据库通过strcmp()这个函数来比较字符串，而不是strcoll()函数。

这个参数可以在数据库里查看，如

postgres=# \l
                List of databases
   Name    | Owner  | Encoding | Collate | Ctype |  Access privileges  
-----------------+----------+----------+---------+-------+-----------------------
 dkenyon     | u_kenyon | UTF8   | C    | C   | 
 postgres    | postgres | UTF8   | C    | C   | 
 template0    | postgres | UTF8   | C    | C   | =c/postgres     +
         |     |     |     |    | postgres=CTc/postgres
 template1    | postgres | UTF8   | C    | C   | =c/postgres     +
         |     |     |     |    | postgres=CTc/postgres
(6 rows)

--简体中文在系统表里的支持

postgres=# select collname,collcollate,collctype,b.nspname,c.rolname as collowner 
postgres-# from pg_collation a,pg_namespace b,pg_authid c 
postgres-# where a.collnamespace = b.oid and a.collowner = c.oid and lower(collname) like '%zh_cn%';
  collname  | collcollate | collctype  | nspname  | collowner 
--------------+--------------+--------------+------------+-----------
 zh_CN    | zh_CN    | zh_CN    | pg_catalog | postgres
 zh_CN    | zh_CN.utf8  | zh_CN.utf8  | pg_catalog | postgres
 zh_CN.gb2312 | zh_CN.gb2312 | zh_CN.gb2312 | pg_catalog | postgres
 zh_CN.utf8  | zh_CN.utf8  | zh_CN.utf8  | pg_catalog | postgres
(4 rows)

因为初始化时选择的locale是C，所以数据库的默认排序也是C，要想字段内容按照中文拼音排序，需要将UTF8格式存储的内容转换为GBK方式。

解决办法：

1.转换字段的方式,加个convert_to前缀函数

postgres=# select vname from tbl_kenyon order by convert_to(vname,'GBK');
 vname 
 
-------
 北京
 杭州
 上海
 浙江
(4 rows)

--convert_to函数输入参数是text形式,输出编码是bytea形式，是将字符转换为目标编码的函数，如

postgres=# select convert_to('浙江','UTF8'),('浙江','GBK');
  convert_to  |  row   
----------------+------------
 \xe6b599e6b19f | (浙江,GBK)
(1 row)

2.列指定zh_cn的方式存储

postgres=# alter table tbl_kenyon add cname text collate "zh_CN";
ALTER TABLE
postgres=# \d tbl_kenyon 
  Table "public.tbl_kenyon"
 Column | Type |  Modifiers  
--------+------+---------------
 vname | text | 
 cname | text | collate zh_CN
postgres=# select * from tbl_kenyon;
 vname | cname 
-------+-------
 浙江 | 浙江
 杭州 | 杭州
 上海 | 上海
 北京 | 北京
(4 rows)
postgres=# select * from tbl_kenyon order by vname;
 vname | cname 
-------+-------
 上海 | 上海
 北京 | 北京
 杭州 | 杭州
 浙江 | 浙江
(4 rows)
postgres=# select * from tbl_kenyon order by cname;
 vname | cname 
-------+-------
 北京 | 北京
 杭州 | 杭州
 上海 | 上海
 浙江 | 浙江
(4 rows)

3.查询时指定collate

postgres=# select * from tbl_kenyon order by vname collate "C";
 vname | cname 
-------+-------
 上海 | 上海
 北京 | 北京
 杭州 | 杭州
 浙江 | 浙江
(4 rows)
postgres=# select * from tbl_kenyon order by vname collate "zh_CN";
 vname | cname 
-------+-------
 北京 | 北京
 杭州 | 杭州
 上海 | 上海
 浙江 | 浙江
(4 rows)

其他问题：

1.在用了方法一的convert_to函数转换一段时间后，开发告诉我说有异常,报错 character with byte sequence 0xc2 0xae in encoding "UTF8" has no equivalent in encoding "GBK"

Error querying database. Cause: org.postgresql.util.PSQLException: ERROR: character with byte sequence 0xc2 0xae in
 encoding "UTF8" has no equivalent in encoding "GBK"

排查了一下，发现数据库里存了一些比较奇怪的字符导致的，比如Mirclereg; city,niwhitereg;town。后对该表重建了一下，用方法二解决,所以convert_to函数使用对一些奇怪的字符转换时需要注意。

2.对于多音字，仍然会产生一定的歧义，比如重庆，会按Z去排序

上述办法能满足大部分汉字的拼音排序，但仍有一些不足。比较理想的解决办法是对这类基础数据录入时就指定拼音规则，或者数据库里存一份数据的拼音字典来关联使用。

其他：

使用zh_cn存储时测试字段大小，未测试取值速度

postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME爱你',5000), repeat('浙江GDOOASASHOME爱你',5000) ;
INSERT 0 1
postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME爱你',50000), repeat('浙江GDOOASASHOME爱你',50000) ;
INSERT 0 1
postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME爱你',100000), repeat('浙江GDOOASASHOME爱你',100000) ;
INSERT 0 1
postgres=# select pg_column_size(cname),pg_column_size(vname) from tbl_kenyon ;
 pg_column_size | pg_column_size 
----------------+----------------
      1410 |      1406
     13769 |     13769
     27506 |     27506
(3 rows)

存储差异并不大

补充

#高版本可能不支持,或者语法不对？
select * from store order by storename collate 'zh_CN';

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

PostGreSql 判断字符串中是否有中文的案例
自定义函数实现单词排序并运用于PostgreSQL(实现代码)
PostgreSQL将数据加载到buffer cache中操作方法
在PostgreSQL中使用ltree处理层次结构数据的方法
postgresql 中的时间处理小技巧(推荐)
Postgresql限制用户登录错误次数的实例代码
PostgreSQL用户登录失败自动锁定的处理方案
postgresql影子用户实践场景分析
如何使用PostgreSQL进行中文全文检索

标签：海西昭通榆林辛集温州杭州宝鸡濮阳

巨人网络通讯声明：本文标题《PostgreSQL的中文拼音排序案例》，本文关键词 PostgreSQL,的,中文,拼音,排序,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《PostgreSQL的中文拼音排序案例》相关的同类信息！

PostgreSQL的中文拼音排序案例

前一段时间开发人员咨询，说postgresql里面想根据一个字段做中文的拼音排序，但是不得其解环境： OS：CentOS 6.3 DB：PostgreSQL 9.2.4 TABLE: tbl_kenyon 场景： postgres=# \d tbl_kenyon Table "public.tbl...

10-18

400电话的优点和缺点如何申请400电话业务

目前，市场竞争尤为激烈。一些中小企业受到知名大企业的挤压，竞争力不强。中国的中小企业是一个缺乏个性和成千上万...

01-12

石家庄电销机器人稳定吗（智能电销机器人好吗）

本文目录一览： 1、电销机器人作用好不好？2、电销机器人的作用怎么呀，求大神？3、电销机器人作用怎么？4、有谁用过电...

11-28

云南电商智能外呼系统商家（云南电子商务公司有哪些）

今天给各位分享云南电商智能外呼系统商家的知识，其中也会对云南电子商务公司有哪些进行解释，如果能碰巧解决你现在面...

05-16

便捷的电话机器人（电话机器人哪家好）

今日给各位共享快捷的电话机器人的常识，其间也会对电话机器人哪家好进行解说，假如能可巧处理你现在面对的问题，别忘...

06-14

安付电销机器人（机器人安川销售）

今日给各位同享安付电销机器人的常识，其间也会对机器人安川出售进行解说，假如能可巧处理你现在面临的问题，别忘了重...

11-06

合肥教育群呼电话办理商家-看这里!

合肥教育群呼电话办理商家每天连续工作8小时，可以拨打800-1000通电话。工作状态，人总是会受环境、身体状况和情绪的影响...

01-16

彩铃成为400电话的热选功能有何原因？

400电话已经成为了很多企业通讯工具的首选，在办理400电话时很多企业会选择开通400电话的彩铃功能。彩铃功能为何会成为企...

12-22

win7系统程序未响应怎么办如何解决？具体步骤

很多win7用户碰到过这样的一个问题，就是提示说程序未响应问题，而后程序就动不了啦!那么对于这个问题要怎么解决呢?现...

10-20

400电话代理与运营商的优势比较

400电话是全国24小时服务热线电话，所有400电话由联通、移动和电信三大运营商提供，办理该电话有两个途径，400电话代理商...

01-13

移动电话打400电话每分钟多少钱移动400电话怎么办理？

400电话是一种业务，主要是共同支付。 400电话是一个虚拟号码，只有绑定手机或固定电话才能使用。 400号主要由联通、电信...

01-13

银川电销外呼系统有效果吗（外呼系统和电销卡）

本篇文章给我们谈谈银川电销外呼体系有作用吗，以及外呼体系和电销卡对应的知识点，期望对各位有所协助，不要忘了保藏...

11-06

重庆crm外呼系统业务（重庆crm外呼系统业务员招聘）

本文目录一览： 1、外呼体系怎样处理？2、智能外呼体系有哪些功用？3、外呼体系是怎样用的？4、重庆哪家呼叫中心外包做...

04-22

客服中心呼叫中心搭建注意什么?系统稳定等3点很关键

庞大的客服工作需要企业不断完善服务质量，做到客户满意，才能够创造出更大的价值，所以当客服呼叫系统逐渐被采用的时...

07-12

浙江自动外呼系统有哪些（智能外呼机器）

本篇文章给大家谈谈浙江自动外呼系统有哪些，以及智能外呼机器对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

08-27

MySQL高级特性——数据表分区的概念及机制详解

目录分区机制 SELECT 查询 INSERT 操作 DELETE 操作 UPDATE 操作分区的类型 MySQL 的分区的实现方式是对数据表进行一层包装，这意...

10-18

福州/武汉/南昌/镇江白名单防封电销卡办理

电销卡，找卡卡通信，电话。电销卡，找卡卡通信，电话。福州靠谱电销卡办理找卡卡通信办理上海电销卡！卡卡通信...

11-23

Win7系统安装软件时出现“错误1719”的解决办法

在Windows 7下安装Office 2010，结果出现错误 1719：无法访问 Windows Installer 服务。没有正确安装 Windows Installer 时可能发生这种情...

10-20

温州餐饮加盟呼叫中心软件供应商,电话呼叫软件多少钱-本周热搜

温州餐饮加盟呼叫中心软件供应商,电话呼叫软件多少钱3.话术录音方式(是否支持自定义音色音量或上传实时录音)。4.自定义...

12-17

安装win7旗舰版后提示“can not open image file”的故障原因及解决方法

安装win7旗舰版后提示can not open image file，具体现象如下所示：故障分析：首先can not open image file的意思为不能打开镜像文件...

10-20

昆明语音外呼系统定制（云南外呼系统）

本文目录一览： 1、外呼体系一个多少钱，有哪些功用？2、做电话营销。一套一键外呼体系多少钱？3、AI智能外呼机器人体系...

04-22

VR 教育场景中，课堂融合度很重要

对于有内容呈现需求的领域，都是VR可以落地结合的点所在。具体到教育层面，微视酷 CEO 杨威认为，传统的教育信息化手段...

10-16

HTML中的图象标签属性

HTML中的图象标签属性图象可以使网页更加生动美观。浏览器可以显示JPEG和GIF图象，其中GIF图象最多只能使用256种颜色（即只...

10-18

详解正则表达式的贪婪模式与非贪婪模式

什么是正则表达式的贪婪与非贪婪匹配如： String str="abcaxc"; Patter p="ab*c"; 贪婪匹配：正则表达式一般趋向于最大长度匹配，...

10-18

东莞防封电销系统都有什么功能

东莞防封电销系统都有什么功能电销系统提供稳定、低价的外呼线路系统，高效率拓客外呼，高频防封，一键拨号，独家代...

12-15

河北银行智能外呼系统推荐（银行智能外呼项目）

本篇文章给咱们谈谈河北银行智能外呼体系引荐，以及银行智能外呼项目对应的知识点，期望对各位有所协助，不要忘了保藏...

11-06

楚雄州电销机器人（楚雄州机电设备有限公司）

本文目录一览： 1、电销机器人有什么功能2、电销机器人是什么呢？为什么现在越来越多的企业开始用电销器人了呢？3、电...

11-27

绵阳电话机器人多少钱一个月(电销机器人多少钱一个月)

人工智能期间，做德律风发卖的企业为什么老是那么难！面临偕行竞争老是掉败，绵阳德律风呆板人几何钱一个月你有没有想...

11-26

400客服外包费用打400电话收费标准

自400家电话客户服务外包公司兴起以来，它一直受到大多数合作伙伴的欢迎。原因是客户服务外包公司可以解决客户服务招...

01-12

山东电话机器人（青岛智能电话机器人）

本篇文章给我们谈谈山东电话机器人，以及青岛智能电话机器人对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。...

05-17

地图-吸引中国游客波士顿推特制中文地图受热捧

中新网4月21日电据美国侨报网编译报道，波士顿，波士顿公共图书馆(BostonPublicLibrari并不是激进上受推荐的旅游点，但在一张...

04-13

有方机器人代理

智能营销的新时代到来了。你在等什么？【有方机器人】然后，可以为创建拨打任务。创建拨打任务时，除了话术模板和注...

10-31

迎宾机器人哪家好

4、设定编号说明规则【迎宾机器人】有意通过呼叫任务筛选的客户可以进行手动操作，也可以在事后由销售人员进行跟踪访...

10-31

用bat实现删除系统脚本调试程序

删除一些危险的对象，从根本上解决问题。这些对象对普通用户是没什么用的。 1）禁用WSHShell对象，阻止运行程序。删除或...

10-18

电销电话卡会被拉黑吗（电销卡会影响征信吗）

本文目录一览：1、停机后自动注销会不会被列入黑名单?2、电销卡会封号吗?3、电销卡是否真的不封号?卡总被停怎么办回拨真...

07-10

洛阳400电话选正规代理商西安400电话代理商有哪些？

400电话是一个集多种先进通信技术于一体的电话管理系统，拥有全国唯一的10位虚拟号。河南洛阳400电话处理选择正规代理。...

01-12

西安电销防封卡怎么样

西安电销防封卡怎么样西安电销防封卡怎么样,西安电销卡怎么样,西安电销防封卡,西安电销卡目前许多行业都在推荐不封号...

06-24

外呼系统防高频（防高频呼叫）

本文目录一览： 1、外呼体系的焦点是什么？ 2、电销外呼体系哪个好了？市道上的太多了！有可能推荐的吗？ 3、哪些电话电...

11-26

包含芜湖公司电销系统价格多少的词条

今日给各位共享芜湖公司电销体系价格多少的常识，其间也会对进行解说，假如能可巧处理你现在面对的问题，别忘了重视本...

05-17

如何成为400电话申请代理商,需要具备哪些条件?400电话上海代理商

在过去的两年里，越来越多的公司或公司开始办理400电话号码。这主要是因为400电话的主要功能是将无数的电话号码连接到...

01-13

厦门电销卡外呼系统厂家（外呼卡优点）

本文目录一览：1、知道电销客外呼系统好不好吗?就是厦门那家企业。2、电销外呼系统品牌排名,哪家好3、现在购买厦门驿路...

07-10

专属流量是什么意思，专属流量和通用流量有什么区别吗？

我们在购买流量卡，会经常听到一个词就是“专属流量”，你知道专属流量是什么吗？和通用流量有什么区别呢，接下来我们...

10-13

win10正式版在哪里cortana中个人信息？

cortana是Windows10正式版系统所提供的一项语音识别搜索工具，具有多种基于Bing的搜索功能。无论是在Web中搜索，还是搜索本地...

10-20

阿里云服务器安装配置tomcat 添加外网访问端口的教程

阿里云服务器安装配置tomcat 添加外网访问端口最近双十一不是，买了一个阿里云服务器玩玩，但是配置好tomcat，添加安全组...

10-16

400电话申请哪家好?大型代理商有哪些服务优势?400电话代理商都是一样的吗？应该怎样选择？

在用户对400电话申请的时候，也都是需要使用到代理商的，而对于代理商来说，现在也并不是只有一家，所以需要让用户进行...

01-13

天津电信ai机器人系统办理价格-今日推荐

天津电信ai机器人系统办理价格电销机器人多少钱一个，其种的套餐让您降低获客成本，不仅是电销销售神器，同时也可以在...

01-16

防封号电销外呼系统公司

当前随着社会发展节奏的加快，访问集中、访问量大、重复问题多发、个性化问题突出等复杂问题如约而至，难以满足用户的...

10-26

POS机物联网专用卡管理平台这几个功能太赞了！

物联网是“十三五”国家战略性新兴产业之一，物联网的发展带动了许多其他产业的进步，其中就包括POS机。移动物联网卡可...

10-13

用美国市场培育中国人才

●编写计算机代码的工作人员与真正意义上的软件工程师有天壤之别。●中国软件工程师的能力决不输于美国等发达国家的软...

10-22

湖南岳阳ai智能电话机器人案件（湖南岳阳ai智能电话机器人案件调查）

本文目录一览：1、AI智能通话的原理是什么?2、AI电话机器人防骚扰产品,用AI来对抗AI真的能成功吗?3、骗子用AI机器人打1700万...

06-20

如何申请400电话，详细介绍

如何申请400电话，详细介绍 400专线专为企事业单位服务。它可以由服务提供商和运营商处理。 1.选择申请地点：服务商支持...

08-14

PostgreSQL的中文拼音排序案例

10-18

本页收集关于PostgreSQL的中文拼音排序案例的相关信息资讯供网民参考！

推荐文章

上一篇：关于PostgreSQL 行排序的实例解析

下一篇：postgreSQL数据库默认用户postgres常用命令分享

一起分享吧