请教 pgsql 建数据库问题, encoding, collation, character type 有何种区别呢?

2018-04-01 17:23:24 +08:00
 jahan

http://public.dhe.ibm.com/software/dw/data/dm-1002postresqltodb2/PostgreSQL_to_DB2_Porting_Guide.pdf 粗略看了一下 pgsql 和 db2 的对比。 差别还不少。想请教一下,encoding 是不是应该对应 db2 建库的代码页?如果导入的数据是 utf8 是不是 encoding 就应该设成 utf8,collation 是将的系统代码吗 zh.cn 这种?有些文档里说默认就好,不需要设置。character type 这个会影响代码不?简单来说,数据怎么设置,才能让一个 utf8 的文本 load 之后不乱码?

还有 db2 里面 bufferpool 的概念是不是在 pgsql 里面并没有呢?如果有应该怎么写呢? 比如

   CREATE BUFFERPOOL "MYDBRUN32K" SIZE AUTOMATIC PAGESIZE 32768;

在 pgsql 里面建一个大表,应该怎么从 db2 翻译到 pgsql 呢,貌似这篇表空间讲的很粗略,不知道哪里有更详细的对照。DB2 表空间的关键字如何对照 pgsql 呢?

 CREATE LARGE TABLESPACE "MYDBSS1" IN DATABASE PARTITION GROUP IBMDEFAULTGROUP 
      PAGESIZE 32768 MANAGED BY AUTOMATIC STORAGE 
      AUTORESIZE YES 
      INITIALSIZE 1 G 
      MAXSIZE NONE 
      EXTENTSIZE 32
      PREFETCHSIZE AUTOMATIC
      BUFFERPOOL MYDBRUN32K
      OVERHEAD 7.500000
      TRANSFERRATE 0.060000 
      NO FILE SYSTEM CACHING  
      DROPPED TABLE RECOVERY ON;

建表语句数据类型,倒是差不多,不过是不是如果使用 pg 的 text 或者 character varing ()或者 varchar ()会不会失去了原来表格中潜在的检查功能,比如原来 varchar ( 30 )只允许 30,而 varchar ()就放开了这个限制。建 partition 貌似 pgsql 很繁琐啊,又是继承又是触发器的。有简洁的写法吗?

CREATE TABLE "DETAIL" (
	"PRODUCT"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(60),
	"SERIAL"	INTEGER/INTEGER,
	"APPLICATION"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
	"LOCATION"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(60),
	"COMPANY"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
	"CODE"	TEXT/VARCHAR(300)/CHARARCTER VARING(300)//CHARACTER VARING/VARCHAR(300),
	"AMOUNT"	DECIMAL(20,2)/NUMERIC(20,2)/DECIMAL(20,2),
	"JYRQ"	CHAR(8)
)
COMPRESS YES /*这个在 pgsql 如何翻译?*/
=====pgsql 写法=====
CREATE TABLE DETAIL_2016M1 ( CHECK
   ( JYRQ >='20160101' AND JYRQ <  '20160201' )
         ) INHERITS (DETAIL);
CREATE TABLE DETAIL_2016M2 ( CHECK
   ( JYRQ >='20160201' AND JYRQ <  '20160301' ) /*闰年怎么办,而且日期这样划分貌似有重复啊*/
         ) INHERITS (DETAIL);
===pgsql partition 触发器======
CREATE OR REPLACE FUNCTION DETAIL_insert_trigger()
RETURNS TRIGGER AS $$
BEGIN
IF ( NEW.created_at >= ‘ 20160101'AND
     NEW.created_at < ‘ 2016-0201') THEN
    INSERT INTO DETAIL_2016M1 VALUES (NEW.*);
ELSIF ( NEW.created_at >= ‘ 20160201'AND
     NEW.created_at < ‘ 20160301' ) THEN
    INSERT INTO DETAIL_2016M2 VALUES (NEW.*);
ELSE
    RAISE EXCEPTION 'Date out of range.  Fix the DETAIL_insert_trigger() function!';
END IF;
RETURN NULL;
END;
$$
LANGUAGE plpgsql;

CREATE TRIGGER DETAIL_event_trigger
BEFORE INSERT ON event
FOR EACH ROW EXECUTE PROCEDURE DETAIL_insert_trigger();


====db2 写法==
PARTITION BY RANGE("DATE") (
	 PART "2016_M1" STARTING('20160101') ENDING('20160201') EXCLUSIVE IN "XXDETAIL", 
	 PART "2016_M2" STARTING('20160201') ENDING('20160301') EXCLUSIVE IN "XXDETAIL" 
);

CREATE INDEX "IDX_DETAIL_1" ON "DETAIL" 
	("CODE" ASC,
	 "DATE" ASC)
	PCTFREE 10   /*没找到对应的关键字*/
	ALLOW REVERSE SCANS; /*没找到对应的关键字*/

感觉 db2 语法还是特别精简啊,转换起来还是有点麻烦,不知道能不能所有的特性都移植到 pgsql。尤其对于一个分区表来说,貌似 pgsql 处理复杂了些。。一个 e3 处理器,8g 内存,pgsql 能不能 300 亿数据的大表呢,如何联合查询会不会要等待半天?

2543 次点击
所在节点    程序员
1 条回复
jahan
2018-04-01 17:44:51 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/443387

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX