引言
PostgreSQL 与 Oracle 的语法差异较大,为兼容 Oracle 语法并保持原生 PostgreSQL 语法,IvorySQL 采用了双 Parser 框架,动态切换不同 Parser,实现 Oracle 兼容语法与 PostgreSQL 原生语法的共存。
双 Parser 架构设计总览
双 Parser 的实现目标是在 SQL 和服务器编程语言两个层面兼容 Oracle。通过端口选择或兼容模式设定,实现 Oracle/PG 语法解析的“热切换”。
涉及到的核心模块包括:
SQL 端词法语法分离
概述
基本做法是新增一套兼容 Oracle 风格的语法和词法,在开启 Oracle 兼容模式时,采用 Oracle 风格的语法分析,生成对应的语法树。
具体实现步骤
在
src/backend/ 目录下新建一个
oracle_Parser 目录,将
src/backend/Parser/ 中的
scan.l 和
gram.y 复制到新目录,并分别重命名为
ora_gram.y 和
ora_scan.l,添加 Oracle 风格的语法和词法分析代码。同时,将
keywords.c 文件复制到该目录,用于存放自定义的关键字。该
oracle_Parser 目录会编译成一个动态库
libParser_oracle.so。当开启 Oracle 兼容模式时,配置文件
ivorysql.conf 将被嵌入到
postgresql.conf 的末尾,并在
ivorysql.conf 中的
shared_preload_libraries 参数中添加
liboracle_Parser,确保数据库启动时自动加载
liboracle_Parser 动态库。
新增
ora_raw_Parser 函数指针,当
libParser_oracle.so 动态库加载时,动态库中的
_PG_init() 函数会将
oracle_raw_Parser() 函数的地址赋值给
ora_raw_Parser,而
_PG_fini() 函数则在兼容模式切换时负责将
ora_raw_Parser 重置为空。
每个后端进程会调用
BackendInitialize() 函数,根据后端进程所连接的端口号设置
port->connmode。如果端口是 Oracle 兼容端口,则将
connmode 设置为
'o',否则设置为
'p'。
在
PostgresMain() 调用
InitIvorysql() 后,如果
port->connmode 为
'o',则调用
SetConfigOption("ivorysql.compatible_mode", "oracle", PGC_USERSET, PGC_S_OVERRIDE)。由于该参数设置了
assign_hook,在
SetConfigOption() 中执行
assign_hook() 时,实际上会调用
assign_compatible_mode(),从而将
sql_raw_Parser 设置为
ora_raw_Parser。
在对 SQL 语句进行分析时,函数
pg_parse_query()->raw_Parser() 通过函数指针
sql_raw_Parser 调用
standard Parser() 或者
ora_raw_Parser()。
下面的图演示了 SQL 语句分析时发生的事情。

服务器端编程语言词法语法分离
概述
与 SQL 端类似,基本做法是新增一套兼容 Oracle 风格的编程语言 PL/iSQL,在开启 Oracle 兼容的情况下,使用 PL/iSQL 语言进行编译。
具体实现步骤
将 PostgreSQL 源码中的
plpgsql 目录复制一份并改名为
plisql,同时将目录内的文件名修改为以
plisql 开头。由于
plpgsql 是一种语言,改造后的
plisql 也将成为一种语言,因此,
plpgsql 语言的注册函数如
plpgsql_validator、
plpgsql_call_handler、
plpgsql_inline_handler 等也需要修改为以
plisql 开头,其他函数名同样按此规则改为以
plisql 开头。
plisql 目录构建为一个插件,initdb 时如果数据库模式是 Oracle,则创建这个插件。这个插件会将 pliSQL 语言注册到数据库的系统表中。
PL/iSQL 本身没有独立的词法解析体系,而是依赖于 SQL 端的词法分析器。因此,为了确保 PL/iSQL 兼容 Oracle 的词法规则,主要的改造是在
plisql_scanner_init 函数中,需调用
ora_scanner_init() 函数,同时,
plisql 目录中的
internal_yylex() 函数也应调用
ora_core_yylex()。
PL/iSQL 语法规则在
plisql/src/pl_gram.y 中,兼容 Oracle PLSQL 块的语法规则都在这个模块中实现。
SQL 端创建函数,没有指定 language 的时候,如果当前是兼容 Oracle 模式,则默认 language 是 PL/iSQL,如果是兼容 pg 模式,则默认 language 是 PL/pgSQL。
oracle_Parser 中的
ora_gram.y 默认是 PL/iSQL,pg Parser 中的
gram.y 默认是 PL/pgSQL。
匿名块没有指定 language 的时候,如果是兼容 Oracle 模式,默认 PL/iSQL;如果是兼容 pg 模式,则默认 PL/pgSQL。
处理过程的 ExecuteDoStmt 函数同样根据兼容模式来决定默认 language。
下面的图演示了块语句编译分析时发生的事情。

总结
双 Parser 框架作为 IvorySQL 的重要基础,确保同时支持原生 PG 与 Oracle 语法风格,避免两者相互干扰,为 IvorySQL 的兼容特性提供了坚实保障。
IvorySQL 生态大会预告
2025 年 6 月 27 日, IvorySQL 生态大会将在济南盛大开幕,已确认多位全球 PostgreSQL 大咖参与,包括:
Bruce Momjian:PG 全球开发小组联合创始人和核心团队成员 Cédric Villemain:法国,Data Bene 创始人&CEO Chris Travers:印度尼西亚,PG 和基础设施专家 Ivan Blinkov:俄罗斯,YDB 副总裁 Michael Meskes:德国,Meskes 董事长(原 Credativ 创始人) Yurii Rashkovskii:加拿大,Omnigres 公司创始人 Álvaro Hernández:西班牙,OnGres 创始人 更多重量级嘉宾正在确认中!目前议题仍在火热征集中,欢迎 提交您的议题!
无论你是数据库开发者、架构师还是技术爱好者,这都是与全球顶尖专家面对面交流的绝佳机会。6 月 27 日,相约济南,共同探索 PostgreSQL 的无限可能!
