postgresql正则的简单介绍

请问一下PostgreSQL什么意思请详述谢谢

首先知道substring函数在PostgreSQL中的作用。在这段SQ语句中，substring是使用的substring(txt from reg)的形式，其中, txt是要进行正则匹配的源字符串，reg是匹配的正则表达式。如此，我们大概可以知道：这段代码的then其实就是用information进行一些正则表达式的匹配，然后获取匹配后的那段字符串。

在凤山等地区，都构建了全面的区域性战略布局，加强发展的系统性、市场前瞻性、产品创新能力，以专注、极致的服务理念，为客户提供网站设计、网站建设网站设计制作按需规划网站,公司网站建设,企业网站建设,品牌网站建设,全网营销推广,成都外贸网站建设,凤山网站建设费用合理。

这段代码中一共有3个substring函数调用，而执行的顺序则与它们出现的顺序相反，首先执行的是:

substring(information from E':step_1: \\*([0 -9]+)' )

它获得匹配step_1: *后面所跟的数字；假设information为:step_1: *1234a, 那么获得的就是1234；

接下来为第二substring, 它是用information来匹配上面获得的数字嵌入":"和".*:step_1:"的那段内容；

而最后一个substring，则是匹配第二个获得的字串，其中前为“loan_purpose: ”接下来为非换行符号的那部分字串(即获得以“loan_purpose: ”开始的所有非换行字符，遇到换行符就终止，不包括"loan_purpose: ")。

一个例子:

select substring( substring( information FROM': ' || substring(information from E':step_1:

\\*([0-9]+)'

) ||'.*:step_1:')

from E'loan_purpose: ([^\n]+)')

from (select 'start here: 1234loan_purpose: Hello World:step_1: *1234end'::character varying as information)

运行结果如图，

PostgreSQL全文检索简介

PostgreSQL自带有一个简易的全文检索引擎，可以实现小规模数据量的全文检索功能。本文我们将引导介绍一下这个功能，对于小数据量的搜索这个功能是足够使用的，而无需搭建额外的ES等重量级的全文检索服务器。

PG的全文检索操作符是 @@ ，当一个 tsvector (文档)和 tsquery (条件)匹配时返回 true ，并且前后顺序无影响:

和普通的SQL查询一样，只要在 WHERE 条件中使用这个符号就代表使用全文检索条件筛选文档了。如:

@@ 操作符支持隐式转换，对于 text 类型可以无需强类型转换( ::tsvector 或 to_tsvector(config_name, text) )，所以这个操作符实际支持的参数类型是这样的:

tsquery 查询条件并不是简单的正则，而是一组搜索术语，使用并且使用布尔操作符（AND）、 | （OR）和 ! （NOT）来组合它们，还有短语搜索操作符 - （FOLLOWED BY）。更详细的语法参见此文档。

此外，PostgreSQL还提供了两个相对简化的版本 plainto_tsquery 和 phraseto_tsquery 。

plainto_tsquery ( plainto_tsquery([ config regconfig, ] querytext text) returns tsquery )用户将未格式化的 text 经过分词之后，插入符号转为 tsquery :

phraseto_tsquery ( phraseto_tsquery([ config regconfig, ] querytext text) returns tsquery )行为和 plainto_tsquery 行为类似，但是分词之后不是插入而是 - (FOLLOWED BY):

使用索引可以加快全文检索的速度。对于全文检索来说，可选的索引类型是 GIN (通用倒排索引)和 GIST (通用搜索树)，官方文档更推荐使用 GIN索引。创建一个 GIN 索引的范例:

也可以是一个连接列:

还可以单独创建一个 tsvector 列，为这个列创建索引:

除了普通的 ORDER BY 条件之外，PostgreSQL为全文检索提供了两个可选的排序函数 ts_rank([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 和 ts_rank_cd([ weights float4[], ] vector tsvector, query tsquery [, normalization integer ]) returns float4 ，以便实现基于权重的排序。

此外，对于PostgreSQL 9.6以上的版本还可以使用 RUM index 排序。(注意，这个是扩展，默认不包含)。

PostgreSQL默认的分词字典中并不包含中文分词字典，因此我们必须手工引入。目前一个比较好的项目是 zhparser ，同时这个插件也是阿里云的RDS默认包含的。安装和启用没什么好说的。值得一提的是分词配置参数。

在 CREATE EXTENSION 之后，必须配置分词参数才能正确进行分词和查找，否则什么都查不到。官方文档提供的一个配置策略是:

n,v,a,i,e,l 这几个字母分别表示一种token策略，只启用了这几种token mapping，其余则被屏蔽。具体支持的参数和含义可以用 \dFp+ zhparser 显示:

WITH simple 表示词典使用的是内置的simple词典，即仅做小写转换。根据需要可以灵活定义词典和token映射，以实现屏蔽词和同义词归并等功能。

比如我们看下面这个例子:

可以看到江淮这个词组在查询的时候被忽略了，我们启用 j (abbreviation,简称)再看看结果:

所以实际使用中要设置合理的token types，过少将导致搜索结果不准确，过多将导致性能下降。此外，还有一些诸如短词复合: zhparser.multi_short = f 这一类的控制分词结果的选项，根据实际使用酌情开启。

postgresql怎么匹配正则表达式

在postgresql中使用正则表达式时需要使用关键字“~”，以表示该关键字之前的内容需匹配之后的正则表达式，若匹配规则不需要区分大小写，可以使用组合关键字“~*”；

相反，若需要查询不匹配这则表达式的记录，只需在该关键字前加否定关键字“！”即可。若正则表达式包含转义字符，则需在表达式前加关键字“E”。

当前文章：postgresql正则的简单介绍
网站地址：http://chengdu.cdxwcx.cn/article/dsdjeho.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

postgresql正则的简单介绍

请问一下PostgreSQL什么意思请详述谢谢

PostgreSQL全文检索简介

postgresql怎么匹配正则表达式

其他资讯

咸宁怎么运营公司短视频

舟山抖音代运营公司哪家好

什么是抖音平台托管代运营

杭州抖音直播代运营

家居建材短视频运营排名

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

postgresql正则的简单介绍

请问一下PostgreSQL什么意思 请详述 谢谢

PostgreSQL全文检索简介

postgresql怎么匹配正则表达式

其他资讯

咸宁怎么运营公司短视频

舟山抖音代运营公司哪家好

什么是抖音平台托管代运营

杭州抖音直播代运营

家居建材短视频运营排名

成都网站建设设计将想法与焦点和您一起共享

请问一下PostgreSQL什么意思请详述谢谢