注册 | 登陆
您的位置:阿里西西 > 编程技术 > 数据库教程 > 详细内容

在mysql中通过正则表达式从字段中的URL中提取域名信息

  稿源:互联网   2018-09-06 17:14:29   点击:   撤稿纠错
如果你有一字段dm记录了一个url,为了更好的优化模糊查询速度或统计速度,在数据表原有的结构上增加3个字段

以下讨论的是和mysql URL 正则 域名相关的在mysql中通过正则表达式从字段中的URL中提取域名信息 教程文章,内容是本站精心挑选整理的教程,希望对广大的网友给到帮助,下面是详细内容:

 `sdm` varchar(64) NOT NULL,   #subdomain记录子域名,如:123456.user.qzone.qq.com
  `tdm` varchar(32) NOT NULL,    #topdomain记录一级域名,如:qq.com
  `rdm` varchar(8) NOT NULL,      #rootdomain记录根域,如:com

操作顺序

# 1、为表增加字段
ALTER TABLE `tablename` ADD `sdm` varchar(64) NOT NULL, ADD `tdm` varchar(32) NOT NULL, ADD `rdm` varchar(8) NOT NULL;

# 2、提取url中的域名信息

UPDATE `tablename` SET `sdm`=SUBSTRING_INDEX(SUBSTRING_INDEX(SUBSTRING_INDEX(`dm`, '/', 3), '/', -1) ,':',1);

# 3、提取域名中的根域
UPDATE `tablename` SET `rdm`=(IF(`sdm` REGEXP '(comtelmobinetorgasiametvbizccnameinfo)(\.[a-zA-Z]{2})$', SUBSTRING_INDEX(`sdm`, '.', -2), IF(`sdm` REGEXP '([a-zA-Z]{2,4})$', SUBSTRING_INDEX(`sdm`, '.', -1), '')));

# 4、根据子域名和根域取一级域名

UPDATE `tablename` SET `tdm`=CONCAT(SUBSTRING_INDEX(TRIM(TRAILING `rdm` FROM `sdm`), '.', -2), `rdm`) ;

执行结果:
影响的数据栏: 126978
时间: 7.172ms


关于在mysql中通过正则表达式从字段中的URL中提取域名信息的内容写到这里就结束啦,您可以收藏本页网址http://www.alixixi.com/biancheng/ a/2018090656329.shtml方便下次再访问哦。