博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
java正则表达式
阅读量:5344 次
发布时间:2019-06-15

本文共 1210 字,大约阅读时间需要 4 分钟。

参考

http://www.runoob.com/java/java-regular-expressions.html

String str = ",.!,,D_NAME。!;‘’”“**dfs  #$%^&()-+1431221\"\"中           国123漢字かどうかのjavaを決定";str = str.replaceAll("[\\pP\\pS\\pZ]", "");System.out.println(str);
DNAMEdfs1431221中国123漢字かどうかのjavaを

Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。 

/pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。

P:标点字符 

L:字母; 
M:标记符号(一般不会单独出现); 
Z:分隔符(比如空格、换行等); 
S:符号(比如数学符号、货币符号等); 
N:数字(比如阿拉伯数字、罗马数字等); 
C:其他字符

 

  1.  /**清除数字和空格*/  
  2.     public static  String cleanBlankOrDigit(String str){  
  3.         if(isBlankOrNull(str))return "null";  
  4.         return Pattern.compile("\\d|\\s").matcher(str).replaceAll("");  
  5.     }  
  6.   

 

 

public static final String REG_SPACE_PUNCTUATION = "(\\s)|(\\pP)";

List<News> news = newsDao.findNewsByComsOrInds(query);
// 所有的标点符号空格用空字符串替换后 再进行去重
TreeSet<News> newSet = new TreeSet<>((o1, o2) -> o1.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "").compareTo(o2.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "")));
newSet.addAll(news);
news = new ArrayList<>(newSet);

java里面\\s就是空格, \\pP代表标点符号。 !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

/pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
第一个 \ 是转义字符
用在上面的replaceAll 方法中 写第一个\ 就代表匹配正则表达式了

转载于:https://www.cnblogs.com/xiaolei2017/p/8028996.html

你可能感兴趣的文章
linux设备驱动归纳总结(三):1.字符型设备之设备申请【转】
查看>>
《黑客与画家》 读书笔记
查看>>
bzoj4407: 于神之怒加强版
查看>>
mysql统计一张表中条目个数的方法
查看>>
ArcGIS多面体(multipatch)解析——引
查看>>
css3渐变画斜线 demo
查看>>
JS性能DOM优化
查看>>
设计模式 单例模式 使用模板及智能指针
查看>>
HAL层三类函数及其作用
查看>>
Odoo 去掉 恼人的 "上午"和"下午"
查看>>
web@h,c小总结
查看>>
java编程思想笔记(一)——面向对象导论
查看>>
Data Structure 基本概念
查看>>
Ubuntu改坏sudoers后无法使用sudo的解决办法
查看>>
NEYC 2017 游记
查看>>
[搬运] 写给 C# 开发人员的函数式编程
查看>>
Python之旅Day14 JQuery部分
查看>>
core--线程池
查看>>
redux-effect
查看>>
Swift和OC混编
查看>>