正则表达式实现带有条件的爬取

2026/3/30 13:40:35 来源：https://blog.csdn.net/weixin_48690722/article/details/141823294 浏览: 次关键词：正则表达式实现带有条件的爬取

如下文本，按要求爬取数据。Java自从95年问世以来，经历了很多版本，目前企业中用的最多的是Java8和Java11，因为这两个是长期支持版本，下一个长期支持版本是Java17，相信在未来不久Java17也会逐渐登上历史舞台需求1:爬取版本号为8，11.17的Java文本，但是只要Java，不显示版本号。
需求2:爬取版本号为8，11，17的Java文本。正确爬取结果为:Java8 Java11 Java17 Java17
需求3:爬取除了版本号为8，11.17的Java文本，

public class MyTest {public static void main(String[] args) {String s = "Java自从95年问世以来，经历了很多版本，目前企业中用的最多的是Java8和Java11，" +"因为这两个是长期支持版本，下一个长期支持版本是Java17，相信在未来不久Java17也会逐渐登上历史舞台";//1.定义正则表达式//?理解为前面的数据Java//=表示在Java后面要跟随的数据//但是在获取的时候，只获取前半部分//需求1:String regex1 = "((?i)Java)(?=8|11|17)";//需求2:String regex2 = "((?i)Java)(8|11|17)";String regex3 = "((?i)Java)(?:8|11|17)";//需求3:String regex4 = "((?i)Java)(?!8|11|17)";Pattern p = Pattern.compile(regex4);Matcher m = p.matcher(s);while (m.find()) {System.out.println(m.group());}}
}

/*
只写+和*表示贪婪匹配

+? 非贪婪匹配
*? 非贪婪匹配

贪婪爬取:在爬取数据的时候尽可能的多获取数据
非贪婪爬取:在爬取数据的时候尽可能的少获取数据

ab+:
贪婪爬取:abbbbbbbbbbbb
非贪婪爬取:ab
*/

package com.itheima.a08regexdemo;import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexDemo10 {public static void main(String[] args) {String s = "Java自从95年问世以来，abbbbbbbbbbbbaaaaaaaaaaaaaaaaaa" +"经历了很多版木，目前企业中用的最多的是]ava8和]ava11，因为这两个是长期支持版木。" +"下一个长期支持版本是Java17，相信在未来不久Java17也会逐渐登上历史舞台";String regex = "ab+";Pattern p = Pattern.compile(regex);Matcher m = p.matcher(s);while (m.find()) {System.out.println(m.group());}}
}

正则表达式在字符串方法中的使用

package com.itheima.a08regexdemo;public class RegexDemo11 {public static void main(String[] args) {//public string replaceAll(string regex,string newstr) 按照正则表达式的规则进行替换//public string[] split(string regex): 按照正则表达式的规则切割字符串/*有一段字符串:小诗诗dqwefqwfqwfwq12312小丹丹dqwefqwfqwfwq12312小惠惠要求1:把字符串中三个姓名之间的字母替换为vs要求2:把字符串中的三个姓名切割出来*/String s = "小诗诗dqwefqwfqwfwq12312小丹丹dqwefqwfqwfwq12312小惠惠";//细节://方法在底层跟之前一样也会创建文本解析器的对象//然后从头开始去读取字符串中的内容，只要有满足的，那么就用第一个参数去替换。String result1 = s.replaceAll("[\\w&&[^_]]+", "vs");System.out.println(result1);String[] arr = s.split("[\\w&&[^_]]+");for (int i = 0; i < arr.length; i++) {System.out.println(arr[i]);}}
}

正则表达式实现带有条件的爬取

相关资讯

热文排行

最新新闻

推荐新闻

热搜词