python regular expression

第一招:findAll

範例:urls = re.findall('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', s)

找出字串 s 裡面符合第一個參數(regular expression) 的所有子字串

urls 會變成一個 list, 可以用 for i in urls:  語法來遍歷

http://stackoverflow.com/questions/6883049/regex-to-find-urls-in-string-in-python

第二招: sub


s = re.sub(url, '<a href="%s" target="_blank">%s</a>' % (url,url), s)

第一個參數是要找的
第二個參數是找到後要取代成的
第三個參數是要針對哪個母字串去尋找/取代




留言

熱門文章