更新時間:2021-10-28 10:38:46 來源:動力節點 瀏覽2062次
有很多剛進行Java學習的小伙伴對正則表達式匹配中文還不是很了解,中文的正則表達式不是那么容易就能記住的,下面一起看看這個中文正則表達式是怎么樣的。 w匹配的僅僅是中文,數字,字母,對于國人來講,僅匹配中文時常會用到,見下
匹配中文字符的正則表達式: [u4e00-u9fa5]
或許你也需要匹配雙字節字符,中文也是雙字節的字符
匹配雙字節字符(包括漢字在內):[^x00-xff]
注:可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1) 更多常用正則表達式匹配規則:
英文字母:[a-zA-Z]
數字:[0-9]
匹配中文,英文字母和數字及_:
^[u4e00-u9fa5_a-zA-Z0-9]+$
同時判斷輸入長度:
[u4e00-u9fa5_a-zA-Z0-9_]{4,10}
^[wu4E00-u9FA5uF900-uFA2D]*$
1.一個正則表達式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_u4e00-u9fa5]+$
其中: ^ 與字符串開始的地方匹配
(?!_) 不能以_開頭
(?!.*?_$) 不能以_結尾
[a-zA-Z0-9_u4e00-u9fa5]+ 至少一個漢字、數字、字母、下劃線
$與字符串結束的地方匹配
放在程序里前面加@,否則需要\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_u4e00-u9fa5]+$"
(或者:@"^(?!_)w*(?<!_)$" 或者 @" ^[u4E00-u9FA50-9a-zA-Z_]+$ " )
2.只含有漢字、數字、字母、下劃線,下劃線位置不限:
^[a-zA-Z0-9_u4e00-u9fa5]+$
3.由數字、26個英文字母或者下劃線組成的字符串
^w+$
4.2~4個漢字
@"^[u4E00-u9FA5]{2,4}$";
5.用:(Abc)+ 來分析: XYZAbcAbcAbcXYZAbcAb
^[w-]+(.[w-]+)*@[w-]+(.[w-]+)+$
以上就是關于“正則表達式匹配中文”的介紹,如果您想了解更多相關知識,不妨來關注一下動力節點的Java在線學習,里面的內容豐富,通俗易懂,適合小白學習,希望對大家能夠有所幫助哦。
0基礎 0學費 15天面授
有基礎 直達就業
業余時間 高薪轉行
工作1~3年,加薪神器
工作3~5年,晉升架構
提交申請后,顧問老師會電話與您溝通安排學習