!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_abcdefghijklmnopqrstuvwxyz{|}~
例えば、全ての半角記号を表す正規表現は、[!-/:-@[-`{-~] である。以下はこの正規表現を使って文字列から半角記号だけを取り除くサンプルである。
import re
str = "!\"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_abcdefghijklmnopqrstuvwxyz{|}~"
print re.sub(re.compile("[!-/:-@[-`{-~]"), '', str)
これを実行すると以下のように出力される。
0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz
おまけとして、数字だけを抽出したい場合の例も紹介しよう。
import re
str = "!\"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_abcdefghijklmnopqrstuvwxyz{|}~"
print re.sub(re.compile("[!-/:-~]"), '', str)
実行するとこのように表示される。
0123456789