2012年04月20日

[Python]正規表現を使って半角記号を除去する方法。

ASCIIコード表を見ながら、除去したい記号を選ぶ。

!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_abcdefghijklmnopqrstuvwxyz{|}~


例えば、全ての半角記号を表す正規表現は、[!-/:-@[-`{-~] である。以下はこの正規表現を使って文字列から半角記号だけを取り除くサンプルである。

import re

str = "!\"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_abcdefghijklmnopqrstuvwxyz{|}~"
print re.sub(re.compile("[!-/:-@[-`{-~]"), '', str)


これを実行すると以下のように出力される。

0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz



おまけとして、数字だけを抽出したい場合の例も紹介しよう。

import re

str = "!\"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_abcdefghijklmnopqrstuvwxyz{|}~"
print re.sub(re.compile("[!-/:-~]"), '', str)


実行するとこのように表示される。

0123456789

posted by 寄り道退屈男 at 16:32 | Comment(0) | TrackBack(0) | Python
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス: [必須入力]

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/55399975
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック