特定の文字と特定の文字の間の文字の抜き出し方

いつも参考にさせていただいています。

今Gmailからhtmlで本文を抜き出して、そこから特定の文字列を抜き出したいと考えています。

【例】
■ご住所
【郵便番号】:〒812-0012
【都道府県】
となっていて、論理としては■ご住所
【郵便番号】:〒と
【都道府県】の間という構文で812-0012が抜け出せそうですが、よさそうな.net構文が見当たりません。

何かいい方法はないでしょうか。教示いただけますと助かります。

【をタブ記号で置換
さらに】もタブ記号で置換。

そしてタブ記号でsplitして配列化します。

繰り返しで、配列一つ一つを評価して、先頭文字が〒だったら以降の文字を採用する。

評価に関しては正規表現が最適でしょうけど、不調法なもので…

こんにちは

必ず郵便番号記号があり、3桁-4桁の7桁郵便番号であるなら、以下の正規表現で取得できます。

System.Text.RegularExpressions.Regex.Match(text,"(?<=〒)\d{3}-\d{4}").Value

textは元の文字列です。

1 Like

はなっちさん、余市さんありがとうございました!
どちらも行ったことがないので、今試して、両方ともうまくいっています。
うまく使い分けて本文から抜き出しをしてみます。

丁寧な回答、ありがとうございました

2 Likes