いつも参考にさせていただいています。
今Gmailからhtmlで本文を抜き出して、そこから特定の文字列を抜き出したいと考えています。
【例】
■ご住所
【郵便番号】:〒812-0012
【都道府県】
となっていて、論理としては■ご住所
【郵便番号】:〒と
【都道府県】の間という構文で812-0012が抜け出せそうですが、よさそうな.net構文が見当たりません。
何かいい方法はないでしょうか。教示いただけますと助かります。
いつも参考にさせていただいています。
今Gmailからhtmlで本文を抜き出して、そこから特定の文字列を抜き出したいと考えています。
【例】
■ご住所
【郵便番号】:〒812-0012
【都道府県】
となっていて、論理としては■ご住所
【郵便番号】:〒と
【都道府県】の間という構文で812-0012が抜け出せそうですが、よさそうな.net構文が見当たりません。
何かいい方法はないでしょうか。教示いただけますと助かります。
【をタブ記号で置換
さらに】もタブ記号で置換。
そしてタブ記号でsplitして配列化します。
繰り返しで、配列一つ一つを評価して、先頭文字が〒だったら以降の文字を採用する。
評価に関しては正規表現が最適でしょうけど、不調法なもので…
こんにちは
必ず郵便番号記号があり、3桁-4桁の7桁郵便番号であるなら、以下の正規表現で取得できます。
System.Text.RegularExpressions.Regex.Match(text,"(?<=〒)\d{3}-\d{4}").Value
textは元の文字列です。
はなっちさん、余市さんありがとうございました!
どちらも行ったことがないので、今試して、両方ともうまくいっています。
うまく使い分けて本文から抜き出しをしてみます。
丁寧な回答、ありがとうございました