都道府県から始まる住所情報から市区町村までを抽出するアルゴリズム

UiPath Studio 2023.10.0 EnterPriseユーザです。

こんにちは。
仕事で、都道府県から始まる住所情報から市区町村までを抽出するアルゴリズムを考えています。("字"は無視しています。"〇〇郡"情報は不要なので予め削除しています)

住所に"市"が1つだけ存在し、“区”,“町”,"村"が全く存在しない場合は、住所の先頭から"市"まで取得
住所に"区"が1つだけ存在し、“市”,“町”,"村"が全く存在しない場合は、住所の先頭から"区"まで取得
住所に"町"が1つだけ存在し、“区”,“市”,"村"が全く存在しない場合は、住所の先頭から"町"まで取得
住所に"村"が1つだけ存在し、“区”,“市”,"町"が全く存在しない場合は、住所の先頭から"村"まで取得

基本はこれでよいのですが、

"区"or"町"or"村"が"市"より前に存在すると、自動判別は無理で、目視チェックが必要な気がします。
自動でこのアルゴリズムを完成したことのある方、あるいはアルゴリズムを見たことのある方、このフローチャートの共有をお願い致します。

こんにちは

入力となる住所文字列の仕様次第ですが、一般的には住所の処理は単純な文字列処理だけで済まないことが多いですので、難しい部類の課題になります。
入力住所について、何らかの正規化、分かち書き等が実施されているか否かで難易度が変わりますので、まずはこのあたりの前提を明確にいただく方が良いかと思います。(利用者が任意に入力した住所文字列でしたら、専用の正規化エンジン等を用いた方が良いかもしれません)

データを眺めると、切り捨てたいデータの前には2個以上の全角スペースが存在することに気づきました。市と区の間の全角スペースは1個となりますので、2個以上の全角スペースに着目するとアルゴリズムが組めそうなことが判明したため、自己解決案件とさせていただきます。

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.