Web上のメインコンテンツ部分のテキストを取得したいのですが、
テキストを取得を行うと改行が含まれなくなってしまっています。
(改行がない)
例)
概要
あいう
本文
かきく
まとめ
さしす
↓
概要あいう本文かきくまとめさしす
そこで、属性を取得アクティビティで属性を”text”と指定して
次の”text”に移動する際は改行を入れようかなどと考えたのですが、
どうにもできそうにありません。
なにか良い方法はないでしょうか。
Web上のメインコンテンツ部分のテキストを取得したいのですが、
テキストを取得を行うと改行が含まれなくなってしまっています。
(改行がない)
例)
概要
あいう
本文
かきく
まとめ
さしす
↓
概要あいう本文かきくまとめさしす
そこで、属性を取得アクティビティで属性を”text”と指定して
次の”text”に移動する際は改行を入れようかなどと考えたのですが、
どうにもできそうにありません。
なにか良い方法はないでしょうか。
まどろっこしい話ですみません。
「改行がない」と「改行コードがあるけど見えない」だと、できることが大きく違うのですが、本当に「改行がない」のですかね?
たとえば上の質問部分を「テキストを取得」で取ると、[\r\n]という改行文字が見えるのですよね。
この改行コードが残っているが、持って行った先では改行コードを認識せずに文字が繋がっていしまっているだけであれば、持って行った先で改行を認識するように置換してやればよいのですが。
(webから取得した文字を格納した変数).Replace(“\r\n”,持って行った先の改行コード)
お返事ありがとうございます。
改行コードは見当たりません。
以下の画像で、本来ならListsとWhat~で改行されると思うのですが、テキストを取得だとうまくいきません。
(UiPathを使わずにマウスでコピーして貼り付けを行うと改行されます。)
ありがとうございます。
なるほどー。これはWebページ自体がどうやって改行しているのしょうね?(CSSか何かで実施しているのですかね。よくわからん。)
この形だと確かに改行入れづらいですねぇ。。。
ちなみに、[What~]部分だけを掴むセレクターはありませんか?(
対象としているページはUiPathアカデミーの英語コース(まだ日本語化されていないもの)です。
[What~]をつかむセレクターはあるのですが、それ以外にも本文となる部分が細かく分けられていていて(画像で見えている”DIV”部分)、
別ページでもセレクターを再利用したいので、やはり改行を示すなにかがないと読みづらい状態です。
強引ですが、SECTIONの下の各DIVがそれぞれ分割されたinnertextを持っていたので、
ループ処理で一応解決しました。
ループ条件:次のDIVがある限り続ける。
(「要素の有無を検出」アクティビティのセレクターで「css-selecter」を固定して、「idx」にはループカウンタを入れました。)
List(Of String)にinnertext + vbCrを追加していく。
ただし、これでも小見出しと本文が混ざるので加工が必要となりました。
こんにちは
根本的な解決法ではありませんが..。
利用するブラウザをIEにすると、GetTextアクティビティで改行を含めて取れそうな感じです。一度お試しいただければと思います。
ありがとうございます。
試したら改行も取得できました。
ブラウザごとに取得できる値も変わるんですね。