Я ежедневно получаю документ ворд, содержащий данные на русском языке, отформитированные следующим образом:
Наименование: 12345 - ЗАО Фирма-1
Прибыль: 10.01
Выручка: 1.1
Наименование: 67854 - ЗАО (Фирма2)
Прибыль: 202.22
Выручка: 22.02
Наименование: 18945 - ЗАО Фирма “3”
Прибыль: 3333.30
Выручка: 3.35
Ежедневно данные меняются.
Мне нужно составить таблицу эксель из этих данных в таком виде:
Наименование Выручка Прибыль
Для начала мне нужно извлечь текст. Мне удалось выяснить, что для этого нужно использовать регулярные выражения, но как это сделать я не понимаю.
Ожидаемый результат:
Фирма-1
(Фирма2)
Фирма “3”
10.01
202.22
3333.30
1.1
22.02
3.35
Структура текста: в наименовании используются только русские буквы. Могут быть заглавные, строчные. Могут быть использовпны различные символы: тире, кавычки, круглые скобки, пробелы.
Числа могут состоять из любого количества цифр и обязательно с двумя циврами после запятой.
Далее из этих данных нужно создать таблицу эксель.
Hello
I have provided some regex patterns to help you obtain the information.
Try this regex pattern for the Name(Наименование):
(?<=Наименование: |Name: )(\d+)\s.\s([a-zA-Z0-9]+|…)\s(.*) Regex101.com link
You will need get Group 3 for the Наименование(Name).
This solution is Russian and English friendly.
Here is a full list of the results including the Full Match and Groups 1,2,3.
How to get Group 1 results:
INSERTVARIABLE(0).Groups(1).ToString
How to get Group 2 results:
INSERTVARIABLE(0).Groups(2).ToString
How to get Group 3 results:
INSERTVARIABLE(0).Groups(3).ToString
From the Matches Activity, use a write line activity (or an assign activity) and update the capital letters above with the Result from the Matches Activity.
Try this regex pattern for Прибыль (Profit):
(?<=Прибыль: )[\d.,]+|(?<=Profit: )[\d.,]+ Check out the Regex101.com link
This solution is Russian and English friendly.
Try this regex pattern for Выручка (Revenue):
((?<=Выручка: )[\d.,]+|(?<=Revenue: )[\d.,]+) Check out Regex101.com
This solution is Russian and English friendly.