megagogo
01-08-2021, 15:47
Здравствуйте!
Пожалуйста, если тут на форуме есть кто-то, кто разбирается в Excel, или есть хоть какие-то предположения, как можно это реализовать, подскажите.... Вопрос очень сложный, уже не первый месяц в поисках решения, но пока ничего толком не смог придумать, поэтому решил задать вопрос на форуме.
*********
Проблемный файл прикрепляю, чтобы вам было более понятно, о чем речь:
https://yadi.sk/d/z0FNjYrN1e6UDA
*********
Суть такая: есть ~30.000 магазинов.
Каждый магазин = отдельная строка в таблице.
НО среди этих 30.000 магазинов есть большое количество СЕТЕЙ (т.е. сеть магазинов "4 лапы" например, очень большая, и все магазины этой сети разбросаны по таблице конкретно).
********
В таблице есть следующие столбцы, к которым я пытался применить формулу ВПР, но не очень успешно, т.к. все равно не получается объединить все магазины...
У меня получается сделать например так:
- Формула ВПР на сайты (т.е. если есть строки, у которых есть 1 URL общий, то их сгруппировать).
- Формула ВПР на одинаковые номера телефонов (т.е. если в таблице есть строки с одинаковыми телефонами, то их я могу сгруппировать).
- Формула ВПР на одинаковые ссылки на соц.сети (т.е. если соц.сеть Вконтакте, Инстаграм, фейсбук и т.п. сходятся - то они сгруппировываются легко).
НО этот способ работает не до конца... Потому что бывает ситуация, постараюсь описать максимально подробно:
-- Строка №1 - 3 телефона, нет никаких дополнительных данных.
-- Строка №10 - 3 телефона (1 из телефонов сходится с строкой №1), но есть ссылка на сайт.
--- Строка №15 - 3 телефона (телефоны не сходятся с строкой №1 и №10), но сайт сходится со строкой №10.
--- Строка №20 - 3 телефона (они не сходятся с другими), сайта нет, но есть инстаграм (которого нет в строках №1, 10, 15).
---- Строка №25 - 1 телефон (одинаковый со строкой №20), но нет инстаграма, есть ссылка на Вконтакте (которых не было ранее).
---- Строка №30 - 3 телефона (уникальных), есть ссылка на Вконтакте.
И так можно продолжать в принципе дальше, но суть такая: понятно, что если телефон, сайт, соц.сети одинаковые, то это одна компания... НО как их объединить? Строки №1, 10, 15, 20, 25, 30 (из примера, это все образно, чтобы расписать суть проблемы). Через ВПР я не представляю, как это все отфильтровать.
(+ пожалуйста, не пишите ответы что-то вроде - купи нормальную базу, и не думай о том, как фильтировать данные), потому что в любом случае, хотелось бы самому прежде всего разобраться с этой проблемой, т.к. даже в покупных базах, если их будет много, то можно столкнуться с такой же ситуацией...
Буду рад любой помощи и совету, как это реализовать, если кто-то вообще когда-то занимался подобным)
Пожалуйста, если тут на форуме есть кто-то, кто разбирается в Excel, или есть хоть какие-то предположения, как можно это реализовать, подскажите.... Вопрос очень сложный, уже не первый месяц в поисках решения, но пока ничего толком не смог придумать, поэтому решил задать вопрос на форуме.
*********
Проблемный файл прикрепляю, чтобы вам было более понятно, о чем речь:
https://yadi.sk/d/z0FNjYrN1e6UDA
*********
Суть такая: есть ~30.000 магазинов.
Каждый магазин = отдельная строка в таблице.
НО среди этих 30.000 магазинов есть большое количество СЕТЕЙ (т.е. сеть магазинов "4 лапы" например, очень большая, и все магазины этой сети разбросаны по таблице конкретно).
********
В таблице есть следующие столбцы, к которым я пытался применить формулу ВПР, но не очень успешно, т.к. все равно не получается объединить все магазины...
У меня получается сделать например так:
- Формула ВПР на сайты (т.е. если есть строки, у которых есть 1 URL общий, то их сгруппировать).
- Формула ВПР на одинаковые номера телефонов (т.е. если в таблице есть строки с одинаковыми телефонами, то их я могу сгруппировать).
- Формула ВПР на одинаковые ссылки на соц.сети (т.е. если соц.сеть Вконтакте, Инстаграм, фейсбук и т.п. сходятся - то они сгруппировываются легко).
НО этот способ работает не до конца... Потому что бывает ситуация, постараюсь описать максимально подробно:
-- Строка №1 - 3 телефона, нет никаких дополнительных данных.
-- Строка №10 - 3 телефона (1 из телефонов сходится с строкой №1), но есть ссылка на сайт.
--- Строка №15 - 3 телефона (телефоны не сходятся с строкой №1 и №10), но сайт сходится со строкой №10.
--- Строка №20 - 3 телефона (они не сходятся с другими), сайта нет, но есть инстаграм (которого нет в строках №1, 10, 15).
---- Строка №25 - 1 телефон (одинаковый со строкой №20), но нет инстаграма, есть ссылка на Вконтакте (которых не было ранее).
---- Строка №30 - 3 телефона (уникальных), есть ссылка на Вконтакте.
И так можно продолжать в принципе дальше, но суть такая: понятно, что если телефон, сайт, соц.сети одинаковые, то это одна компания... НО как их объединить? Строки №1, 10, 15, 20, 25, 30 (из примера, это все образно, чтобы расписать суть проблемы). Через ВПР я не представляю, как это все отфильтровать.
(+ пожалуйста, не пишите ответы что-то вроде - купи нормальную базу, и не думай о том, как фильтировать данные), потому что в любом случае, хотелось бы самому прежде всего разобраться с этой проблемой, т.к. даже в покупных базах, если их будет много, то можно столкнуться с такой же ситуацией...
Буду рад любой помощи и совету, как это реализовать, если кто-то вообще когда-то занимался подобным)