Показать полную графическую версию : Собиратель ссылок типа sitemap
Господа, никто не знает алгоритма собирателя уникальных ссылок с сайта для создания карты сайта? Не хочется выдумывать велосипед, может кто-то делал.
Vlad Drakula
01-09-2006, 15:34
benya
все зависит от того если доступ к движку сайта или нет.
Vlad Drakula,
А зачем нужен доступ? По принципу скачивания страниц целиком наверное... Зашли на страницу, собрали ссылки, выкинули дубликаты и так дальше по очереди... Но вот как...
Vlad Drakula
01-09-2006, 17:30
benya
я просто генерю ракту сайта сразу в момент генерации всего сайта это проще удобнее и быстрее.
Ну я бы так тоже сделал, только вот не знаю как отгенерить все страницы...
может кто-то делал
интересно у нас тут есть ктонибудь с рамблера, яндекса или апорта?:)
Vlad Drakulaракту сайта
это как?...
у меня при произношении этого слова странные представления в голове проявляются =)
Prisoner
02-09-2006, 10:25
benya, не знаю как на счет велосипеда, но задача в общем-то довольно простая, чтобы реализовывать ее множеством невелосипедных путей:
1) Регулярным выражением примерного вида <a.*?href=['"]?((?:(?:https?|ftp|file)://)?[-A-Z0-9+&@#/%?=~_|!:,.;]*[-A-Z0-9+&@#/%=~_|])['"]? (с i модификатором) выдираем ссылки из текста странички. Получам массив строк, являющихся значениями атрибута href всех ссылок.
2) Применяем к массиву функцию array array_unique(array) (http://ru.php.net/manual/ru/function.array-unique.php) и получаем массив с убранными повторяющимися ссылками.
По сути это все, разве что будет дополнительные моменты по разбору могущих возникнуть нюансов.
Prisoner, забыл экранировать опасные символы :).
ага, а еще добавить протокол http:
Prisoner
03-09-2006, 16:11
Sham, E-mail, прошу прощения, ваши замечания учитываются моими "примерным" и P.S. соответственно - я не собирался давать полного ответа, это лишнее.
nec 3540A
16-09-2006, 15:46
А есть ли программа для создание "карты сайта", находящегося уже в сети?
Prisoner
16-09-2006, 16:36
А почему бы у сети и не спросить (http://www.yandex.ru/yandsearch?text=%F1%EE%E7%E4%E0%ED%E8%E5+%EA%E0%F0%F2%E0+%F1%E0%E9%F2%E0+&stype=www)?
Prisoner,
А как на счет относительных ссылок типа:
page.html
/page.html
../page.html
Prisoner
19-09-2006, 15:27
В свете какого вопроса? Программы строящей карту или предложенного мной алгоритма?
Prisoner,
Вообще программы строящей карту
Prisoner
19-09-2006, 19:14
Не знаю, benya, этим классом софта я не пользовался.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.
Available in ZeroNet 1osznRoVratMCN3bFoFpR2pSV5c9z6sTC