/v1/maps Endpunkt kannst du alle URLs auf einer Website abrufen. Dies ist nützlich für die Inhaltserkennung, die Analyse der Seitenstruktur (z. B. SEO) oder um zu entscheiden, welche URLs du als nächstes scrapen möchtest.
- Erhalte alle URLs auf einer Website (einschließlich Sitemaps und entdeckter Links)
- Verwende spezielle Muster, um Pfade einzuschließen/auszuschließen (z. B.
/blog/**) - Paginieren großer Antworten mit
cursor(bis zu 10MB pro Antwort) - Begrenze das Volumen mit
top_n
Installation
Nutzung
Sende eine POST-Anfrage mit der Website-url. Optional kannst du include_urls, exclude_urls (Glob-Muster) und top_n übergeben.
cursor-Parameter zurück, der zur Paginierung und zum Abrufen der nachfolgenden URLs verwendet werden kann. Für weitere Details siehe die API Referenz.
Dieser Endpunkt ist besonders nützlich, wenn du:
- Alle Inhaltsseiten auf einer Website entdecken möchtest
- Die Seitenstruktur und Hierarchie analysieren möchtest
- URLs für die Batch-Verarbeitung vorbereiten möchtest
- Entscheiden möchtest, welche spezifischen URLs du scrapen möchtest
include_urls und exclude_urls verwenden.
Beispiel
Angenommen, du möchtest von www.brex.com alle URLs extrahieren, die die Pfade nach/product/ haben, z. B. https://www.brex.com/product/api/no-code, aber auch www.brex.com/product einbeziehen. Du kannst den folgenden Code verwenden: