/v1/maps Endpunkt kannst du alle URLs auf einer Website abrufen. Dies ist nützlich für die Inhaltserkennung, die Analyse der Website-Struktur (z.B. SEO) oder um zu entscheiden, welche URLs du als nächstes scrapen möchtest.
- Erhalte alle URLs auf einer Website (einschließlich Sitemaps und entdeckter Links)
- Verwende spezielle Muster, um Pfade einzuschließen/auszuschließen (z.B.
/blog/**) - Paginierung großer Antworten mit
cursor(bis zu 10MB pro Antwort) - Begrenze das Volumen mit
top_n
Installation
Verwendung
Sende eine POST-Anfrage mit der Website-url. Optional kannst du include_urls, exclude_urls (Glob-Muster) und top_n übergeben.
cursor-Parameter zurück, der für die Paginierung und das Abrufen der nachfolgenden URLs verwendet werden kann. Für weitere Details siehe die API Referenz.
Dieser Endpunkt ist besonders nützlich, wenn du:
- Alle Inhaltsseiten auf einer Website entdecken möchtest
- Die Struktur und Hierarchie der Website analysieren möchtest
- URLs für die Batch-Verarbeitung vorbereiten möchtest
- Entscheiden möchtest, welche spezifischen URLs gescrapt werden sollen
include_urls und exclude_urls verwenden.
Beispiel
Angenommen, du möchtest von www.brex.com alle URLs extrahieren, die die Pfade nach/product/ haben, z.B. https://www.brex.com/product/api/no-code, aber auch www.brex.com/product einschließen. Du kannst den folgenden Code verwenden: