/v1/maps endpoint kun je alle URL’s op een website verkrijgen. Dit is nuttig voor het ontdekken van content, het analyseren van de sitestructuur (bijv. SEO), of het beslissen welke URL’s je vervolgens wilt scrapen.
- Verkrijg alle URL’s op een website (inclusief sitemaps en ontdekte links)
- Gebruik speciale patronen om paden in of uit te sluiten (bijv.
/blog/**) - Pagineer grote reacties met
cursor(tot 10MB per reactie) - Beperk het volume met
top_n
Installatie
Gebruik
Stuur een POST-verzoek met de websiteurl. Optioneel kun je include_urls, exclude_urls (glob patronen), en top_n doorgeven.
cursor parameter die kan worden gebruikt voor paginering en het verkrijgen van de volgende URL’s. Voor meer details raadpleeg de API Referentie.
Deze endpoint is bijzonder nuttig wanneer je:
- Alle contentpagina’s op een website wilt ontdekken
- De sitestructuur en hiërarchie wilt analyseren
- URL’s wilt voorbereiden voor batchverwerking
- Wilt beslissen welke specifieke URL’s je wilt scrapen
include_urls en exclude_urls gebruiken.
Voorbeeld
Stel dat je van www.brex.com alle URL’s wilt extraheren die de paden na/product/ hebben, bijv. https://www.brex.com/product/api/no-code, maar ook www.brex.com/product wilt opnemen. Je kunt de volgende code gebruiken: