/v1/maps de Olostep puedes obtener todas las URLs de un sitio web. Esto es útil para el descubrimiento de contenido, análisis de la estructura del sitio (por ejemplo, SEO), o decidir qué URLs deseas extraer a continuación.
- Obtén todas las URLs de un sitio web (incluyendo sitemaps y enlaces descubiertos)
- Usa patrones especiales para incluir/excluir rutas (por ejemplo,
/blog/**) - Pagina respuestas grandes con
cursor(hasta 10MB por respuesta) - Limita el volumen con
top_n
Instalación
Uso
Envía una solicitud POST con laurl del sitio web. Opcionalmente pasa include_urls, exclude_urls (patrones glob), y top_n.
cursor que puede ser usado para paginación y obtener las URLs subsecuentes. Para más detalles, consulta la Referencia de la API.
Este endpoint es particularmente útil cuando necesitas:
- Descubrir todas las páginas de contenido en un sitio web
- Analizar la estructura y jerarquía del sitio
- Preparar URLs para procesamiento por lotes
- Decidir qué URLs específicas extraer
include_urls y exclude_urls.
Ejemplo
Supongamos que de www.brex.com quieres extraer todas las URLs que tienen las rutas después de/product/ por ejemplo https://www.brex.com/product/api/no-code pero también incluir www.brex.com/product.
Puedes usar el siguiente código: