Scrape erstellen
Scrape eine URL mit bereitgestellter Konfiguration und erhalte den Inhalt.
Autorisierungen
Bearer-Authentifizierungsheader in der Form Bearer , wobei dein Authentifizierungstoken ist.
Body
Die URL, von der aus das Scraping gestartet wird.
Wartezeit in Millisekunden, bevor der Scrape beginnt.
Formate, in denen du den Inhalt haben möchtest.
html, markdown, text, json, raw_pdf, screenshot Option, bestimmte CSS-Selektoren aus dem Inhalt zu entfernen. Optional kannst du auch ein JSON-stringifiziertes Array von spezifischen Selektoren übergeben, die du entfernen möchtest. Die CSS-Selektoren, die entfernt werden, wenn diese Option auf Standard gesetzt ist, sind ['nav','footer','script','style','noscript','svg',[role=alert],[role=banner],[role=dialog],[role=alertdialog],[role=region][aria-label*=skip i],[aria-modal=true]]
default, none, array Aktionen, die auf der Seite ausgeführt werden sollen, bevor der Inhalt abgerufen wird.
- Warten
- Klicken
- Eingabe ausfüllen
- Scrollen
Wohnsitzland, von dem aus die Anfrage geladen werden soll. Unterstützte Werte sind: - US (Vereinigte Staaten) - CA (Kanada) - IT (Italien) - IN (Indien) - GB (England) - JP (Japan) - MX (Mexiko) - AU (Australien) - ID (Indonesien) - UA (VAE) - RU (Russland) - RANDOM Einige Operationen, wie das Scrapen von Google Search und Google News, unterstützen alle Länder.
Gib den HTML-Transformer an, der verwendet werden soll, falls vorhanden. Die Mercury Parser-Bibliothek von Postlight wird verwendet, um Werbung und andere unerwünschte Inhalte aus dem gescrapten Inhalt zu entfernen.
postlight, none Option, Bilder aus dem gescrapten Inhalt zu entfernen. Standardmäßig auf false gesetzt.
Liste von Klassennamen, die aus dem Inhalt entfernt werden sollen.
Wenn du json als Format definierst, kannst du diesen Parameter verwenden, um den zu verwendenden Parser anzugeben. Parser sind nützlich, um strukturierten Inhalt aus Webseiten zu extrahieren. Olostep hat einige Parser für die gängigsten Webseiten eingebaut, und du kannst auch deine eigenen Parser erstellen.
Mit dieser Option kannst du alle Links erhalten, die auf der Seite vorhanden sind, die du scrapst. Links werden immer als absolute URLs zurückgegeben.
Konfiguration für Bildschirmgröße. Voreingestellte Abmessungen sind über screen_type verfügbar: desktop (1920x1080), mobile (414x896) oder default (768x1024).
Benutzerdefinierte Metadaten. Noch nicht unterstützt.
Antwort
Erfolgreiche Antwort mit den Details zur Einleitung des Scrapes.
Scrape-ID
Die Art des Objekts. "scrape" für diesen Endpunkt.
Erstellte Epoche
Benutzerdefinierte Metadaten.
Die URL, die gescraped wurde.
Anzahl der durch diese Anfrage verbrauchten Credits. Wird nach Abschluss der Ausführung ausgefüllt. Credits sind die Grundlage für die Abrechnung.
Geschätzte Kosten in USD für diese Anfrage. Wird nach Abschluss der Ausführung ausgefüllt. Berechnet aus den verbrauchten Credits und deinem Tarif — 99% genau, aber credits_consumed ist der maßgebliche Wert.