Zum Hauptinhalt springen
Die Olostep Mastra-Integration bringt leistungsstarke Web-Datenextraktionsfähigkeiten zu Mastra.ai-Agenten. Olostep ist eine Websuche-, Scraping- und Crawling-API — eine API zum Suchen, Extrahieren und Strukturieren von Webdaten. Baue intelligente KI-Agenten, die autonom Daten von jeder Website suchen, scrapen, analysieren und strukturieren können. Von npm installieren →

Funktionen

Die Integration bietet 4 leistungsstarke APIs für die automatisierte Web-Datenextraktion:

Website scrapen

Extrahiere Inhalte von jeder einzelnen URL in mehreren Formaten (Markdown, HTML, JSON, Text)

URLs im Batch scrapen

Verarbeite bis zu 100.000 URLs parallel. Perfekt für die groß angelegte Datenextraktion

Crawl erstellen

Entdecke und scrape ganze Websites autonom, indem du Links folgst

Karte erstellen

Extrahiere alle URLs von einer Website zur Analyse der Seitenstruktur und Inhaltserkennung

Installation

npm install @olostep/mastra-tools

Einrichtung

1. Paket installieren

npm install @olostep/mastra-tools @mastra/core

2. Integration importieren und registrieren

In deiner Mastra-Konfigurationsdatei:
import { Mastra } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Erstelle die Olostep-Integration
const olostep = createOlostepIntegration();

// Registriere APIs (dies macht sie für Agenten verfügbar)
olostep.registerApis();

// Füge sie deiner Mastra-Konfiguration hinzu
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere Konfigurationen
  },
});

3. API-Schlüssel konfigurieren

Setze deinen Olostep-API-Schlüssel als Umgebungsvariable:
export OLOSTEP_API_KEY=your-api-key-here
Oder in deiner .env-Datei:
OLOSTEP_API_KEY=your-api-key-here
Erhalte deinen API-Schlüssel vom Olostep Dashboard.

Verfügbare APIs

Die Integration stellt 4 APIs bereit, die deine Mastra-Agenten nutzen können:

scrapeWebsite

Extrahiere Inhalte von einer einzelnen URL. Unterstützt mehrere Formate und JavaScript-Rendering. Anwendungsfälle:
  • Überwache spezifische Seiten auf Änderungen
  • Extrahiere Produktinformationen von E-Commerce-Seiten
  • Sammle Daten aus Nachrichtenartikeln oder Blogbeiträgen
  • Ziehe Inhalte für Inhaltsaggregation
Schema-Parameter:
apiKey
string
erforderlich
Dein Olostep-API-Schlüssel
url_to_scrape
string
erforderlich
Website-URL zum Scrapen (muss http:// oder https:// enthalten)
formats
array
Standard:"['markdown']"
Ausgabeformate: [‘html’, ‘markdown’, ‘json’, ‘text’]
country
string
Ländercode für ortsspezifische Inhalte (z.B. “US”, “GB”, “CA”)
wait_before_scraping
number
Wartezeit in Millisekunden für JavaScript-Rendering (0-10000)
parser
string
Optionaler Parser-ID für spezialisierte Extraktion (z.B. “@olostep/amazon-product”)
Antwort:
  • id - Scrape-ID
  • url_to_scrape - Gescrapte URL
  • result.markdown_content - Markdown-Inhalt
  • result.html_content - HTML-Inhalt
  • result.json_content - JSON-Inhalt
  • result.text_content - Textinhalt
  • result.screenshot_hosted_url - Screenshot-URL (falls verfügbar)
  • result.markdown_hosted_url - Gehostete Markdown-URL
  • object - Objekttyp (“scrape”)
  • created - Unix-Zeitstempel
Beispielverwendung:
// In deinem Agenten oder Workflow
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://example.com',
      formats: ['markdown'],
      country: 'US',
    }
  }
});

batchScrape

Verarbeite mehrere URLs parallel (bis zu 100.000 auf einmal). Perfekt für die groß angelegte Datenextraktion. Anwendungsfälle:
  • Scrape ganze Produktkataloge
  • Extrahiere Daten aus mehreren Suchergebnissen
  • Verarbeite Listen von URLs aus Tabellen
  • Massenhafte Inhaltsauszüge
Schema-Parameter:
apiKey
string
erforderlich
Dein Olostep-API-Schlüssel
batch_array
array
erforderlich
Array von Objekten mit url und optionalen custom_id FeldernBeispiel: [{"url":"https://example.com","custom_id":"site1"}]
formats
array
Standard:"['markdown']"
Ausgabeformate für alle URLs
country
string
Ländercode für ortsspezifisches Scraping
wait_before_scraping
number
Wartezeit in Millisekunden für JavaScript-Rendering
parser
string
Optionaler Parser-ID für spezialisierte Extraktion
Antwort:
  • batch_id - Batch-ID (verwende dies, um Ergebnisse später abzurufen)
  • status - Verarbeitungsstatus
  • object - Objekttyp (“batch”)
Beispielverwendung:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: [
        { url: 'https://example.com', custom_id: 'site1' },
        { url: 'https://test.com', custom_id: 'site2' },
      ],
      formats: ['markdown'],
    }
  }
});

createCrawl

Entdecke und scrape ganze Websites autonom, indem du Links folgst. Perfekt für Dokumentationsseiten, Blogs und Inhaltsrepositorien. Anwendungsfälle:
  • Crawle und archiviere ganze Dokumentationsseiten
  • Extrahiere alle Blogbeiträge von einer Website
  • Baue Wissensdatenbanken aus Webinhalten
  • Überwache Änderungen in der Website-Struktur
Schema-Parameter:
apiKey
string
erforderlich
Dein Olostep-API-Schlüssel
start_url
string
erforderlich
Start-URL für den Crawl (muss http:// oder https:// enthalten)
max_pages
number
Standard:"10"
Maximale Anzahl von Seiten, die gecrawlt werden sollen
Ob Links auf Seiten gefolgt werden sollen
formats
array
Standard:"['markdown']"
Format für gescrapte Inhalte
country
string
Optionaler Ländercode für ortsspezifisches Crawling
parser
string
Optionaler Parser-ID für spezialisierte Inhaltsextraktion
Antwort:
  • id - Crawl-ID (verwende dies, um Ergebnisse später abzurufen)
  • object - Objekttyp (“crawl”)
  • status - Crawl-Status
  • created - Unix-Zeitstempel
Beispielverwendung:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createCrawl',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      start_url: 'https://docs.example.com',
      max_pages: 50,
      follow_links: true,
      formats: ['markdown'],
    }
  }
});

createMap

Extrahiere alle URLs von einer Website zur Inhaltserkennung und Analyse der Seitenstruktur. Anwendungsfälle:
  • Erstelle Sitemaps und Diagramme der Seitenstruktur
  • Entdecke alle Seiten vor dem Batch-Scraping
  • Finde fehlerhafte oder fehlende Seiten
  • SEO-Audits und Analysen
Schema-Parameter:
apiKey
string
erforderlich
Dein Olostep-API-Schlüssel
url
string
erforderlich
Website-URL, von der Links extrahiert werden sollen (muss http:// oder https:// enthalten)
search_query
string
Optionale Suchanfrage zur Filterung von URLs (z.B. “blog”)
top_n
number
Begrenze die Anzahl der zurückgegebenen URLs
include_urls
array
Glob-Muster, um spezifische Pfade einzuschließen (z.B. [“/blog/**”])
exclude_urls
array
Glob-Muster, um spezifische Pfade auszuschließen (z.B. [“/admin/**”])
Antwort:
  • id - Map-ID
  • object - Objekttyp (“map”)
  • url - Website-URL
  • total_urls - Gesamtanzahl gefundener URLs
  • urls - Array der entdeckten URLs
Beispielverwendung:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      search_query: 'blog',
      top_n: 100,
      include_urls: ['/blog/**'],
    }
  }
});

Verwendung mit Agenten

Einfaches Agentenbeispiel

Erstelle einen Agenten, der Websites scrapen kann:
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

const olostep = createOlostepIntegration();
olostep.registerApis();

const agent = new Agent({
  name: 'web-researcher',
  instructions: `
    Du bist ein Web-Rechercheassistent. Wenn Benutzer dich bitten, Informationen von einer Website zu holen,
    verwende die Olostep scrapeWebsite API, um den Inhalt zu extrahieren, und fasse ihn dann für sie zusammen.
  `,
  model: 'openai/gpt-4',
});

// Der Agent kann jetzt Olostep-APIs über Mastras API-System verwenden

Agenten-Workflow-Beispiel

Baue einen Forschungs-Workflow, der Inhalte entdeckt und scrapt:
// 1. Mappe eine Website, um URLs zu entdecken
const mapResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      include_urls: ['/blog/**'],
    }
  }
});

// 2. Batch-scrape entdeckte URLs
const batchResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
      formats: ['markdown'],
    }
  }
});

// 3. Verarbeite Ergebnisse mit deinem Agenten
const summary = await agent.generate({
  messages: [{
    role: 'user',
    content: `Fasse diesen Inhalt zusammen: ${batchResult.result.markdown_content}`
  }]
});

Beliebte Anwendungsfälle

Forschungsagent

Baue einen Agenten, der autonom Themen recherchiert:
Workflow:
  1. Benutzer fragt: “Recherchiere KI-Trends”
  2. Agent verwendet createMap, um relevante Seiten zu entdecken
  3. Agent verwendet batchScrape, um Inhalte zu extrahieren
  4. Agent analysiert und fasst die Ergebnisse zusammen
  5. Gibt strukturierten Forschungsbericht zurück
Workflow:
  1. Tägliche Überwachung planen
  2. Verwende scrapeWebsite, um Wettbewerbsseiten zu überprüfen
  3. Vergleiche mit vorherigen Daten
  4. Alarmiere bei signifikanten Änderungen
  5. Erstelle wöchentliche Berichte
Workflow:
  1. Verwende createCrawl, um alle Blogbeiträge zu entdecken
  2. Verwende batchScrape, um Inhalte zu extrahieren
  3. Verarbeite mit KI, um Schlüsselthemen zu extrahieren
  4. Speichere in Wissensdatenbank
  5. Erstelle Inhaltskalender

E-Commerce-Intelligenz

Überwache Produkte und Preise:
Agenten-Workflow:
1. Scrape Produktseiten (scrapeWebsite)
2. Extrahiere strukturierte Daten (mit Parser)
3. Verfolge Preisänderungen
4. Erstelle Alarme
5. Aktualisiere Datenbank

SEO-Analyse

Analysiere Website-Struktur und Inhalte:
Agenten-Workflow:
1. Mappe Website-Struktur (createMap)
2. Crawle wichtige Abschnitte (createCrawl)
3. Analysiere Inhaltsqualität
4. Identifiziere SEO-Möglichkeiten
5. Erstelle Empfehlungen

Spezialisierte Parser

Olostep bietet vorgefertigte Parser für beliebte Websites. Verwende sie mit dem parser-Parameter:

Google-Suche

@olostep/google-searchExtrahiere: Suchergebnisse, Titel, Snippets, URLs

Google Maps

@olostep/google-mapsExtrahiere: Geschäftsinformationen, Bewertungen, Bewertungen, Standort

Verwendung von Parsern

Füge die Parser-ID zum parser-Parameter hinzu:
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://www.amazon.com/dp/PRODUCT_ID',
      formats: ['json'],
      parser: '@olostep/amazon-product',
    }
  }
});
Der Parser extrahiert automatisch strukturierte Daten, die spezifisch für diesen Website-Typ sind.

Best Practices

Wenn du mehr als 3-5 URLs scrapen möchtest, verwende batchScrape anstelle von mehreren scrapeWebsite-Aufrufen. Batch-Verarbeitung ist:
  • Viel schneller (parallele Verarbeitung)
  • Kostengünstiger
  • Einfacher zu verwalten
  • Besser für Ratenlimits
Für JavaScript-lastige Seiten verwende den wait_before_scraping-Parameter:
  • Einfache Seiten: 0-1000ms
  • Dynamische Seiten: 2000-3000ms
  • Schweres JavaScript: 5000-8000ms
Teste mit verschiedenen Werten, um die optimale Wartezeit zu finden.
Für beliebte Websites (Amazon, LinkedIn, Google) verwende vorgefertigte Parser:
  • Erhalte automatisch strukturierte Daten
  • Zuverlässigere Extraktion
  • Kein Bedarf an benutzerdefiniertem Parsing
  • Von Olostep gewartet
Batch-, Crawl- und Map-Operationen sind asynchron:
  • Speichere die zurückgegebene ID (batch_id, crawl_id, map_id)
  • Poll für Abschluss oder verwende Webhooks
  • Richte separate Workflows für den Abruf ein
Umfasse API-Aufrufe immer mit try-catch-Blöcken:
try {
  const result = await mastra.callApi({
    integrationName: 'olostep',
    api: 'scrapeWebsite',
    payload: { data: {...} }
  });
} catch (error) {
  // Behandle Authentifizierung, Ratenlimit oder Netzwerkfehler
  console.error('Scraping fehlgeschlagen:', error.message);
}
Sei dir der Ratenlimits bewusst:
  • Verteile Anfragen mit Verzögerungen
  • Verwende Batch-Verarbeitung, wenn möglich
  • Überwache die Nutzung im Olostep-Dashboard
  • Upgrade des Plans bei Bedarf

Komplettes Beispiel

Hier ist ein komplettes Beispiel zum Erstellen eines Forschungsagenten:
import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Erstelle und registriere Olostep-Integration
const olostep = createOlostepIntegration();
olostep.registerApis();

// Initialisiere Mastra
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere Konfigurationen
  },
});

// Erstelle Forschungsagenten
const researchAgent = new Agent({
  name: 'research-assistant',
  instructions: `
    Du bist ein Forschungsassistent, der Webdaten suchen, extrahieren und strukturieren kann.
    Wenn Benutzer dich bitten, ein Thema zu recherchieren:
    1. Verwende Olosteps createMap, um relevante Seiten zu entdecken
    2. Verwende batchScrape, um Inhalte aus mehreren Quellen zu extrahieren
    3. Analysiere und fasse die Ergebnisse zusammen
    4. Präsentiere strukturierte Forschungsberichte
  `,
  model: 'openai/gpt-4',
});

// Verwende den Agenten
async function researchTopic(topic: string) {
  // Schritt 1: Entdecke relevante Seiten
  const mapResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'createMap',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        url: `https://example.com/search?q=${topic}`,
        top_n: 20,
      }
    }
  });

  // Schritt 2: Scrape entdeckte Seiten
  const batchResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'batchScrape',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
        formats: ['markdown'],
      }
    }
  });

  // Schritt 3: Analysiere mit Agenten
  const summary = await researchAgent.generate({
    messages: [{
      role: 'user',
      content: `Basierend auf diesen Forschungsdaten, gib eine umfassende Zusammenfassung von ${topic}`
    }]
  });

  return summary;
}

Fehlerbehebung

Fehler: “Ungültiger API-Schlüssel”Lösungen:
  • Überprüfe den API-Schlüssel vom Dashboard
  • Stelle sicher, dass der API-Schlüssel als Umgebungsvariable gesetzt ist
  • Verifiziere, dass der API-Schlüssel aktiv ist
  • Überprüfe auf zusätzliche Leerzeichen im API-Schlüssel
Fehler: “API nicht gefunden” oder “Integration nicht registriert”Lösungen:
  • Stelle sicher, dass registerApis() nach der Erstellung der Integration aufgerufen wird
  • Verifiziere, dass die Integration zur Mastra-Konfiguration hinzugefügt wurde
  • Überprüfe, dass der Integrationsname ‘olostep’ ist
  • Starte den Mastra-Server nach Änderungen neu
Fehler: Inhaltsfelder sind leerLösungen:
  • Erhöhe die wait_before_scraping-Zeit
  • Überprüfe, ob die Website eine Anmeldung erfordert
  • Versuche ein anderes Format (HTML vs Markdown)
  • Verifiziere, dass die URL zugänglich ist
  • Überprüfe, ob die Seite automatisierten Zugriff blockiert
Fehler: “Ratenlimit überschritten”Lösungen:
  • Verteile Anfragen mit Verzögerungen
  • Verwende Batch-Verarbeitung anstelle von einzelnen Scrapes
  • Upgrade deines Olostep-Plans
  • Überprüfe das Ratenlimit im Dashboard
Fehler: Modul nicht gefunden oder TypfehlerLösungen:
  • Stelle sicher, dass @mastra/core installiert ist
  • Überprüfe die Kompatibilität der TypeScript-Version
  • Verifiziere, dass alle Abhängigkeiten installiert sind
  • Baue neu: npm run build

Preisgestaltung

Olostep berechnet die API-Nutzung unabhängig von Mastra:
  • Scrapes: Bezahlung pro Scrape
  • Batches: Bezahlung pro URL im Batch
  • Crawls: Bezahlung pro gecrawlter Seite
  • Maps: Bezahlung pro Map-Operation
Überprüfe die aktuellen Preise unter olostep.com/pricing.

Support

Brauchst du Hilfe bei der Mastra-Integration?

Dokumentation

Durchsuche die vollständigen API-Dokumente

Support-E-Mail

Mastra-Dokumentation

Erfahre mehr über das Mastra-Framework

Verwandte Ressourcen

Scrapes API

Erfahre mehr über den Scrapes-Endpunkt

Batches API

Erfahre mehr über den Batches-Endpunkt

Crawls API

Erfahre mehr über den Crawls-Endpunkt

Maps API

Erfahre mehr über den Maps-Endpunkt

Zapier-Integration

Automatisiere mit Zapier-Workflows

LangChain-Integration

Baue KI-Agenten mit LangChain

Mastra-Website

Mastra-Plattform

Erste Schritte

Bereit, KI-Agenten mit Web-Scraping-Fähigkeiten zu bauen?

Paket installieren

Installiere @olostep/mastra-tools von npm
Baue intelligente KI-Agenten, die Webdaten mit Olostep und Mastra suchen, extrahieren und strukturieren können!