Olostep + Mastra Integration

Die Olostep Mastra-Integration bringt leistungsstarke Web-Datenextraktionsfähigkeiten zu Mastra.ai-Agenten. Olostep ist eine Websuche-, Scraping- und Crawling-API — eine API zum Suchen, Extrahieren und Strukturieren von Webdaten. Baue intelligente KI-Agenten, die autonom Daten von jeder Website suchen, scrapen, analysieren und strukturieren können. Von npm installieren →

Funktionen

Die Integration bietet 4 leistungsstarke APIs für die automatisierte Web-Datenextraktion:

Website scrapen

Extrahiere Inhalte von jeder einzelnen URL in mehreren Formaten (Markdown, HTML, JSON, Text)

URLs im Batch scrapen

Verarbeite bis zu 100.000 URLs parallel. Perfekt für die groß angelegte Datenextraktion

Crawl erstellen

Entdecke und scrape ganze Websites autonom, indem du Links folgst

Karte erstellen

Extrahiere alle URLs von einer Website zur Analyse der Seitenstruktur und Inhaltserkennung

Installation

npm install @olostep/mastra-tools

Einrichtung

1. Paket installieren

npm install @olostep/mastra-tools @mastra/core

2. Integration importieren und registrieren

In deiner Mastra-Konfigurationsdatei:

import { Mastra } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Erstelle die Olostep-Integration
const olostep = createOlostepIntegration();

// Registriere APIs (dies macht sie für Agenten verfügbar)
olostep.registerApis();

// Füge sie deiner Mastra-Konfiguration hinzu
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere Konfigurationen
  },
});

3. API-Schlüssel konfigurieren

Setze deinen Olostep-API-Schlüssel als Umgebungsvariable:

export OLOSTEP_API_KEY=your-api-key-here

Oder in deiner .env-Datei:

OLOSTEP_API_KEY=your-api-key-here

Erhalte deinen API-Schlüssel vom Olostep Dashboard.

Verfügbare APIs

Die Integration stellt 4 APIs bereit, die deine Mastra-Agenten nutzen können:

scrapeWebsite

Extrahiere Inhalte von einer einzelnen URL. Unterstützt mehrere Formate und JavaScript-Rendering. Anwendungsfälle:

Überwache spezifische Seiten auf Änderungen
Extrahiere Produktinformationen von E-Commerce-Seiten
Sammle Daten aus Nachrichtenartikeln oder Blogbeiträgen
Ziehe Inhalte für Inhaltsaggregation

Schema-Parameter:

apiKey

string

erforderlich

Dein Olostep-API-Schlüssel

url_to_scrape

string

erforderlich

Website-URL zum Scrapen (muss http:// oder https:// enthalten)

formats

array

Standard:"['markdown']"

Ausgabeformate: [‘html’, ‘markdown’, ‘json’, ‘text’]

country

string

Ländercode für ortsspezifische Inhalte (z.B. “US”, “GB”, “CA”)

wait_before_scraping

number

Wartezeit in Millisekunden für JavaScript-Rendering (0-10000)

parser

string

Optionaler Parser-ID für spezialisierte Extraktion (z.B. “@olostep/amazon-product”)

Antwort:

id - Scrape-ID
url_to_scrape - Gescrapte URL
result.markdown_content - Markdown-Inhalt
result.html_content - HTML-Inhalt
result.json_content - JSON-Inhalt
result.text_content - Textinhalt
result.screenshot_hosted_url - Screenshot-URL (falls verfügbar)
result.markdown_hosted_url - Gehostete Markdown-URL
object - Objekttyp (“scrape”)
created - Unix-Zeitstempel

Beispielverwendung:

// In deinem Agenten oder Workflow
const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://example.com',
      formats: ['markdown'],
      country: 'US',
    }
  }
});

batchScrape

Verarbeite mehrere URLs parallel (bis zu 100.000 auf einmal). Perfekt für die groß angelegte Datenextraktion. Anwendungsfälle:

Scrape ganze Produktkataloge
Extrahiere Daten aus mehreren Suchergebnissen
Verarbeite Listen von URLs aus Tabellen
Massenhafte Inhaltsauszüge

Schema-Parameter:

apiKey

string

erforderlich

Dein Olostep-API-Schlüssel

batch_array

array

erforderlich

Array von Objekten mit url und optionalen custom_id FeldernBeispiel: [{"url":"https://example.com","custom_id":"site1"}]

formats

array

Standard:"['markdown']"

Ausgabeformate für alle URLs

country

string

Ländercode für ortsspezifisches Scraping

wait_before_scraping

number

Wartezeit in Millisekunden für JavaScript-Rendering

parser

string

Optionaler Parser-ID für spezialisierte Extraktion

Antwort:

batch_id - Batch-ID (verwende dies, um Ergebnisse später abzurufen)
status - Verarbeitungsstatus
object - Objekttyp (“batch”)

Beispielverwendung:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: [
        { url: 'https://example.com', custom_id: 'site1' },
        { url: 'https://test.com', custom_id: 'site2' },
      ],
      formats: ['markdown'],
    }
  }
});

createCrawl

Entdecke und scrape ganze Websites autonom, indem du Links folgst. Perfekt für Dokumentationsseiten, Blogs und Inhaltsrepositorien. Anwendungsfälle:

Crawle und archiviere ganze Dokumentationsseiten
Extrahiere alle Blogbeiträge von einer Website
Baue Wissensdatenbanken aus Webinhalten
Überwache Änderungen in der Website-Struktur

Schema-Parameter:

apiKey

string

erforderlich

Dein Olostep-API-Schlüssel

start_url

string

erforderlich

Start-URL für den Crawl (muss http:// oder https:// enthalten)

max_pages

number

Standard:"10"

Maximale Anzahl von Seiten, die gecrawlt werden sollen

follow_links

boolean

Standard:"true"

Ob Links auf Seiten gefolgt werden sollen

formats

array

Standard:"['markdown']"

Format für gescrapte Inhalte

country

string

Optionaler Ländercode für ortsspezifisches Crawling

parser

string

Optionaler Parser-ID für spezialisierte Inhaltsextraktion

Antwort:

id - Crawl-ID (verwende dies, um Ergebnisse später abzurufen)
object - Objekttyp (“crawl”)
status - Crawl-Status
created - Unix-Zeitstempel

Beispielverwendung:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createCrawl',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      start_url: 'https://docs.example.com',
      max_pages: 50,
      follow_links: true,
      formats: ['markdown'],
    }
  }
});

createMap

Extrahiere alle URLs von einer Website zur Inhaltserkennung und Analyse der Seitenstruktur. Anwendungsfälle:

Erstelle Sitemaps und Diagramme der Seitenstruktur
Entdecke alle Seiten vor dem Batch-Scraping
Finde fehlerhafte oder fehlende Seiten
SEO-Audits und Analysen

Schema-Parameter:

apiKey

string

erforderlich

Dein Olostep-API-Schlüssel

url

string

erforderlich

Website-URL, von der Links extrahiert werden sollen (muss http:// oder https:// enthalten)

search_query

string

Optionale Suchanfrage zur Filterung von URLs (z.B. “blog”)

top_n

number

Begrenze die Anzahl der zurückgegebenen URLs

include_urls

array

Glob-Muster, um spezifische Pfade einzuschließen (z.B. [“/blog/**”])

exclude_urls

array

Glob-Muster, um spezifische Pfade auszuschließen (z.B. [“/admin/**”])

Antwort:

id - Map-ID
object - Objekttyp (“map”)
url - Website-URL
total_urls - Gesamtanzahl gefundener URLs
urls - Array der entdeckten URLs

Beispielverwendung:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      search_query: 'blog',
      top_n: 100,
      include_urls: ['/blog/**'],
    }
  }
});

Verwendung mit Agenten

Einfaches Agentenbeispiel

Erstelle einen Agenten, der Websites scrapen kann:

import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

const olostep = createOlostepIntegration();
olostep.registerApis();

const agent = new Agent({
  name: 'web-researcher',
  instructions: `
    Du bist ein Web-Rechercheassistent. Wenn Benutzer dich bitten, Informationen von einer Website zu holen,
    verwende die Olostep scrapeWebsite API, um den Inhalt zu extrahieren, und fasse ihn dann für sie zusammen.
  `,
  model: 'openai/gpt-4',
});

// Der Agent kann jetzt Olostep-APIs über Mastras API-System verwenden

Agenten-Workflow-Beispiel

Baue einen Forschungs-Workflow, der Inhalte entdeckt und scrapt:

// 1. Mappe eine Website, um URLs zu entdecken
const mapResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'createMap',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url: 'https://example.com',
      include_urls: ['/blog/**'],
    }
  }
});

// 2. Batch-scrape entdeckte URLs
const batchResult = await mastra.callApi({
  integrationName: 'olostep',
  api: 'batchScrape',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
      formats: ['markdown'],
    }
  }
});

// 3. Verarbeite Ergebnisse mit deinem Agenten
const summary = await agent.generate({
  messages: [{
    role: 'user',
    content: `Fasse diesen Inhalt zusammen: ${batchResult.result.markdown_content}`
  }]
});

Beliebte Anwendungsfälle

Forschungsagent

Baue einen Agenten, der autonom Themen recherchiert:

Multi-Source Research

Workflow:

Benutzer fragt: “Recherchiere KI-Trends”
Agent verwendet createMap, um relevante Seiten zu entdecken
Agent verwendet batchScrape, um Inhalte zu extrahieren
Agent analysiert und fasst die Ergebnisse zusammen
Gibt strukturierten Forschungsbericht zurück

Wettbewerbsüberwachung

Workflow:

Tägliche Überwachung planen
Verwende scrapeWebsite, um Wettbewerbsseiten zu überprüfen
Vergleiche mit vorherigen Daten
Alarmiere bei signifikanten Änderungen
Erstelle wöchentliche Berichte

Inhaltsaggregation

Workflow:

Verwende createCrawl, um alle Blogbeiträge zu entdecken
Verwende batchScrape, um Inhalte zu extrahieren
Verarbeite mit KI, um Schlüsselthemen zu extrahieren
Speichere in Wissensdatenbank
Erstelle Inhaltskalender

E-Commerce-Intelligenz

Überwache Produkte und Preise:

Agenten-Workflow:
Scrape Produktseiten (scrapeWebsite)
Extrahiere strukturierte Daten (mit Parser)
Verfolge Preisänderungen
Erstelle Alarme
Aktualisiere Datenbank

SEO-Analyse

Analysiere Website-Struktur und Inhalte:

Agenten-Workflow:
Mappe Website-Struktur (createMap)
Crawle wichtige Abschnitte (createCrawl)
Analysiere Inhaltsqualität
Identifiziere SEO-Möglichkeiten
Erstelle Empfehlungen

Spezialisierte Parser

Olostep bietet vorgefertigte Parser für beliebte Websites. Verwende sie mit dem parser-Parameter:

Google-Suche

@olostep/google-searchExtrahiere: Suchergebnisse, Titel, Snippets, URLs

Google Maps

@olostep/google-mapsExtrahiere: Geschäftsinformationen, Bewertungen, Bewertungen, Standort

Verwendung von Parsern

Füge die Parser-ID zum parser-Parameter hinzu:

const result = await mastra.callApi({
  integrationName: 'olostep',
  api: 'scrapeWebsite',
  payload: {
    data: {
      apiKey: process.env.OLOSTEP_API_KEY,
      url_to_scrape: 'https://www.amazon.com/dp/PRODUCT_ID',
      formats: ['json'],
      parser: '@olostep/amazon-product',
    }
  }
});

Der Parser extrahiert automatisch strukturierte Daten, die spezifisch für diesen Website-Typ sind.

Best Practices

Verwende Batch-Verarbeitung für mehrere URLs

Wenn du mehr als 3-5 URLs scrapen möchtest, verwende batchScrape anstelle von mehreren scrapeWebsite-Aufrufen. Batch-Verarbeitung ist:

Viel schneller (parallele Verarbeitung)
Kostengünstiger
Einfacher zu verwalten
Besser für Ratenlimits

Setze angemessene Wartezeiten

Für JavaScript-lastige Seiten verwende den wait_before_scraping-Parameter:

Einfache Seiten: 0-1000ms
Dynamische Seiten: 2000-3000ms
Schweres JavaScript: 5000-8000ms

Teste mit verschiedenen Werten, um die optimale Wartezeit zu finden.

Verwende spezialisierte Parser

Für beliebte Websites (Amazon, LinkedIn, Google) verwende vorgefertigte Parser:

Erhalte automatisch strukturierte Daten
Zuverlässigere Extraktion
Kein Bedarf an benutzerdefiniertem Parsing
Von Olostep gewartet

Asynchrone Operationen handhaben

Batch-, Crawl- und Map-Operationen sind asynchron:

Speichere die zurückgegebene ID (batch_id, crawl_id, map_id)
Poll für Abschluss oder verwende Webhooks
Richte separate Workflows für den Abruf ein

Fehlerbehandlung

Umfasse API-Aufrufe immer mit try-catch-Blöcken:

try {
  const result = await mastra.callApi({
    integrationName: 'olostep',
    api: 'scrapeWebsite',
    payload: { data: {...} }
  });
} catch (error) {
  // Behandle Authentifizierung, Ratenlimit oder Netzwerkfehler
  console.error('Scraping fehlgeschlagen:', error.message);
}

Ratenbegrenzung

Sei dir der Ratenlimits bewusst:

Verteile Anfragen mit Verzögerungen
Verwende Batch-Verarbeitung, wenn möglich
Überwache die Nutzung im Olostep-Dashboard
Upgrade des Plans bei Bedarf

Komplettes Beispiel

Hier ist ein komplettes Beispiel zum Erstellen eines Forschungsagenten:

import { Mastra } from '@mastra/core';
import { Agent } from '@mastra/core';
import { createOlostepIntegration } from '@olostep/mastra-tools';

// Erstelle und registriere Olostep-Integration
const olostep = createOlostepIntegration();
olostep.registerApis();

// Initialisiere Mastra
export const mastra = new Mastra({
  config: {
    integrations: [olostep],
    // ... andere Konfigurationen
  },
});

// Erstelle Forschungsagenten
const researchAgent = new Agent({
  name: 'research-assistant',
  instructions: `
    Du bist ein Forschungsassistent, der Webdaten suchen, extrahieren und strukturieren kann.
    Wenn Benutzer dich bitten, ein Thema zu recherchieren:
    1. Verwende Olosteps createMap, um relevante Seiten zu entdecken
    2. Verwende batchScrape, um Inhalte aus mehreren Quellen zu extrahieren
    3. Analysiere und fasse die Ergebnisse zusammen
    4. Präsentiere strukturierte Forschungsberichte
  `,
  model: 'openai/gpt-4',
});

// Verwende den Agenten
async function researchTopic(topic: string) {
  // Schritt 1: Entdecke relevante Seiten
  const mapResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'createMap',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        url: `https://example.com/search?q=${topic}`,
        top_n: 20,
      }
    }
  });

  // Schritt 2: Scrape entdeckte Seiten
  const batchResult = await mastra.callApi({
    integrationName: 'olostep',
    api: 'batchScrape',
    payload: {
      data: {
        apiKey: process.env.OLOSTEP_API_KEY!,
        batch_array: mapResult.urls.slice(0, 10).map(url => ({ url })),
        formats: ['markdown'],
      }
    }
  });

  // Schritt 3: Analysiere mit Agenten
  const summary = await researchAgent.generate({
    messages: [{
      role: 'user',
      content: `Basierend auf diesen Forschungsdaten, gib eine umfassende Zusammenfassung von ${topic}`
    }]
  });

  return summary;
}

Fehlerbehebung

Authentifizierung fehlgeschlagen

Fehler: “Ungültiger API-Schlüssel”Lösungen:

Überprüfe den API-Schlüssel vom Dashboard
Stelle sicher, dass der API-Schlüssel als Umgebungsvariable gesetzt ist
Verifiziere, dass der API-Schlüssel aktiv ist
Überprüfe auf zusätzliche Leerzeichen im API-Schlüssel

API nicht gefunden

Fehler: “API nicht gefunden” oder “Integration nicht registriert”Lösungen:

Stelle sicher, dass registerApis() nach der Erstellung der Integration aufgerufen wird
Verifiziere, dass die Integration zur Mastra-Konfiguration hinzugefügt wurde
Überprüfe, dass der Integrationsname ‘olostep’ ist
Starte den Mastra-Server nach Änderungen neu

Scrape liefert leere Inhalte zurück

Fehler: Inhaltsfelder sind leerLösungen:

Erhöhe die wait_before_scraping-Zeit
Überprüfe, ob die Website eine Anmeldung erfordert
Versuche ein anderes Format (HTML vs Markdown)
Verifiziere, dass die URL zugänglich ist
Überprüfe, ob die Seite automatisierten Zugriff blockiert

Ratenlimit überschritten

Fehler: “Ratenlimit überschritten”Lösungen:

Verteile Anfragen mit Verzögerungen
Verwende Batch-Verarbeitung anstelle von einzelnen Scrapes
Upgrade deines Olostep-Plans
Überprüfe das Ratenlimit im Dashboard

TypeScript-Fehler

Fehler: Modul nicht gefunden oder TypfehlerLösungen:

Stelle sicher, dass @mastra/core installiert ist
Überprüfe die Kompatibilität der TypeScript-Version
Verifiziere, dass alle Abhängigkeiten installiert sind
Baue neu: npm run build

Preisgestaltung

Olostep berechnet die API-Nutzung unabhängig von Mastra:

Scrapes: Bezahlung pro Scrape
Batches: Bezahlung pro URL im Batch
Crawls: Bezahlung pro gecrawlter Seite
Maps: Bezahlung pro Map-Operation

Überprüfe die aktuellen Preise unter olostep.com/pricing.

Support

Brauchst du Hilfe bei der Mastra-Integration?

Dokumentation

Durchsuche die vollständigen API-Dokumente

Support-E-Mail

E-Mail: info@olostep.com

Mastra-Dokumentation

Erfahre mehr über das Mastra-Framework

Scrapes API

Erfahre mehr über den Scrapes-Endpunkt

Batches API

Erfahre mehr über den Batches-Endpunkt

Crawls API

Erfahre mehr über den Crawls-Endpunkt

Maps API

Erfahre mehr über den Maps-Endpunkt

Zapier-Integration

Automatisiere mit Zapier-Workflows

LangChain-Integration

Baue KI-Agenten mit LangChain

Mastra-Website

Mastra-Plattform

Erste Schritte

Bereit, KI-Agenten mit Web-Scraping-Fähigkeiten zu bauen?

Paket installieren

Installiere @olostep/mastra-tools von npm

Baue intelligente KI-Agenten, die Webdaten mit Olostep und Mastra suchen, extrahieren und strukturieren können!

Loslegen

Funktionen

Integrationen

Documentation Index

​Funktionen

Website scrapen

URLs im Batch scrapen

Crawl erstellen

Karte erstellen

​Installation

​Einrichtung

​1. Paket installieren

​2. Integration importieren und registrieren

​3. API-Schlüssel konfigurieren

​Verfügbare APIs

​scrapeWebsite

​batchScrape

​createCrawl

​createMap

​Verwendung mit Agenten

​Einfaches Agentenbeispiel

​Agenten-Workflow-Beispiel

​Beliebte Anwendungsfälle

​Forschungsagent

​E-Commerce-Intelligenz

​SEO-Analyse

​Spezialisierte Parser

Google-Suche

Google Maps

​Verwendung von Parsern

​Best Practices

​Komplettes Beispiel

​Fehlerbehebung

​Preisgestaltung

​Support

Dokumentation

Support-E-Mail

Mastra-Dokumentation

​Verwandte Ressourcen

Scrapes API

Batches API

Crawls API

Maps API

Zapier-Integration

LangChain-Integration

Mastra-Website

​Erste Schritte

Paket installieren

Funktionen

Installation

Einrichtung

1. Paket installieren

2. Integration importieren und registrieren

3. API-Schlüssel konfigurieren

Verfügbare APIs

scrapeWebsite

batchScrape

createCrawl

createMap

Verwendung mit Agenten

Einfaches Agentenbeispiel

Agenten-Workflow-Beispiel

Beliebte Anwendungsfälle

Forschungsagent

E-Commerce-Intelligenz

SEO-Analyse

Spezialisierte Parser

Verwendung von Parsern

Best Practices

Komplettes Beispiel

Fehlerbehebung

Preisgestaltung

Support

Verwandte Ressourcen

Erste Schritte