AI on Demandpowered by BAAI

bge-m3 und bge-reranker-v2-m3 von BAAI: zwei spezialisierte Modelle für Embedding und Reranking, über 100 Sprachen und bis zu 8192 Tokens. stepping stone betreibt beide auf Schweizer Infrastruktur — als Grundlage für Such- und RAG-Architekturen ohne US-Abhängigkeit.

stepping stone stellt zwei Modelle der Beijing Academy of Artificial Intelligence (BAAI) bereit: bge-m3 für Embedding und bge-reranker-v2-m3 für Reranking.

Das Embedding-Modell wandelt Texte in Vektoren um und ermöglicht so eine leistungsfähige, sprachübergreifende Suche — über 100 Sprachen, von kurzen Anfragen bis zu Dokumenten mit 8192 Tokens. Das Reranking-Modell sortiert die Ergebnisse nach Relevanz und verbessert die Trefferqualität.

Kombiniert mit einem der LLM-Angebote von stepping stone entsteht eine Retrieval-Augmented Generation (RAG) Pipeline: Ihre internen Daten werden im Kontext jeder Anfrage verfügbar — präzise, effizient und ohne das Land zu verlassen.

Entwicklungsteams und Unternehmen, die eine intelligente Suche über interne Daten aufbauen oder bestehende KI-Anwendungen mit eigenem Wissen anreichern wollen. Besonders geeignet für Organisationen mit mehrsprachigen Dokumentenbeständen oder Compliance-Anforderungen.

Typische Einsatzbereiche: semantische Suche über Wissensdatenbanken und Archive, RAG-Pipelines für Chatbots und Assistenzsysteme, mehrsprachige Dokumentensuche, Qualitätsverbesserung bestehender Suchlösungen durch Reranking.

Open Source (MIT / Apache 2.0). Schweizer Rechenzentren. Keine Daten bei US-Anbietern.

Embedding und Reranking benötigen deutlich weniger Rechenleistung als ein LLM, das dieselbe Aufgabe übernehmen müsste — das spart Tokens und Kosten. Moderne API mit umfangreicher Dokumentation und verständlichen Beispielen. Persönliche Beratung und Betrieb durch stepping stone aus Bern.

Leistungsumfang

Embedding und Reranking auf Abruf

Zugriff auf bge-m3 für mehrsprachige Vektorsuche und bge-reranker-v2-m3 für präzises Reranking. Über 100 Sprachen, bis zu 8192 Tokens pro Dokument.

RAG-fähige Infrastruktur

Kombinierbar mit den LLM-Angeboten von stepping stone zu einer vollständigen RAG-Pipeline. Ihre internen Daten werden im Kontext jeder Anfrage verfügbar, ohne das Land zu verlassen.

Betreuter Betrieb

Bereitstellung, Monitoring, Wartung und Support auf Schweizer Infrastruktur mit persönlicher Beratung. stepping stone kümmert sich um den Betrieb, damit Sie sich auf den Nutzen konzentrieren können.

Einsatzgebiete

Semantische Suche

BAAI-Modelle ermöglichen eine Suche, die Bedeutung versteht — nicht nur Schlüsselwörter abgleicht.

Unternehmen nutzen bge-m3, um Wissensdatenbanken, Dokumentenarchive und interne Ablagen semantisch durchsuchbar zu machen. Das Reranking-Modell verbessert die Trefferqualität anschliessend durch präzise Relevanzgewichtung — mehrsprachig, effizient und auf Schweizer Infrastruktur.

RAG-Pipelines

Embedding und Reranking sind die Kernbausteine jeder Retrieval-Augmented Generation Pipeline.

In Kombination mit einem der LLM-Angebote von stepping stone entstehen RAG-Systeme, die interne Daten kontextgenau in jede Anfrage einbinden. Kompatibel mit LangChain und LlamaIndex — ohne das Land zu verlassen.

Preise

ModelKontextlängeMTok
bge-m38k0.1000
bge-reranker-v2-m38k0.1000
Alle Preise in CHF/MTok exkl. Mehrwertsteuer.