Ressourcen
Tools, Videos und Artikel für die erfolgreiche Implementierung von KI-Guardrails und Governance.
Empfohlen

Improving knowledge graph creation in life sciences through agent steering
Agent steering intercepts agents mid-run to provide state-specific feedback, improving completeness, hallucination rates, and entity resolution by up to 14 percentage points for knowledge graph creation in life sciences.
Hallucination Detection Comparison
What's the best tool for hallucination detection? We put 7 of them to the test.
Wo KI?
Finden Sie heraus, welcher Cloud-Anbieter Ihr KI-Modell hostet, in welchen Regionen und mit welchen Datenresidenz-Garantien.
Jetzt ausprobierenWeitere Ressourcen

PlaceboBench: An LLM Hallucination Benchmark for Pharma
We created PlaceboBench, a challenging pharmaceutical RAG benchmark based on real clinical questions and official EMA documents. Twelve state-of-the-art LLMs show hallucination rates between 24% and 64%.

Vier Wege zur Reduzierung von Halluzinationen in deinen KI-Agenten
Vier Ansätze zur Reduzierung von Halluzinationen, gestützt auf quantitative Belege.

PlaceboBench-Ergebnisse: Welches LLM halluziniert am häufigsten bei Pharma-Daten?
Wir haben 12 der neuesten LLMs anhand eines anspruchsvollen Anwendungsfalls in der Pharmabranche getestet. Erfahre, wie oft die Modelle halluzinierten, warum das Modell mit der niedrigsten Halluzinationsrate nicht unbedingt die beste Wahl ist und wie Latenz und Kosten deine Modellauswahl beeinflussen sollten.

Entwicklung halluzinationsresistenter GenAI-Anwendungen in der Pharmabranche
Wir haben 12 state-of-the-art LLMs wie GPT-5.4 oder Gemini 3.1 Pro anhand eines anspruchsvollen Anwendungsfalls in der Pharmabranche getestet. Daraus entstand PlaceboBench, ein Benchmark zu Halluzinationsraten im Pharmabereich. Diese On-Demand-Session führt durch detaillierte Ergebnisse sowie Strategien zur Reduzierung von Halluzinationen.

What does it cost to do OCR with Large Language Models?
Our LLM OCR Cost Calculator allows AI builders to compare PDF parsing costs across different LLM providers and models
OCR Kostenrechner
Vergleichen Sie OCR-Verarbeitungskosten verschiedener LLM-Anbieter. Finden Sie die kostengünstigste Lösung für Ihre Dokumentenverarbeitung.
Jetzt ausprobieren
How to create your own hallucination detection benchmarks: Making of the RAGTruth++ dataset
We walk you through the process of creating the RAGTruth++ hallucination benchmark. Useful for anyone who wants to get a deeper understanding of how benchmarks are made.

RAGTruth++: Enhanced Hallucination Detection Benchmark
We enhanced the RAGTruth benchmark by finding 10x more hallucinations through automated detection and human review.

Why Hallucination Benchmarks Miss the Mark
The gap between hallucination benchmarks and production reality and what bears have to do with it

KI-Halluzinationen - Azure Groundedness reverse engineeren und einen eigenen Halluzinations-Detektor entwickeln
Erfahren Sie, wie Sie Azures Groundedness-Erkennungssystem reverse engineeren und Ihren eigenen Halluzinations-Detektor für KI-Anwendungen erstellen.