Ressourcen

Tools, Videos und Artikel für die erfolgreiche Implementierung von KI-Guardrails und Governance.

Tools & Mini-Apps

Interaktive Tools und Mini-Anwendungen für AI Builder

Neueste Artikel

Einblicke in KI-Guardrails und Governance

Alle Artikel anzeigen
PlaceboBench: An LLM Hallucination Benchmark for Pharma
2026-02-1715 min read

PlaceboBench: An LLM Hallucination Benchmark for Pharma

We created PlaceboBench, a challenging pharmaceutical RAG benchmark based on real clinical questions and official EMA documents. Seven state-of-the-art LLMs show hallucination rates between 26% and 64%.

What does it cost to do OCR with Large Language Models?
2025-12-095 min read

What does it cost to do OCR with Large Language Models?

Our LLM OCR Cost Calculator allows AI builders to compare PDF parsing costs across different LLM providers and models

RAGTruth++: Enhanced Hallucination Detection Benchmark
2025-11-2012 min read

RAGTruth++: Enhanced Hallucination Detection Benchmark

We enhanced the RAGTruth benchmark by finding 10x more hallucinations through automated detection and human review.

Why Hallucination Benchmarks Miss the Mark
2025-11-128 min read

Why Hallucination Benchmarks Miss the Mark

The gap between hallucination benchmarks and production reality and what bears have to do with it

Video-Ressourcen

Schauen Sie sich Tutorials an und lernen Sie von unseren Experten

Alle Videos anzeigen
Vier Wege zur Reduzierung von Halluzinationen in deinen KI-Agenten
2026-03-253:13

Vier Wege zur Reduzierung von Halluzinationen in deinen KI-Agenten

Vier Ansätze zur Reduzierung von Halluzinationen, gestützt auf quantitative Belege.

PlaceboBench-Ergebnisse: Welches LLM halluziniert am häufigsten bei Pharma-Daten?
2026-03-241:59

PlaceboBench-Ergebnisse: Welches LLM halluziniert am häufigsten bei Pharma-Daten?

Wir haben 12 der neuesten LLMs anhand eines anspruchsvollen Anwendungsfalls in der Pharmabranche getestet. Erfahre, wie oft die Modelle halluzinierten, warum das Modell mit der niedrigsten Halluzinationsrate nicht unbedingt die beste Wahl ist und wie Latenz und Kosten deine Modellauswahl beeinflussen sollten.

Entwicklung halluzinationsresistenter GenAI-Anwendungen in der Pharmabranche
2026-03-1929:23

Entwicklung halluzinationsresistenter GenAI-Anwendungen in der Pharmabranche

Wir haben 12 state-of-the-art LLMs wie GPT-5.4 oder Gemini 3.1 Pro anhand eines anspruchsvollen Anwendungsfalls in der Pharmabranche getestet. Daraus entstand PlaceboBench, ein Benchmark zu Halluzinationsraten im Pharmabereich. Diese On-Demand-Session führt durch detaillierte Ergebnisse sowie Strategien zur Reduzierung von Halluzinationen.

How to create your own hallucination detection benchmarks: Making of the RAGTruth++ dataset
2025-11-217:00

How to create your own hallucination detection benchmarks: Making of the RAGTruth++ dataset

We walk you through the process of creating the RAGTruth++ hallucination benchmark. Useful for anyone who wants to get a deeper understanding of how benchmarks are made.

KI-Halluzinationen - Azure Groundedness reverse engineeren und einen eigenen Halluzinations-Detektor entwickeln
2025-11-1215:00

KI-Halluzinationen - Azure Groundedness reverse engineeren und einen eigenen Halluzinations-Detektor entwickeln

Erfahren Sie, wie Sie Azures Groundedness-Erkennungssystem reverse engineeren und Ihren eigenen Halluzinations-Detektor für KI-Anwendungen erstellen.