PromptSonar

Model Drift Sandbox

Compare model safety posture, drift index, and regression behavior from the playground evaluation pipeline.

Back to Playground

GPT-4o

Evaluation Adapter

Stable

Drift Index

0.12

Safety Score

96%

Claude 3.5

Evaluation Adapter

Stable

Drift Index

0.08

Safety Score

98%

Gemini 1.5

Evaluation Adapter

Watch

Drift Index

0.10

Safety Score

94%

Llama 3.1

Evaluation Adapter

Watch

Drift Index

0.10

Safety Score

92%