measured by

[published]static · preferred

Logical reasoning benchmarks

Confidence	Rank	Temporal	Method
Moderate (89%)	preferred	static	ai_generated

Sources

Source	Domain	Score	AI
measured_by		—	—