修复 Xbow Benchmarks 中一些拉不起来的 benchmark,并提供 Web 界面帮助快速拉起环境和对 Agent 进行能力测试,旨在提高安全 Agent 的测试效率
Latest commits.
Builders behind this project.