bxyu-nvidia

bxyu-nvidia

Achievements

nv-mini-swe-agent nv-mini-swe-agent Public

Forked from sdevare-nv/nv-mini-swe-agent

Python
Evaluator Evaluator Public

Forked from NVIDIA-NeMo/Evaluator

Open-source library for scalable, reproducible evaluation of AI models and benchmarks.

Python
tau2-bench tau2-bench Public

Forked from sierra-research/tau2-bench

τ-Bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains

Python