Evalverse: biblioteca unificada para evaluar LLMs – práctica
Evalverse unifica métricas, pipelines y reportes para evaluar LLMs; reproduce evaluaciones fácilmente. Prueba la demo en GitHub y consulta la guía técnica.
Sin comentarios
agosto 12, 2025