View of Data Contamination or Genuine Generalization? Disentangling LLM Performance on Benchmarks

Return to Article Details Data Contamination or Genuine Generalization? Disentangling LLM Performance on Benchmarks Download Download PDF