El ARFF (Attribute-Relation File Format, Formato de Archivo de Atributo-Relación) es un formato de archivo de texto desarrollado por el Grupo de Aprendizaje Automático (Machine Learning Group) de la Universidad de Waikato para describir conjuntos de datos utilizados en el aprendizaje automático. Se utiliza principalmente con el software WEKA (Waikato Environment for Knowledge Analysis), pero también es compatible con otras herramientas de aprendizaje automático. Un archivo ARFF consta de una sección de encabezado (header section) y una sección de datos (data section). La sección de encabezado define el nombre de la relación (nombre del conjunto de datos) y los atributos (características o columnas) de los datos. Cada atributo se declara con su nombre y tipo de dato (ejemplo: numérico, nominal, cadena de texto (string), fecha (date)). La sección de datos contiene las instancias de datos reales, donde cada instancia se representa como una lista de valores de atributos separados por comas. Los valores faltantes (missing values) se representan típicamente con un signo de interrogación (?). Los archivos ARFF están diseñados para ser legibles por humanos y fácilmente procesables por algoritmos de aprendizaje automático, lo que los convierte en una opción popular para almacenar e intercambiar conjuntos de datos en la comunidad de machine learning. El formato soporta varios tipos de datos y permite la representación de datos tanto numéricos como categóricos, haciéndolo versátil para una amplia gama de tareas de aprendizaje automático.