Le format ARFF (Attribute-Relation File Format) est un format de fichier texte développé par le Machine Learning Group de l'Université de Waikato pour décrire les jeux de données utilisés en apprentissage automatique (machine learning). Il est principalement utilisé avec le logiciel WEKA (Waikato Environment for Knowledge Analysis), mais il est également pris en charge par d'autres outils d'apprentissage automatique. Un fichier ARFF se compose d'une section d'en-tête et d'une section de données. L'en-tête définit le nom de la relation (nom du jeu de données) et les attributs (caractéristiques ou colonnes) des données. Chaque attribut est déclaré avec son nom et son type de données (par exemple, numérique, nominal, chaîne de caractères, date). La section de données contient les instances réelles, chaque instance étant représentée par une liste de valeurs d'attributs séparées par des virgules. Les valeurs manquantes sont généralement représentées par un point d'interrogation (?). Les fichiers ARFF sont conçus pour être lisibles par l'homme et facilement analysables par des algorithmes d'apprentissage automatique, ce qui en fait un choix populaire pour stocker et échanger des jeux de données au sein de la communauté scientifique. Le format prend en charge divers types de données et permet la représentation de données numériques et catégorielles, ce qui le rend polyvalent pour un large éventail de tâches d'apprentissage automatique.