يُعد Apache Parquet تنسيق تخزين عمودي (columnar storage format) مُحسّن للاستخدام مع أطر عمل معالجة البيانات الضخمة. على عكس التنسيقات الموجهة نحو الصفوف، يقوم Parquet بتخزين البيانات حسب الأعمدة، مما يسمح بضغط البيانات وترميزها بكفاءة عالية. يُمكّن هذا التخزين العمودي محركات الاستعلام من استرداد الأعمدة الضرورية فقط لاستعلام معين، مما يقلل بشكل كبير من عمليات الإدخال والإخراج (I/O) ويحسن أداء الاستعلام. تم تصميم Parquet ليكون ذاتي الوصف، مما يعني أن المخطط (schema) مضمن داخل ملف البيانات نفسه، وهذا يلغي الحاجة إلى مخازن بيانات وصفية خارجية ويبسط إدارة البيانات. يدعم التنسيق مجموعة واسعة من أنواع البيانات والهياكل المتداخلة المعقدة. يُستخدم Parquet على نطاق واسع في مستودعات البيانات، وبحيرات البيانات، وتطبيقات البيانات الضخمة الأخرى حيث يكون التخزين والاسترداد الفعال للبيانات أمراً بالغ الأهمية. إن تكامله مع أطر عمل شهيرة مثل Apache Spark وHadoop وPresto يجعله خياراً متعدد الاستخدامات لخطوط معالجة البيانات. تم تصميم التنسيق لعمليات القراءة والكتابة على حد سواء، على الرغم من أنه يُستخدم غالباً في السيناريوهات التي تُكتب فيها البيانات مرة واحدة وتُقرأ مرات عديدة (write-once, read-many).