قبل أن تتمكن من التعامل مع البيانات ، تحتاج إلى الحصول على جزء منها. ستغطي هذه الدورة الطرق الأساسية التي يمكن من خلالها الحصول على البيانات. ستغطي الدورة إحضار البيانات من الويب ومن واجهات برمجة التطبيقات وقواعد البيانات ومن النظراء بتنسيقات مختلفة. كما سيغطي أساسيات تنقية البيانات وكيفية جعل البيانات "مرتبة". تعمل البيانات المصنفة على تسريع مهام تحليل البيانات اللاحقة بشكل كبير. ستغطي الدورة أيضًا مكونات مجموعة بيانات كاملة بما في ذلك البيانات الأولية وتعليمات المعالجة وكتب الشفرات والبيانات المعالجة. ستغطي الدورة المفاهيم الأساسية المطلوبة لجمع البيانات وتنظيفها ومشاركتها.