الدورة الافتراضية "طرق التعلم القائمة على العينة - الدورة الافتراضية - Coursera" ، هي دورة بمحتويات مختلفة وتقدم دروس فيديو تقريبًا. 22 ساعة لإكمال. استكشف ميزاته الأساسية ، وانقر فوق الزر البرتقالي للحصول على معلومات مفصلة عن منصة التعلم الإلكتروني Coursera.
في هذه الدورة ، ستتعرف على العديد من الخوارزميات التي يمكنها تعلم السياسات شبه المثالية بناءً على تفاعل التجربة والخطأ مع البيئة ، والتعلم من تجربة الوكيل الخاصة. التعلم من التجربة الفعلية أمر مذهل لأنه لا يتطلب معرفة مسبقة بديناميكيات البيئة ولا يزال بإمكانك تحقيق السلوك الأمثل. سنغطي أساليب مونت كارلو البسيطة والقوية بشكل حدسي ، وطرق التعلم بفرق الوقت ، بما في ذلك Q-Learning. سننهي هذه الدورة من خلال التحقيق في كيفية الحصول على أفضل ما في العالمين: الخوارزميات التي يمكن أن تجمع بين الجدولة المستندة إلى النموذج (على غرار البرمجة الديناميكية) وتحديثات الفروق المؤقتة لتسريع التعلم بشكل جذري. بنهاية هذه الدورة ، ستكون قادرًا على: - فهم فرق التوقيت وتعلم مونت كارلو كإستراتيجيتين لتقدير وظائف القيمة من تجربة العينة - فهم أهمية الاستكشاف ، عند استخدام تجربة العينة بدلاً من عمليات المسح البرمجية الديناميكية داخل النموذج - فهم الروابط بين مونت كارلو والبرمجة الديناميكية و TD. - تنفيذ وتطبيق خوارزمية TD ، لتقدير وظائف القيمة - تنفيذ وتطبيق توقع Sarsa و Q-Learning (طريقتان للتحكم في TD) - فهم الفرق بين التحكم داخل السياسة وخارج السياسة - فهم التخطيط من خلال الخبرة المحاكاة (على عكس استراتيجيات التخطيط الكلاسيكية) - تنفيذ نهج قائم على النموذج لـ RL ، يسمى Dyna ، والذي يستخدم تجربة محاكاة - إجراء دراسة تجريبية لمعرفة التحسينات في كفاءة العينة عند استخدام Dyna عند استخدام تجربة أخذ العينات بدلاً من عمليات المسح البرمجية الديناميكية ضمن نموذج: فهم الروابط بين مونت كارلو والبرمجة الديناميكية و TD. - تنفيذ وتطبيق خوارزمية TD ، لتقدير وظائف القيمة - تنفيذ وتطبيق توقع Sarsa و Q-Learning (طريقتان للتحكم في TD) - فهم الفرق بين التحكم داخل السياسة وخارج السياسة - فهم التخطيط من خلال الخبرة المحاكاة (على عكس استراتيجيات التخطيط الكلاسيكية) - تنفيذ نهج قائم على النموذج لـ RL ، يسمى Dyna ، والذي يستخدم تجربة محاكاة - إجراء دراسة تجريبية لمعرفة التحسينات في كفاءة العينة عند استخدام Dyna عند استخدام تجربة أخذ العينات بدلاً من عمليات المسح البرمجية الديناميكية ضمن نموذج: فهم الروابط بين مونت كارلو والبرمجة الديناميكية و TD.
جهز نفسك من المنزل مع أرقى الجامعات في العالم.
يتم دعم جودة دورات كورسيرا من قبل أساتذتها ، الذين غالبًا ما يكونون عمداء حاصلين على درجة الدكتوراه.
أبلغ أكثر من 85٪ من طلاب كورسيرا عن مزايا وظيفية ، مثل الترقيات أو زيادات الرواتب.
يحقق ملايين الطلاب حول العالم أهدافهم الشخصية والمهنية باستخدام Coursera.
تقدم Coursera دورات من أكثر من 200 جامعة وشركة رائدة لتقديم التعلم عبر الإنترنت في جميع أنحاء العالم. مع اشتراك كورسيرا بلس, تحصل على وصول غير محدود إلى أكثر من 90٪ من جميع الدورات ، والشهادات والتخصصات المهنية الأكثر شهرة على كورسيرا.
علم البيانات والأعمال والتنمية الشخصية. يمكنك التسجيل في دورات متعددة في وقت واحد ، والحصول على شهادات غير محدودة ، وتعلم مهارات العمل المطلوبة لبدء المهن وتنميتها وحتى تغييرها.
اكتشف كيفية الحصول على أكبر مبلغ ، ووفّر أكثر من 500 دولار أمريكي من خلال الاشتراك السنوي في COURSERA PLUS *
* يمكنك توفير ما يصل إلى 500 دولار أمريكي في 12 شهرًا ، عندما تنتقل من دفع 59 دولارًا أمريكيًا للاشتراك الشهري ، إلى الاشتراك السنوي مع العرض الترويجي. الاشتراك السنوي العادي هو 399 دولارًا أمريكيًا. مع العرض الترويجي ، ستدفع 299 دولارًا أمريكيًا فقط. اكتشف كل شيء عن طريق النقر فوق الزر الأصفر.
مرحبا، كيف أستطيع مساعدتك؟ هل أنت مهتم بدورة؟ حول أي موضوع؟
أضف تقييمك