شروع دور جدید ارائه‌های کارگروه داده‌های عظیم با محوریت درس آنلاین Introduction to Data Science

به نام خدا

دور جدید ارائه‌های کارگروه داده‌های عظیم با محوریت درس آنلاین Introduction to data science آغاز گردید.
اولین جلسه‌ی ارائه‌ چهارشنبه دوم دی‌ماه ساعت ۱۵ الی ۱۷ در سالن خوارزمی برگزار می‌گردد.
برای اطلاع از برنامه‌های کارگروه عضو میلینگ لیست شوید.

کارگروه‌ داده‌های عظیم در پاییز ۹۴ با تمرکز بر روی پروژه‌ی خبرکاوی توانست در قالب یک کار تیمی داشته‌های علمی و فنی بسیاری را به دست آورد و انشالله با استمرار پروژه خروجی کار نیز قابل توجه خواهد بود. این پروژه با دو هدف نتایج تحقیقاتی و یک محصول تحلیل خبر شروع گردیده و در فاز تحقیق و توسعه می‌باشد. برای کسب اطلاعات بیشتر در خصوص این صفحه را دنبال کنید.
در این سری از ارائه‌ها مباحث مطرح شده در درس آنلاین  Introduction to Data Science را پیگیری می‌کنیم.
این درس که توسط دانشگاه واشنگتن ارائه گردیده است بسیار مورد استقبال قرار گرفته است و توانسته است مباحث اصلی مرتبط با علم داده را پوشش دهد و از طریق پروژه‌های دید عملیاتی را نیز برای علم داده ایجاد کند.
در پایین سیلابس درس را به صورت مختصر قرار داده‌ایم.
دوستانی که تمایل به ارائه دارند از طریق ایمیل اطلاع می‌دهند و طبق زمانبندی و علاقه‌مندی افراد قسمتی از این درس به آن‌ها اختصاص داده می‌شود.
این ارائه‌ها به منظور مطالعه‌ی گروهی محتواهای این درس می‌باشد. همچنین در جلساتی تمرین‌های مهم درس در قالب کارگاه مورد تحلیل قرار می‌گیرد.
در جلسه‌ی اول علم داده معرفی می‌شود و ارتباط آن با آمار، هوش تجاری، یادگیری ماشین و … مورد تحلیل قرار می‌گیرد. همچنین مفاهیم بهینه سازی کویری در لایه‌ی منطقی و فیزیکی پایگاه داده‌های ارتباطی ارائه می‌گردد.
همچنین افراد می‌توانند با ثبت نام در  درس آنلاین از محتواهای اصلی درس بهره مند گردند.
فیلم‌های این درس در دراپ باکس قرار دارد و فایل‌های مرتبط با تمرین (مثلا ماشین مجازی) قرار می‌گیرد.
برای کسب اطلاع از فعالیت‌های کارگروه می‌توانید در میلینگ لیست کارگروه ثبت نام کنید.
سیلابس درس:
  • Part 0: Introduction
    • Data science articulated, data science examples, history and context, technology landscape
  • Part 1: Data Manipulation, at Scale
    • Databases and the relational algebra
    • MapReduce, Hadoop, relationship to databases, algorithms, extensions, language; key-value stores and NoSQL; tradeoffs of SQL and NoSQL
    • Data cleaning, entity resolution, data integration, information extraction
  • Part 2: Analytics
    • Topics in statistical modeling and experiment design
    • Introduction to Machine Learning, supervised learning, decision trees/forests, simple nearest neighbor
    • Unsupervised learning: k-means, multi-dimensional scaling
  • Part 3: Interpreting and Communicating Results
    • Visualization, visual data analytics
    • Backlash: Ethics, privacy, unreliable methods, irreproducible results
  • Part 4: Graph Analytics
پروژه‌های درس:
  • Week 1: Twitter Sentiment Analysis (Python)
  • Week 2: In-Database Analytics (SQL)
  • Week 3: MapReduce Concepts and Algorithms (Python)
  • Week 4: (Optional) Large-scale data processing in the cloud (Pig, Hadoop, AWS)
  • Week 5: Supervised Learning Roundup (R)
  • Week 6: Visualization (Tableau and/or Javascript/D3)
  • Week 7: Kaggle Competition

ff

 


پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *