علوم داده و هوش مصنوعی

دوره متن کاوی با پایتون (Text Mining)

0 دانشجو
۱۸ ساعت

درباره این دوره

امروزه علوم داده به یکی از جذاب‌ترین و پرطرفدارین تخصص‌ها و مشاغل در ایران و دنیا تبدیل شده است. اما برای تبدیل شدن به یک متخصص علوم داده، تسلط بر مفاهیم و تکنیک‌های داده کاوی‌های معمول و شناخته شده یا همان کاوش دیتای ساختار یافته (Structured Data) کافی نیست و تسلط به تحلیل داده‌های بدون ساختار (Unstructured Data) امری ضروری محسوب می‌شود. پردازش و کاوش متون و زبان‌های طبیعی نیز یک جزء ازداده‌های ساختار نیافته می‌باشد.

متن کاوی یا Text Mining به فرآیند داده کاوی Data Mining در متون و زبان‌های طبیعی گفته می‌شود. در واقع فرایند متن کاوی با طبقه‌بندی متون Classification، خوشه‌بندی متون (Document Clustering – Text Clustering)، استخراج معنا و مفاهیم از جملات، تولید رده‌بندی دانه‌ای، آنالیز احساسات، خلاصه‌سازی اسناد و در مراحل پیچیده‌تر مدلسازی رابطه میان موجودیت‌ها یک گزارش کمی یا در برخی از موارد یک گزارش کیفی از اطلاعات ارائه می‌دهد. متن کاوی با پایتون Python یکی از روش‌های رایج برای استخراج داده‌ها از متون مختلف می‌باشد. پایتون با داشتن کتابخانه‌هایی مثل (pandas-numpy-Matplotlib-scikit learn-tensorflow-nltk-keras) و قابلیت‌هایی که برای پردازش متن ارائه می‌کند یکی از محبوب‌ترین و کاربردی‌ترین زبان‌های برنامه‌نویسی برای متن کاوی محسوب می‌شود.

از کاربردهای آموزش متن کاوی «Text Mining» و پردازش زبان طبیعی می‌توان به موارد زیر اشاره کرد: 

  • از انواع منابع متن (کتاب، روزنامه، فایل pdf، فایل word، صفحات وب و …) اطلاعات کلیدی و مهم استخراج کرد.
  • نظرات، کامنت‌ها و گفته‌های افراد را تحلیل کرد.
  • طبقه‌بندی گزارشات و اسناد
  • خوشه‌بندی گزارشات و اسناد
  • از دل منبع اطلاعات متنی، ابر واژگان ساخت.
  • یک سیستم ترجمه (برای تمام زبان‌های دنیا) ساخت.
  • صوت را به متن تبدیل کرد.
  • متن را به یک فایل صوتی (با فرمت mp3) تبدیل کرد.
  • تبدیل متن به ویژگی (برای خوشه‌بندی و طبقه‌بندی متن مورد استفاده قرار می‌گیرد.)

دوره آموزش متن کاوی برای چه کسانی مناسب است؟

کارشناسان و فارغ التحصیلان آمار، علوم کامپیوتر، نرم افزار و فناوری اطلاعات و افرادی که به دنبال آموزش‌های کاربردی و ارتقاء مهارت‌های خود هستند، می‌توانند در این دوره شرکت نمایند. سایر دوره‌های دیگری در گروه آموزشی علوم داده از جمله دووره داده کاوری و دوره علم داده نیز برگزار می‌شود.

سرفصل‌های دوره

مقدمه‌ای بر متن‌ کاوی text mining

آشنایی با کتابخانه nltk

پیش‌پردازش متن

مقدمه‌ای بر عبارات منظم

ساخت بردار ویژگی‌ها با استفاده از کلمات

رده‌بندی و خوشه‌بندی متن‌ها

تحلیل احساسات

متن‌کاوی فارسی

تعبیه‌سازی کلمات و کاربرد یادگیری عمیق( deep learning) در متن‌ کاوی

سوالات متداول
این دوره بصورت آنلاین در بستر ادوبی کانکت Adobe Connect برگزار میگردد.
پس از گذراندن دوره و در صورت کسب نمره قبولی در آزمون‌ها و پروژه‌ها به فراگیران گواهینامه ارائه می‌شود.
دوره هایی که هزینه آن ها بالای ۶ میلیون تومان است شرایط پرداخت اقساط دارند، برای اطلاع از نحوه پرداخت اقساط با کارشناس دپارتمان هماهنگی های لازم را انجام دهید.
برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.
جهت آشنایی با نحوه ترجمه مدارک جهاد دانشگاهی صنعتی شریف به این وبلاگ مراجعه کنید.
اساتید دوره
دیدگاه‌ها

دیدگاه خود را بنویسید
ایمیل شما منتشر نخواهد شد.

مصاحبه با دانشجویان
مشخصات دوره

تاریخ شروع

اعلام میگردد

روزهای برگزاری

اعلام میگردد

مدت زمان

۱۸ ساعت

نحوه برگزاری
امکان پرداخت اقساطی
پیش‌نیازها

برای شرکت در این دوره باید با برنامه نویسی پایتون آشنایی داشت.

دوره‌های مرتبط
Machine Learning
علوم داده و هوش مصنوعی

دوره ماشین لرنینگ با پایتون (Machine Learning)

شروع : ۱۴۰۴/۱۰/۰۶
روزهای برگزاری : شنبه ها
۴۰ ساعت
0 دانشجو

۷.۲۰۰.۰۰۰ تومان

Data Engineering
علوم داده و هوش مصنوعی

دوره تربیت مهندس داده (Data Engineering)

شروع : اعلام میگردد
روزهای برگزاری : اعلام میگردد
۶۴ ساعت
0 دانشجو

۸.۷۰۰.۰۰۰ تومان

Python
علوم داده و هوش مصنوعی

دوره آنلاین برنامه نویسی پایتون

شروع : ۱۴۰۴/۱۱/۲۹
روزهای برگزاری : شنبه و چهارشنبه
۴۰ ساعت
0 دانشجو

۵.۷۰۰.۰۰۰ تومان