پاورپوینت داده‌کاوی جریان‌داده‌ها با درخت‌های تصمیم‌گیری

پاورپوینت داده‌کاوی جریان‌داده‌ها با درخت‌های تصمیم‌گیری

18 اسلاید

■ فرایندی دو مرحله ای است :■ساخت مدل :■تحلیل یک مجموعه آموزشی که مجموعه‌ای از تاپل‌های پایگاه است و مشخص کردن برچسب کلاس‌های مربوط به این تاپل‌ها .■ یک تاپل X با یک بردار صفت X=(x1,x2,…,xn) نمایش داده می‌شود . فرض می شود که هر تاپل به یک کلاس از پیش تعریف شده متعلق است .■هرکلاس با یک صفت که به آن صفت برچسب کلاس می‌گوییم مشخص می‌شود .■ مجموعه آموزشی به صورت تصادفی از پایگاه انتخاب می شود . ■به این مرحله ، مرحله یادگیری نیز می گویند .■استفاده از مدل :■از طریق یک تابع y=f(X) برچسب کلاس هر تاپل X از پایگاه را پیش بینی می شود . ■این تابع به صورت قواعد کلاسه‌بندی ، درخت‌های تصمیم گیری یا فرمول‌های ریاضی است . ■یکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .■مدل حاصل از این روش به صورت درختهای تصمیم گیری است :■هر گره در این درخت نشان دهنده یک آزمون بر روی یک صفت است .■هر شاخه خارج شونده از یک گره نشان دهنده خروجی های ممکن آزمون است .■هر برگ نشان دهنده یک برچسب کلاس است .■نحوه استفاده از درخت تصمیم گیری :■اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشیم صفات این تاپل در درخت مورد آزمون قرار می گیرند و یک مسیر از ریشه به سمت یک برگ که برچسب یک کلاس را دارد ایجاد می شود .■الگوریتم پایه ■درخت به صورت بالا-پایین بازگشتی ساخته می شود .■در آغاز تمام مجموعه آموزشی در ریشه قرار دارند .■فرض می کنیم صفات مقادیر گسسته دارند .■صفات به صورت بازگشتی بر حسب صفات انتخاب شده بخش بندی می شوند .■صفات آزمون بر اساس یک روال هیوریستیک مانند بهره اطلاعاتی ، شاخص جینی یا نسبت بهره انتخاب می شوند .■شرایط توقف الگوریتم ■تمام نمونه های مربوط به یک نود متعلق به یک کلاس باشند .■صفتی برای بخش بندی بیشتر باقی نمانده باشد .■نمونه ای باقی نمانده باشد .

خرید و دانلود پاورپوینت داده‌کاوی جریان‌داده‌ها با درخت‌های تصمیم‌گیری


نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.