چکیده
در این مطالعه سعی بر آن است که از روش طبقه بندی درختی در داده های حاصل از حوادث مربوط به پالایشگاه با اندازه متوسط استفاده شود تا به کمک آن بتوان روابط بین متغیرهای مهم در قوانین
تصمیم گیری را کشف نمود. نتایج حاصل شده از طریق روش CART(طبقه بندی و درخت های رگرسیونی) از صحت خوبی برخوردار بوده و نشان داده می شود که نمودارهای درختی ایجاد شده یکی از تکنیک های اولیه در ارزیابی پارامترهای ارگونومیکی، مدیریتی و عملیاتی موثر در ریسک وقوع حادثه می باشد. تحلیل صدمات شغلی ارائه شده در این مقاله به صورت پویا در نظر گرفته شده و می توان مکررا آنرا انجام داد. روش CART استفاده شده در این مقاله مجموعه اهداف و متغیرهای پیش بینی کننده گسترده ای را شامل شده است. همچنین یک ارتباط جدیدی بین علت حوادث و اثرآن در حوزه ایمنی شغلی یافت شده است که در ادبیات موضوع عنوان نشده است. از طریق این ارتباط، عواملی که دارای ریسک آسیب هستند به صورت گروهی، دسته بندی شده اند. این گروه بندی می تواند یک پشتیبان برای تصمیم گیری های سازمان باشد.
چکیده:
در دو دهه قبل تواناییهای فنی بشر برای تولید و جمعآوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسبوکار، علوم، خدمات دولتی و پیشرفت در وسائل جمعآوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهوارهای، در این تغییرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژیهای جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. دادهکاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی دادهکاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی میکنند، که این دانش به صورت ضمنی در پایگاه دادههای عظیم، انبارهداده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
به لحاظ اینکه در چند سال اخیر مبحث دادهکاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرمافزارهای آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.
در این مقاله درفصل مروری بر دادهکاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه دادهها را ذکر کردیم که دادهکاوی یکی از مراحل آن است.
در فصل 2 یکی از شیوههای دادهکاوی که از سبد خرید گرفته شده است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دستهبندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح میدهیم و در آخر آن دو را با هم مقایسه میکنیم .
در فصل 3 مباحث وبکاوی و متنکاوی را که در بسیاری از مراجع جزء کاربردهای دادهکاوی به حساب میآید شرح داده خواهد شد.
تعداد صفحات 91 word
فهرست مطالب
فصل1: مقدمه ای بر داده کاوی
1-1 تعریف داده کاوی
2-1 تاریخچه داده کاوی
3-1 چه چیزی سبب پیدایش داده کاوی شده است؟
4-1 اجزای سیستم داده کاوی
5-1 جایگاه داده کاوی در میان علوم مختلف
6-1 قابلیتهای داده کاوی
7-1 چرا به داده کاوی نیاز داریم؟
8-1 داده کاوی چه کارهایی نمی تواند انجام دهد؟
9-1 کاربردهای داده کاوی
1-9-1 کاربردهای پیش بینی کننده
2-9-1 کاربردهای توصیف کننده
10-1 ابزارهای تجاری داده کاوی
11-1 داده کاوی و انبار داده ها
1-11-1 تعاریف انبار داده
2-11-1 چهار خصوصیت اصلی انبار داده
3-11-1 موارد تفاوت انبار داده و پایگاه داده
12-1 داده کاوی و OLAP
1-12-1 OLAP
2-12-1 انواع OLAP
13-1 مراحل فرایند کشف دانش از پایگاه داده ها
1-13-1 انبارش داده ها
2-13-1 انتخاب داده ها
3-13-1 پاکسازی- پیش پردازش- آماده سازی
4-13-1 تبدیل داده ها
5-13-1 کاوش در داده ها (Data Mining)
6-13-1 تفسیر نتیجه
فصل 2: قوانین ارتباطی
1-2 قوانین ارتباطی
2-2 اصول پایه
1-2-2 شرح مشکل جدی
2-2-2 پیمایش فضای جستجو
3-2-2 مشخص کردن درجه حمایت مجموعه اقلام
3-2 الگوریتمهای عمومی
1-3-2 دسته¬بندی
2-3-2 BFS و شمارش رویداد¬ها
3-3-2 BFS و دونیم¬سازی TID-list
4-3-2 DFS و شمارش رویداد
5-3-2 DFS و دو نیم¬سازی TID-list
4-2 الگوریتم Apriori
1-4-2 مفاهیم کلیدی
2-4-2 پیاده¬سازی الگوریتم Apriori
3-4-2 معایب Apriori و رفع آنها
5-2 الگوریتم رشد الگوی تکرارشونده
1-5-2 چرا رشد الگوی تکرار سریع است؟
6-2 مقایسه دو الگوریتم Apriori و FP-growth
7-2 تحلیل ارتباطات
فصل 3: وب کاوی و متن کاوی
1-3 وب کاوی
1-1-3 الگوریتمهای هیتس و لاگسام
2-1-3 کاوش الگوهای پیمایش مسیر
2-3 متن¬کاوی
1-2-3 کاربردهای متن کاوی
1-1-2-3 جستجو و بازیابی
2-1-2-3 گروه بندی و طبقه بندی
3-1-2-3 خلاصه سازی
4-1-2-3 روابط میان مفاهیم
5-1-2-3 یافتن و تحلیل گرایشات
6-1-2-3 برچسب زدن نحوی (pos)
7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک
2-2-3 فرایند متن کاوی
3-2-3 روشهای متن کاوی
مراجع
فایل ارائه داده کاوی در نرم افزار SQL SERVER درقالب 30 اسلاید قابل ویرایش+50 صفحه فایل ورد مستندات و داکیومنت
چکیده
پایگاه های دادۀ حوادث و سوانح شیمیایی از زمانی بنیان گذاشته شده است که حوادث فاجعه باری مثل حوادث فلیکس بورا، سوسو و بوپال اتفاق افتاد. فرآیند گزارش گیری و جمع آوری اطلاعات در حوادث فاجعه بار یک تمرین خوب در صنعت است زیرا این کار یک منبع اطلاعاتی ارزشمند برای جلوگیری از رخ دادن مجدد حوادث می باشد. از سال 1970 بهبودهای مداومی در فرآیند ایمنی در صنابع اتفاق افتاد که این امر تا حدودی به یادگیری و به اشتراک گذاری تجربیاتی است که از حوادث بدست آمده ، مربوط می شود.( جانز 1999)