42 اسلاید
■بسیاری از برنامه های کاربردی نوع داده جدیدی به نام جریان داده را تولید و تحلیل می کنند که در آن داده ها به صورت پویا به یک بستر ( یا پنجره ) وارد و یا از آن خارج می شوند . ■خواص جریان داده : ■حجم زیاد و گاه نامحدود ■تغییرپویا ■جریان به درون و خارج با یک ترتیب مشخص ■پیمایش یکبار یا تعدا د محدود ■نیازمند زمان پاسخ سریع ( اغلب بلادرنگ ) ■ممکن است دارای چندین منبع باشند .■در جریان داده تعدادی یا همه داده های ورودی که باید روی آنها عملیات انجام شود روی دیسک یا حافظه اصلی قرار ندارند و بیشتر به صورت جریان داده پیوسته می رسند . ■جریان داده ها از داده های ذخیره شده در موارد زیر متفاوت اند :■عناصر داده ها به صورت بر خط می رسند .■سیستم هیچ گونه کنترلی روی ترتیب عناصر دادهای ( روی عناصر جریان یا جریانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .■جریانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .■یک عنصر از جریان داده پس از پردازش یا نادیده در نظر گرفته می شود یا آرشیو می شود .■دادهکاوی استخراج اطلاعات مفید و دانش از حجم زیاد داده ها است . ■تکنیک هایی دادهکاوی :■تحلیل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هایی است که اغلب با هم در یک مجموعه داده اتفاق می افتند . ■کلاسهبندی : فرایند یافتن مجموعه مدلهایی است که کلاس های داده را توصیف و مشخص میکنند تا بدین وسیله بتوان کلاس اشیایی را که نامشخص است مشخص کرد .■تحلیل خوشه ها : اشیا بر اساس قاعده " زیاد کردن شباهت بین عناصر کلاس و کم کردن شباهت بین کلاس ها " ، اشیا را به خوشه هایی تقسیم می کند . اشیا داده ای موجود در یک خوشه بیشترین شباهت را با هم دارند و با اشیا سایر خوشه ها بسیار متفاوت هستند .