پیش از آنکه به علم داده کاوی پردازیم باید بدانیم اساساً داده چیست؟ و فرق داده با اطلاعات چیست؟
داده ) (data محتوای خام و تفسیر نشده است، داده در واقع کوچکترین و سادهترین واحد محتواست. تمامی کاراکترها، آمار، ارقام و حقایقی که توسط سیستمها و یا محققان جمع آوری شده و توضیح و تفسیر اضافهای بر آنها افزوده نشده باشد داده به حساب میآیند. در حالیکه نتیجه پردازش روی داده ها توسط پردازشگرها را اطلاعات(information) گویند.
از زمانی که دانش داده کاوی یا تحلیل داده پا به میدان گذاشت ارزش داده در دنیای امروز متحول شد.(( داده کاوی علم استخراج الگوها اطلاعات و تحلیل مجموعه داده های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری جمع شده است.)) داده کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه دادههای خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است.
به طور کلی برای دادهکاوی میتوان چهار گام در نظر گرفت گام اول تعیین اهداف است. گام دوم جمع آوری و آماده سازی دادههاست. در گام سوم باید با استخراج الگوهای موجود در این داده ها، به ارائه مدلی برای حل مساله پرداخت. نهایتا در گام چهارم میتوان با جمع بندی و ارزیابی نتایج حاصله، اقدامات مناسبی طراحی و اجرایی کرد.
به بیان دیگر داده کاوی، استخراج اطلاعات مفهومی، ناشناخته و به صورت بالقوه مفید از پایگاه داده میباشد.
[پنجشنبه 1403-08-17] [ 11:06:00 ب.ظ ]
|