چكيده :
دادهكاويعبارتاستازفرآيندخودكارکشفدانشواطلاعاتازپايگاههايداده اي.
اينفرآيندتكنيكهاييازهوشمصنوعيرابررويمقاديرزياديدادهاعمالمي كندتاروندها , الگوهاو روابطمخفيراكشفكند. ابزار هايدادهكاويبرايكشفدانشيااطلاعاتازدادههابهكاربراتكا نمي كنند،بلكهفرآيندپيشگوييواقعيتهاراخودكارمي سازند. اينتكنولوژينوظهور،اخيرًابهطورفزايندهايدرتحليلهامورداستفادهقرارميگيرد.
كلمات كليدي :
Data mining, Predictive data mining, Exploration data analysis,
Data warehousing, Olap, neural network, Deployment , machine
Learning, Meta-learning, Bagging , Boosting , clustering , Eda
Drill-down analysis, Stacket generalization , classification
مقدمه :
امروزه با حجم عظيمي از داده ها روبرو هستيم. براي استفاده از آنها به ابزارهاي كشف دانش نياز داريم. داده كاوي به عنوان يك توانايي پيشرفته در تحليل داده و كشف دانش مورد استفاده قرار مي گيرد. داده كاوي در علوم (ستاره شناسي،...)در تجارت (تبليغات، مديريت ارتباط با مشتري،...) در وب (موتورهاي جستجو،...) در مسايل دولتي (فعاليتهاي ضد تروريستي،...) كاربرد دارد. عبارت داده كاوي شباهت به استخراج زغال سنگ و طلا دارد. داده كاوي نيز اطلاعات را كه در انبارهاي داده مدفون شده است، استخراج مي كند.
در واقع هـــــدف از داده كاوي ايجاد مدل هايي براي تصميم گيري است. اين مدلها رفتارهاي آينده را براساس تحليلهاي گذشته پيش بيني مي كنند. به كاربردن داده كاوي به عنوان اهرمي براي آماده سازي داده ها و تكميل قابليتهاي انباره داده ، بهترين موقعيت را براي به دست آوردن برتريهاي رقابتي ايجاد مي كند.
داده كاوي (Data mining) :
داده كاوي (Data mining) يك فرايند تحليلي است كه جهت كاوش داده ها (معمولاً حجم بالاي داده ها و يا داده هاي تجاري و مربوط به بازار) و جستجوي الگوهاي پايدار يا روابط سيستماتيك مابين متغيرها بكار ميرود وسپس با اعمال الكو هاي شناسايي شده به زير مجمو عه هاي جديد صحت داده هاي بدست آمده بررسي ميگردد. هدف نهايي داده كاوي پيشگويي است.
سازمانهامعموًلاروزانهمقدارزياديدادهرادرانجامعملياتتجاريخودتوليدوجمعآوريميكنند.
امروزهبراياينپايگاههايدادهشركتيعجيبنيستكهمقداردادههايآندرحدترابايتباشد.بااينحالعليرغمثروتاطلاعاتيعظيمذخيرهشدهحدسزدهميشودكهفقط٪٧كلداده هاييكهجمعآوريمي شودمورداستفادهقرارميگيرد. بدينترتيبمقدارقابلتوجهيدادهكهبدونشكحاوياطلاعات ارزشمندسازمانياستتاحدزياديدستنخوردهباقيميماند. درمحيطتجاريعصراطلاعات،كههرروز رقابتي ترمي شود مي توانبااستخراجاطلاعاتازداده هاياستفادهنشدهبهتصميمگيري هاياستراتژيكدست يافت. درطولتاريختحليلدادههاازطريقرگرسيونوديگرتكنيكهايآماريانجامشدهاست. براي استفادهازاينتكنيكها،لازماستكهتحليلگرمدليخلقكندوفرآيندگردآوريدانشراسازماندهد.
اماامروزهاينروشهابهتنهاييكافينيستندوبايدازروشهايخودكاراستفادهكرد.
دادهكاويعبارتاستازفرآيندخودكارکشفدانشواطلاعاتازپايگاههايداده اي.
اينفرآيندتكنيكهاييازهوشمصنوعيرابررويمقاديرزياديدادهاعمالمي كندتاروندها،الگوهاو روابطمخفيراكشفكند. ابزار هايدادهكاويبرايكشفدانشيااطلاعاتازدادههابهكاربراتكا نمي كنند،بلكهفرآيندپيشگوييواقعيتهاراخودكارمي سازند. اينتكنولوژينوظهور،اخيرًابهطور
فرايندهايدرتحليلهامورداستفادهقرارميگيرد
داده كاوي پيشگويانه رايج ترين نوع داده كاوي است و با برنامه هاي كاربردي تجاري در ارتباط مستقيم است . فرايند داده كاوي از سه مرحله تشكيل شده است.
ا- كاوش اوليه (initial exploration )
2-ساختن مدل يا شناسايي الگو بوسيلة سنجيدن اعتبار وصحت داده ها
3-گسترش
1- مرحله كاوش(Exploration) :
اين مرحله معمولاً با آماده سازي داده ها آغاز مي شود كه تشكيل شده است از پاكسازي داده ها (cleaning data) ،تغير شكل داده ها، انتخاب زير مجموعه اي از ركورد ها (در زماني كه مجموعه اي از داده ها با حجم بالايي از فيلد ها موجود است) و انجام دادن برخي عمليات اوليه جهت قرار دادن متغير ها در يك بازة قابل مديريت،كه بستگي به روش آماري اي كه مورد نظراست دارد و پس ازآن به طبيعت مسئله تحت بررسي مربوط مي شود.
مرحلهُ اول فرآيند داده كاوي مي تواند در هر جايي از گسترة ، انتحاب يك روش مستقيم پيشگويي تا يك روش تجزيه و تحليل با جزئيات وزحمت بالا قرار داشته باشد .(جهت كسب اطلاعات وسيع تر به قسمت EDA مراجعه كنيد).
اين مدل جهت شناسايي متغيير هايي كه بيشتر از همه با موضوع مرتبط هستند و جهت مشخص كردن پيچيدگي و طبيعت كلي مسئله در مراحل بعدي مورد استفاده قرار ميگيرد .
مرحله 2- ساختن مدل و معتبر سازي (model building and validation):
اين مرحله در گير در نظر گرفتن مدل هاي مختلف،و انتخاب بهترين آنها بر اساس كارايي در پيشگويي ، مي باشد.(براي مثال تعييرات سوُالات را تشريح كندونتايج ثابتي در مقابل نمونه ها توليد كند.) شايد اين به نظر عمليات ساده اي بيايد. ولي در واقع بعضي از مواقع در گير يكسري فرآيند هاي پيچيده مي شود.روشهاي مختلفي جهت رسيدن به اين هدف وجود دارد كه آنها را روشهاي ارزيابي رقابتي مدل ها (competitive evaluation of models ) مي نامند كه مدلهاي مختلفي را بر روي يك دادهُ ثابت اعمال مي كند و سپس كارايي آنها بررسي مي شود تا بهترين آنها انتخاب گردد. اين روش ها كه در خيلي از مواقع به عنوان هستهُ داده كاوي پيشگويانه تلقي مي گردند و شامل طبقه بندي كردن(bagging،)، ترقي دادن (boosting ) ،انباشتن (stacking )و يادگيري غير نمادين(meta learning )ميباشند.
مرحلة3- مرحلهُ گسترش Deployment):( :
در آخرين مرحله مدلي كه به عنواي بهترين مدل در مرحلة قبلي انتخاب شده بود بر روي داده هاي جديد به منظور توليد پيشگويي يا بر آورد خروجي مورد انتظار اعمال ميگردد.
شهرت داده كاوي به طور روز افزوني به عنوان يك ا بزار مديريت تجاري داده ها شهرت يافته است و انتظار مي رود بتواند ساختار هاي دانشي را نمايان سازد كه در شرايط عدم قطعيت تصميمات گرفته شده را هدايت كند.
روشهاي تحليلي جديد خصوصاً جهت نشان دادن مسائل مرتبط با داده كاوي تجاري ،اخيراًبسيار مورد توجه بوده اند (به عنوان مثال درخت هاي رده بندي) ، با اين حال داده كاوي هنوز مبتني بر قواعد مفهومي روشهاي دستيابي قديمي نظير آناليز اكتشافي داده ها (EDA) و مدلساري ميباشد. وقسمت هايي از دست آورد هاي عمومي و بعضي از تكنيك هاي خاص خود را با آنها به اشتراك مي گذارد.
بهرحال تفاوت زيادي در نفطه نظرات و اهداف داده كاوي و روش آناليز اكتشافي داده ها (EDA) وجود دارد . داده كاوي بيشتر متمايل به كاربردها است تا طبيعت اصلي پديدة مورد بررسي.به عبارت ديگر داده كاوي كمتر به شناسايي روابط خاص موجود بين متغيرها مي پردازد.براي مثال آشكار كردن توابع و انواع داده اي خاصي كه بر روابط تعاملي و چند متغيري كه بين متغيرها وجود دارد هدف اصلي داده كاوي نمي باشد. در عوض توجه خود را به ايجاد روشي كه بتواند پيشگويي قابل استفاده اي توليد كند معطوف مي سازد. و به همين دليل است كه داده كاوي از بين دست آوردهاي جعبه سياه(black box ) در كاوش داده ها يا اكتشاف دانش مقبوليت بيشتري دارد. و نه تنها از روش هاي سنتي آناليز اكتشافي داده ها (exploratory data analysis (استفاده مي كند بلكه از روشهايي مانند شبكه هاي عصبي ( Neural network ) كه مي تواند پيشگويي هاي معتبري توليد كند ولي قادر به شناسايي طبيعت خاص روابط داخلي بين متغيرهايي كه پيشگويي ها بر اساس آنها صورت گرفته است نميباشد سود مي جويد.
مفاهيم تعيين كننده در داده كاوي:
1-هم پيوندي (Bagging) :
همپيونديقابليتيبراييافتنروابطناشناختهموجوددراطلاعاتاست. اينروابطموارديازقبيلاينكه
حضورمجموعهايازمقولاتاشارهبهايندارندكهمجموعهمقولاتديگرينيزاحتمالاوجوددارندرا
شاملميشود. اينقابليتاساسًاروشياستبراياينكهكشفكنيمچهمقولاتيبههممي خورند. از آنباعنوانتحليلسبدبازارياگروهبنديخويشاوندي نيزيادميشود.
برايمثال،گزارشهايهمپيونديچنينشكليدارند:"٪٨٠مشتريانيكه كالاي A راخريدارينمودهاند، كالاي Bرانيزخريدهاند." درصدخاصوقوعوقايع) مثلا٪٨٠ايننمونه ( رافاكتوراطمينانهمپيونديB وA مي نامند. همچنينممكناستهمپيونديهايچندگانهوجودداشتهباشد: "٪٧٥مشتريانيكهكالاي D راخريدارينمودهاند،كالاي Cرانيزخريدهاند."
كاربردهايهمپيونديعبارتندازبرنامهريزيموجودي،برنامهريزيتبليغاتيبرايفروشومراسلات بازاريابيمستقيم.
مفهوم Bagging (راُي دادن به رده بندي و بدست آوردن متوسط مسائلي كه داراي متغير هايي با مقادير متوسط وابسته ميباشند)و در گسترة داده كاوي اعمال مي گردد تا طبقه بندي هاي پيشگويانه را از مدل هاي چندگانه يا از يك نوع مدل ، براي درك اطلاعات تركيب كند . و همچنين جهت نشان دادن بي ثبا تي ماندگار نتايج در زماني كه مدل هاي پيچيده به مجموعه هاي كوچك داده ها اعمال مي شوند به كار مي رود. فرض كنيد كه عمل داده كاوي شما مي خواهد يك مدل جهت طبقه بندي پيشگويا نه بسازد و مجموعة داده هاي آن نسبتاً كوچك است . شما مي توانيد به صورت متوالي مجموعه داده ها را به نمونه هاي كوجكتر تقسيم كنيد و اعمال كنيد همانند رده بندي درختي تا به نمونه مورد نظر برسيد.در عمل درخت هاي متفاوتي براي نمونه هاي منقاوت بسط داده ميشوند.يكي از روش هاي استنتاج يك پيشگويي استفاده از قالب درختي در نمونه هاي مختلف است و پس از آن برخي نظريات بر روي آن اعمال مي گردد.
طبقه بندي نهايي طبقه بندي است كه عموماً توسط درخت هاي متفاوت پيشگويي مي شود. توجه داشته باشيد كه برخي از تركيب هاي وزن دار از پيشگويي ها نيز محتمل است و عموماً مورد استفاده قرار مي گيرد. يك الگوريتم پيشرفته جهت ايجاد وزن براي پيشگويي هاي وزن دار يا voting رويه هاي Boosting هستند.
مبلغ قابل پرداخت 3,000 تومان
برچسب های مهم
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه ... ...
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه دوست داشتی ... ...
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه ... ...
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه ... ...
برنامه اکسل متره و برآورد،تهیه صورت وضعیت راه،راه آهن و باند فرودگاه سال1403: -تهیه اتوماتیک و خودکار متره و برآورد،صورت وضعیت در کمترین زمان فقط با وارد کردن شماره آیتم -تهیه ریز متره -تهیه خلاصه متره -تهیه خلاصه فصول -تهیه برگه های مالی و مالی کل -اعمال اتوماتیک ... ...
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه ... ...
دانلود فایلهای بسته آمادهچاپ و نصب تابلو اعلانات مسجدنما همیشه دنبال این بودی یه جایی باشه تا راحت بتونی محتوای مطمئن با طراحی خوب را پیدا کنی؟ همیشه دنبال این بودی یکی کارهای محتوایی را ناظر به مسائل روز انجام بده و دغدغه تأمین محتوا را نداشته باشی؟ همیشه ... ...
عنوان مبحث: سوالات نهاد مبحث دانش خانواده و جمعیت (بخش اول) همراه با پاسخ شامل: 9 جلسه تعداد صفحات: 11 سوالات و جواب ها بصورت تایپ شده با فونت استاندارد می باشد که قابلیت سرچ در زمان آزمون را دارد سوالات ترم جدید همراه با پاسخ برای نمره 19 به بالا فرمت: pdf ... ...
کتاب صوتی بسیار مفید #روانشناسی_تصویر_ذهنی اثر: #ماکسول_مالتز ترجمه: مهدی قراچه داغی کیفیت اجرا: خیلی خوب ... ...
کتاب صوتی کتاب_واپسین_گفتار ( یا عالم اوراسینا) ازاسپالدینگ_نویسنده_کتاب_معبدسکوت ... ...
پاورپوینت کامل فصل سوم ریاضی چهارم ضرب و تقسیم(همراه با حل تمارین) این محصول قابل ویرایش با فرمت pptx در 68 اسلاید آماده و قابل ارایه می باشد. در صورت شخصی سازی میتونین به واتس آپ شماره ای که زیر درج شده پیام بدین واستون اوکی میکنیم مزایای استفاده از ... ...
سکس آنان كه با سكس مخالف هستند زودتر به انزال میرسند، زیرا ذهن منقبض آنان عجله دارد تا از شر آن خلاص شود. پژوهشهای معاصر چیزهای بسیار تعجبآوری را میگویند، حقایق شگفتآور. برای نخستین بار، مسترز و جانسون Masters and Johnson در مورد آمیزش عمیق جنسی مطالعه علمی انجام ... ...
تعداد صفحات: 11 نوع فایل: WORD + فایل هدیه: نمونه مصاحبه تشخیصی افسردگی و اعتیاد (8صفحه) فهرست مطالب: شرح حال (مشخصات، علت ارجاع، شکایت عمده، مشکلات موجود و ...) معاینه وضعیت روانی تشخیص مصاحبه بخشی از متن فایل: م: خوابت چطوره؟ ب: زیاد خوب نیست، اگار ... ...
عنوان پاورپوینت: دانلود پاورپوینت کیست هموراژیک تخمدان و درمان آن فرمت: پاورپوینت قابل ویرایشتعداد اسلاید: 27پاورپوینت آماده ارائهفهرست مطالب:مقدمهکیست تخمدان هموراژیک چیستانواع کیست هموراژیککیستهای فولیکولارکیستهای لوتئالعلائم کیست هموراژیک علت کیست هموراژیک عوارض کیست ... ...
دانلود پاورپوینت در مورد [سلول های بنیادی] - شامل 4 فایل مختلف - قابل ویرایش و ارائه - ppt شامل 4 فایل پاورپوینت سلول های بنیادین به زبان ساده: 1. 33 اسلاید: تاریخچه سلول های بنیادی / تعریف سلول های بنیادی / ویژگی های سلول های بنیادی / گونه های سلول بنیادی / انواع سلول ... ...
عنوان پاورپوینت: پاورپوینت بازی زندگی است درس 17 تفکر و سواد رسانه ای پایه دهم فرمت: پاورپوینت pptتعداد اسلاید: 26 پوشش کامل درس همراه با پاسخ فعالیت ها پاورپوینت قابل ویرایش با محیط حرفه ای منطبق با آخرین تغییرات مطالب و رئوس کتاب درسی فونت ... ...
دانلود حل المسائل [طراحی و تحلیل آزمایش]: ویرایش هشتم - داگلاس مونتگومری ( 8 ) - زبان انگلیسی - pdf Solutions Manual for Design and Analysis of Experiments – 8th حل تمرین های کتاب طراحی و تحلیل آزمایش ویرایش 8 فصل های 2 تا 15 814 صفحه pdf ... ...
نوع فایل: power point فرمت فایل: ppt and pptx قابل ویرایش 12 اسلاید قسمتی از متن پاورپوینت: بخش 18 تعیین نوع کسب و کار کسب و کاربه تمامی فعالیت های تولیدی، خدماتی، خرید و فروش کالا ها با هدف سودآوری، کسب و کار گویند. فروش و انتقال کالا ها و ... ...
عنوان پاورپوینت درسی : دانلود پاورپوینت ادبیات بومی 2 درس آزاد فارسی پایه دوازدهم فرمت: پاورپوینت ppt تعداد اسلاید: 27 شامل: متن درس و شعر، معنای روان متن درس و شعر، معنای واژگان مهم، آرایه ها، کارگاه متن پژوهی همراه با جواب، قلمرو زبانی، قلمرو ... ...
نوع فایل: power point فرمت فایل: pptx قابل ویرایش تعداد اسلایدها: 43 اسلاید تصویری از پاورپوینت: این پاورپوینت آموزشی، جذاب، قابل ویرایش، کاملا منطبق با کتب درسی و با تعداد اسلاید ذکر شده تهیه و تنظیم شده است. با بکارگیری نمودار ها ، تصاویر جالب و جذاب و دسته ... ...
مجموعه "اسکیس معماری از بناهای ایرانی" این مجموعه شامل 225 تصویر اسکیس و کروکی معماری از بناهای مختلف ایرانی می باشد. ... ...
عنوان پاورپوینت: پاورپوینت سوره یس، سوره صافات و تفسیر نمونه درس 10 قرآن پایه هشتمفرمت: پاورپوینت قابل ویرایش تعداد اسلاید: 26 پوشش کامل درس (جلسه اول و دوم) به همراه صوت آیات پاورپوینت قابل ویرایش با محیط حرفه ای منطبق با آخرین ... ...
جزوه معتبر درس الاستیسیته آماده برای دانلود مشخصات دانشگاه: صنعتی شریف استاد: دکتر محسن اصغری تعداد صفحات: 90 فرمت: پی دی اف PDF کیفیت: خوب حجم: 20.6 مگابایت نوع جزوه (تایپی یا دست نویس): دست نویس ... ...
دانلود پاورپوینت فصل هفتم ریاضی پنجم آمار و احتمال همراه با پاسخ فعالیت ها و تمارین این محصول قابل ویرایش با فرمت pptx در 44 اسلاید آماده و قابل ارایه می باشد. در صورت شخصی سازی میتونین به واتس آپ شماره ای که زیر درج شده پیام بدین واستون اوکی میکنیم مزایای استفاده از ... ...
این فایل شامل پاسخ برخی تستهای فصل یک راهنمای معلم کتاب شیمی دوازدهم میباشد . شماره تست هایی که پاسخ داده شده است 12-13-14-15-17-18-19-22-27-28-31-32-40-33-36-37-41 کتاب راهنمای معلم شیمی دوازدهم یکی از منابع آزمون دبیری شیمی آموزش و پرورش است این فایل به صورت دست نویس ... ...
نوع فایل: power point فرمت فایل: ppt and pptx قابل ویرایش 59 اسلاید قسمتی از متن پاورپوینت: بخش دوم پودمان بازی های رایانه ای برخی از شایستگی هایی که در این پودمان به دست می آورید: کار گروهی,مسئولیت پذیری مدیریت منابع,فناوری اطلاعات و ... ...
عنوان فایل :کتاب گیاه شناسی یک با فرمت پاورپوینت نوع فایل: پاورپوینت تعدادصفحات : 250 ص برای دانلود روی لینک زیر کلیک نمایید دانلود کتاب گیاه شناسی ۱ با فرمت پاورپوینت ppt شرح مختصر: امروزه سلول به عنوان واحد ساختمانی همه موجودات زنده معرفی میشود و درباره هر یك از ...
حرکت تاریخی کرد به خراسان.pdf ... ...
Algorithms Illuminated (Part 1): The Basics Algorithms are the heart and soul of computer science. Their applications range from network routing and computational genomics to public-key cryptography and machine learning. Studying algorithms can make you a better ... ...
اگر به یک وب سایت یا فروشگاه رایگان با فضای نامحدود و امکانات فراوان نیاز دارید بی درنگ دکمه زیر را کلیک نمایید.
ایجاد وب سایت یا