به دلیل اهمیت بالای داده کاوی و کاربردهای متنوع آن در انجام امور مختلف، قصد داریم در ادامه این مطلب به انواع تکنیک های داده کاوی بپردازیم و کاربرد آنها را در حل مسائل مختلف بررسی کنیم.
فرایند داده کاوی تاریخچه طولانی دارد.در قدیم ، به این فرآیند ، کشف دانش میگفتند.اما به شکل کلی ، دیتا ماینینگ ( داده کاوی ) در دهه ی 1990 میلادی ساخته شد.اولین بار در سال 1995 ، اصطلاح داده کاوی توسط ...
عملکرد داده کاوی چگونه است؟ در مورد کاربرد داده کاوی گفتیم، داده کاوی نوعی روش حل مساله بر اساس دادههای موجود است. در ابتدای این فرایند، مشکلات کسب و کار شما پیدا میشود.
داده کاوی یکی از روشهای حل مساله است که تحلیل مورد نیاز را بر روی حجم زیادی از دادهها انجام میدهد و با استخراج تعدادی الگوی تکرارشونده، برای چالشهای موجود راهحل مناسب ارائه میکند.
برای حل مشکل دوم یعنی عدم اطمینان کامل به اطلاعات خروجی باید ورودی خود را کنترل کنیم، در صورتی که در دادههای ورودی اطلاعات کامل نباشند، یعنی در دادهها مشخصههایی وجود داشته باشد که مقدار ...
در این نوشتار به موضوع مدیریت داده گمشده در داده کاوی به زبان پایتون پرداختیم. از آنجایی که یکی از مراحل اصلی در داده کاوی، عمل پاکسازی دادهها است، بررسی داده گمشده بسیار مهم جلوه میکند.
روشهای کامپیوتری قدرت بیسابقهای را به دادهکاوی بخشیدهاند، اما در عین حال، شانس آنکه برخی روشها به صورت کورکورانه و بدون توجه به کاربرد آنها در مسائل مورد استفاده قرار بگیرند نیز افزایش دادهاند. بینش تحلیلی با هیچ نرمافزار کاربردی عرضه …
در این مبحث ما با تکنیک های داده کاوی آشنا می شویم. با پیشرفت فناوری اطلاعات، تعداد زیادی پایگاه داده در زمینه های مختلف ایجاد شده است. در نتیجه، نیاز به ذخیره و تغییر در داده های مهم، که بعداً می توان از آن ها برای تصمیم ...
دادهکاوی (به انگلیسی: Data Mining) به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ گفته میشود.بسیاری از مردم داده کاوی را مترادف واژههای رایج کشف دانش در ...
الگوریتم در دادهکاوی به معنای یک مجموعه مرتب و تعیین شده از مراحل و مراحل محاسباتی است که برای حل یک مسئله یا انجام یک وظیفه خاص در حوزه دادهکاوی به کار میرود. ... هدف اصلی Isomap، حفظ فواصل ...
در این مطلب از چهار سرنام برای هر مجموعه داده استفاده شده است که هر یک در ادامه شرح داده شدهاند. (ک) کلاسیک: موارد دارای این نشان برخی از محبوبترین و یا قدیمیترین مجموعه دادههای حوزه هوش ...
در این مقاله تمام نکات مهم و اساسی در مورد داده کاوی را آموزش خواهیم داد . داده کاوی با هدف کشف الگوهای موجود در داده های جمع آوری شده ، به بررسی پایگاه های بزرگ داده می پردازد .
دو برنامه راهبردی زیر برای حل مشکل دادههای پِرت در دسترس متخصصان داده کاوی قرار دارد. ... برای مثال، برای انتساب هوشمند مقادیر گمشده در دادهها، تنها باید پکیج scikit learn's impute library را نصب و از ...
دادهکاوی دو هدف اصلی پیش بینی و توصیف دارد. پیشبینی شامل استفاده از برخی متغیرها در مجموعه دادهها به منظور پیشبینی مقادیر ناشناخته سایر متغیرهای مرتبط است (مانند طبقهبندی، رگرسیون، و تشخیص ناهنجاری).
کاربردهای دادهکاوی کجاست؟ تکنیکهای دادهکاوی بهطور گستردهای در میان تیمهای تجاری و تجزیهوتحلیل دادهها استفاده میشود و به آنها کمک میکند دانش خود را برای سازمان و صنعتشان استخراج کنند.
علم داده، علم استفاده از روشهای کمی آمار و ریاضیات در بستر تکنولوژی است که به منظور توسعه الگوریتمهای طراحی شده، کشف الگوها، پیشبینی نتایج و یافتن راهحلهای بهینه برای مسائل پیچیده کاربرد دارد (۱).
به طور کلی هر چه ابعاد یا همان تعداد ویژگی های مسأله مورد کاوش بالاتر رود، باعث خواهد شد رکوردها در فضای جستجو پراکنده تر شوند. یکی از روش ها روش انتخاب زیر مجموعه ای از ویژگیها بود. البته در آن روش ویژگی هایی که ارزش ...
اجرای نرمالسازی دادهها، باعث افزایش پایداری و همگرایی سریعتر در طول آموزشهای «گرادیان-محور» (Gradient-based) میشود. همچنین نرمالسازی تا حد قابل قبولی از رخداد مشکلاتی مانند «محوشدگی گرادیان» (Vanishing Gradient) یا «انفجار ...
اخیراً، طبقهبندی داده های نامتوازن به یکی از چالشهای مهم در زمینهی یادگیری ماشین و دادهکاوی تبدیل شده است. دادهی نامتوازن به دادههایی گفته میشود که در آنها، نمونهها به طور غیریکنواخت و نامتوازن بین کلاس ...
به عنوان مثال، اگر دادههای 1، 3، 5 و 7 را به عنوان تعداد قطعات فروخته شده در چهار روز متوالی در نظر بگیریم، اطلاعات میتواند نشان دهد که فروش در حال افزایش است.
در عصر حاضر که سرشار از دادههای گوناگون است، درک چگونگی تحلیل و استخراجِ معنای صحیح، از بینشهای دیجیتالی کسب و کارها، یکی از عوامل اصلی موفقیت، محسوب میشود. «تحلیلِ داده» (Data Analysis)، فرایندی است شامل سازماندهی ...
تحلیل مولفه اساسی (PCA) یا (Principal Component Analysis) یک «روش تبدیل خطی» (Linear Transformation Technique) ساده و در عین حال محبوب و کارآمد محسوب میشود.از این روش در کاربردهایی مانند پیشبینی بازار بورس، تحلیل دادههای بیان ژن و بسیاری از دیگر ...
داده کاوی فرآیند تحلیل حجم عظیمی از داده و پایگاه داده است تا بتوان با استخراج (کاویدن) اطلاعات موجود در آنها، مسائل تعریف شده را حل کرد. این مسائل میتوانند پیشبینی مقادیری خاص، انجام وظایف تعریف شده یا پیدا کردن ...
مسئله «مقادیر گمشده» (Missing Values) در «علم داده» (Data Science) و بخصوص «دادهکاوی» (Data Mining)، زمانی رخ میدهد که یک یا چند مشاهده دارای مقدارهایی ثبت نشده یا ناموجود در ستونهای «چارچوب اطلاعاتی» (Data Frame) هستند. در چنین حالت می ...
در همین راستا کتاب و حل المسائل داده کاوی هان ویرایش 4 قابل دانلود است. داده کاوی فرآیند جستجو و تجزیه و تحلیل دسته بزرگی از داده های خام به منظور شناسایی الگوها و استخراج اطلاعات مفید است.