لینک دانلود و خرید پایین توضیحات
فرمت فایل word و قابل ویرایش و پرینت
تعداد صفحات: 9
بنام خدا
ارزیابی و تحلیل داده های لایههای روزسازی
این مطالعات جهت ارزیابی و تعیین کیفیت و تکامل اطلاعات لایه های روسازی و داده های ضخامت لایه ها برای تهیه توضیحات و توصیه هایی برای گسترش اطلاعات موجود اخیر از داده های LTPP می باشد . تفاوت ضخامت لایه ها در بخشهای مختلفی کلاسه بندی شده است . بهمین ترتیب طراحی و ساخت لایه ها مقایسه شدهاند . بعلاوه راهنمایی جهت پیشرفت اطلاعات لایه ای LTPP می باشد .
دسترسی و تکامل داده ها :
در قسمت مطالعات ، اطلاعات در دسترس از ضخامت لایه های روسازی (LTPP) مورد آزمایش و ارزیابی کیفی جهت تکمیل سرویس A تا E قرار گرفته اند . ارزیابی داده های ضخامت لایه ها نشان دهندة آن است که سطوح TST-L05A و TST-Lo5B در برگیرندة جامعترین اطلاعات در مورد ساختار لایه ها و ضخامت آنها برای تجزیه و تحلیل سطوح مختلف است . تنها 16 ساختار روسازی از بخشهای معمول LTPP و 1 ساختار روسازی از بخش مکمل آن هیچ اطلاعاتی در مورد ساختار لایه ها چه TST-L05A و چه TST-L05B ندارند . تجزیه و تحلیل اطلاعات تکمیلی از سطح E ، 3457 ساختار لایه روسازی را در بخش آزمایشی مشخص کرده است . حدود 3240 تا از این ساختارها (یعنی 7/93 درصد) در بخش صفر TST-L05B ثبت شده اند در حالیکه 3229 ساختار آن (یعنی 4/93 درصد) در بخش TST-L05A ثبت شده اند .
استحکام و کیفیت لایه :
بدنبال تکمیل ارزیابی داده ها، ضخامت لایه های روسازی و دیگر داده های مرتبط از منابع مختلف اطلاعاتی ، جهت تعیین استحکام (ثبات) و توضیحات کاربردی لایه ها ، نوع جنس و اطلاعاتی از ضخامت میان منابع مختلف ، ارزیابی شدند . بعلاوه ، تنوع لایه ها از نظر مصالح ، استحکام و پارامترهای مختلف ، برای ارزیابی ضخامت لایه ها در دسترس می باشند . نتایج ارزیابی اطلاعات استحکامی نشان می دهد که توصیف کاربردی لایة روسازی بین سطوح مختلف LTPP برای 93 درصد از نمونه های ارزیابی شده در مطالعات صابت است و در مورد نوع جنس لایه ها مشخص شده است که 79 درصد بخشهای ارزیابی شده در مطالعات ثابت است ارزیابی جنس لایة در غیاب طرح یونیفاید مصالح و کد شناسایی آنها صورت پذیرفت ارزش نشان داده شده لایه ها بین سطوح مختلف برای 89 درصد از نمونه های روسازی در مطالعة آنها ثابت در نظر گرفته شده است . در مواردی که داده های منابع مختلف یکسان نبودند ، یک لایه برای مطالعات بیشتر برداشته می شد . عدم ثابت بودن داده ها در لایه ها مورد بررسی قرار گرفته و بصورت تحلیل داده ها و مرور عملیات و توصیه هایی برای حل داده های غیرمتعارف به مدیریت LTPP گزارش می شد .
بعلاوه سودمندی و نتیجه بخش بودن مصالح نیز مورد بررسی قرار گرفت . هدف از انجام و چک کردن خواص مصالح آن بود که مشخص شود آیا کد مصالح برای لایه با توصیفات کاربردی آن تطابق دارد یا خیر . زمانیکه بیشتر رکودها که دارای ارزش مصالحی هستند (642 درصد از بین 41111 حدود 56/1 درصد دارای کد مصالح نادرست هستند) و بعضی رکوردها که کد مصالح آنها از بین رفته است . رکودهای مشخص شده بصورت تحلیل داده ها و بررسی عملیات به FHWA (بخش بزرگراههای ایالتی) گزارش می شد . استدلالات داده ای لایه ها با استفاده از نشان دهندة تغییرات (شاخص) که بصورت SHRP-LTPP مشخص شده اند مورد بررسی قرار می گیرند و بعنوان یک نتیجه از ارزیابی لایه های روسازی به FHWA گزارش می شوند .
تغییرات ضخامت
تنوعی که در ضخامت لایه از تجزیه SPS در محلهای مختلف بدست آمده است با توجه به پراکندگی تئوری آماری مورد تجزیه و تحلیل قرار گرفته است . این تحلیل لایه ها با مصالح و کاربرد مختلف مختلف را شامل می شود که قسمتهای دسته اول (A-Class) و بیندر (binder) ، AC بیندر ، اساس متراکم ، اساس متراکم پرداخت شده ، اساس نفوذپذیر AC و اساس بتنی نرم و سطوح PCC را در بر می گیرد . برای تشخیص ویژگیهای لایه ها ، توصیفات آماری مانند وسایل نقلیه ، انحراف معیار (استاندارد) ، کجی (انحراف) و نقطه اوج آماری برای هر قسمت محاسبه شده است .و یک آزمایش ترکیبی برای انحراف و اوج نمودار آماری جهت آزمایش توزیع ضخامت نرمال 1034 لایة SPS انتخاب شده است . تحلیلهای آماری بیانگر آن است که برای 84 درصد همة لایه ها تنوع ضخامت در یک قطعه دلالت بر توزیع نرمال دارد . این نتایج می توانند بعنوان یک ورودی مهم برای مهندسی روسازی که شامل طراحی مطمئن و همچنین کیفیت مطمئن هستند بکار روند .
مقایسه ساختار و طرح لایه ها :
هسته و ارتفاع ساختاری روسازی اندازه گیری و جهت طراحی لایه های جدید SPS مقایسه می شوند (یک طرح مبنا و استاندارد) . این داده ها برای مشخص کردن درصد اندازهگیرهای مشخص درون یا بیرون لایه های ویژه هدف ارزیابی می شوند . مقایسة تحلیلهای آماری وسایل اندازه گیری در مقابل ارزشهای طرحی با استفاده از t-test (آزمایش t) صورت گرفت .
آزمایش دو جانبة (t-test) t برای 95 درصد سطوح راحتی برای هر نوع مقطعی (برشی) جهت تخمین تفاوت بین طراحی و ساخت لایه ها قابل توجه است . آزمایش یک جانبة t برای 95 درصد سطوح راحتی برای هر نوع لایه ای با تفاوت طراحی وساخت در حدود 35/6 میلی لیتر (25/0 اینچ) ، 7/12 میلی لیتر (5/0 اینچ)و 4/25
لینک دانلود و خرید پایین توضیحات
فرمت فایل word و قابل ویرایش و پرینت
تعداد صفحات: 69
دانشگاه شمال
پایان نامه :
برای دریافت لیسانس کامپیوتر
موضوع :
سیستم فروش شرکت تحت وب
نرم افزارهای استفاده شده :
Access ، HTML ، ASP و SQL
استاد راهنما :
استاد ارجمند جناب آقای دکتر منصوری
نگارش :
فرید یاوری دیزجیکان
سال تحصیلی : 83-1382
مقدمه ای بر بانک اطلاعاتی اکسس
تاریخچه مختصر پایگاه داده ها
سیستمهای پایگاه داده ها برای ذخیره کردن اطلاعات به کار می رود.
هم سیستمهای بزرگ زررواسیون شرکتهای هواپیمایی و هم دفترچه تلفنی که درجیب شما قراردارد پایگاه دادها محسوب می شوند زیرا از آنها برای ذخیره کردن داده ها و بازیابی اطلاعات استفاده میشود. تا چندین سال پیش سیستمهای بزرگ پایگاه داده ها تنها بر روی کامپیوترهای بزرگ (main frame) کار می کردند. به همین دلیل طراحی پیاده سازی ونگهداری آنها بسیار پر هزینه بود. با به بازارآمدن کامپیوتر ها شخصی (personal computer) قدرتمند و ارزان قیمت فعلی اینک برنامه نویسان می توانند نرم افزارهای لازم برای جمع آوری و ارائه اطلاعات را با هزینه های اندک و در زمان کوتاه تولید کنند.
شناخت پایگاه داده های اکسس (Access)
به طور کلی پایگاه داده مجموعه ای از انواع اطلاعات می باشد. برنامه اکسس پایگاه داده های نسبتا ساده و آسانی را ایجاد میکند. «جدول (table) به محفظه الکترونیکی گفته می شود که برنامه اکسس برای نگهداری داده های شما آن را ارائه می دهد. شکل 1-1
هر جدول (Table ) از سطرها و ستون ها تشکیل می شود. برنامه اکسس مدخل پایگاه داده ها (مثلا هر یک از کارمندان یا فقره موجودی) را در سطر مختص به خود ذخیره می کند. هر سطر یک سابقه record به حساب می آید و هر سابقه شامل اطلاعات خاصی مربوط به یک شخصی مکان و غیره می باشد.
هر سابقه به بخش های مجزایی از اطلاعات تقسیم می شود و هر یک از بخش ها میدان fied نام دارد.
در جدول هر میدان ستون جداگانه ای دارد و دارای بخش های مختلفی از اطلاعات می باشد که با هم جمع می شوند و تشکیل سابقه خاصی را می دهند مثلا last name یک میدان است همه نام های خانوادگی موجود در کل جدول در همان ستون به عنوان میدان last name شناخته می شوند.
برنامه اکسس نوع خاصی از پایگاه داده ها به نام پایگاه داده های رابطه ای (relational DataBase) می باشد این پایگاه داده ها اطلاعات را به زیر مجموعههای جداگانه تقسیم می کند . هر زیر مجموعه اطلاعات برای هدف
لینک دانلود و خرید پایین توضیحات
فرمت فایل word و قابل ویرایش و پرینت
تعداد صفحات: 22
Data types
انواع مختلفی از داده ها وجود دارند
Integer
یک عدد صحیح می باشد.
دو نوع داده با Integer وابستگی دارند . byte, long . long می تواند اعداد بزرگتر از محدوده integer را در خود ذخیره نماید. یک byte کوچکتر می باشد.
اعداد اعشاری یا Floating-point numbers
اعداد اعشاری اعداد decimal می باشند . توجه به این نکته مهم می باشد که اعداد ممیز شناور و اغلب گرد شده یا بریده می شوند تا به اندازه فضایی شوند که به آنها اختصاص داده شده است .
نوع داده أی single , double به اعداد ممیز شناور ، اختصاص داده شده اند فرق بین این دو دقت اعدادی که در خود ذخیره می کنند می باشند در نوع دادة double دو برابر single حافظه لازم دارید اما بدیهی است که محدودة اعداد بزرگتر را می تواند در خود نگهداری کند و همچنین دقت بیشتری نسبت به single دارد
رشته String
یک رشته می تواند زنجیره أی از حروف ، اعداد، و نشانه ها را در داخل خود نگهداری کند.
اطلاعات Data
یک ویژگی مفید Vbscript که در دیگر زبانهای برنامه نویسی وجود ندارد مدیریت اطلاعات می باشد . اگر چه می توان داده ها را به صورت رشته ها یا اعداد نمایش داد ولی استفاده از این متغیر داده أی می تواند زمان یا تاریخ و اطلاعات متنوع توابع تاریخ Vbscript و عملگرهایی که فرمت و اطلاعات مربوط به تاریخ را چاپ می نمایند را نگهداری کنند.
Boolean
یک متغیر boolean مقادیر درست یا غلط را در خود نگهداری می کند.
نوع داده Currency
یک عدد دقیق که تنها برای ذخیره مقادیر پولی به خوبی کار خواهد کرد اما Vbscript یک نوع داده مخصوص برای پول مهیا می کند که با چندین تابع ویژه Vbscript کار می کند .
Object
این قسمت به اشیاء مخصوص اشاره دارد در مارکردن با عملگرهای مربوطه به پایگاه های داده استفاده می شود.
Variant Vciriables
در بیشتر زبانهای برنامه نویسی یک فرقی باید بین متغیرهای داده های مختلف وجود داشته باشد. یک متغیر که برای نگهداری رشته ها استفاده می شود بعداً برای نگهداری یک عدد نمی تواند مورد استفاده قرار بگیرد البته این موضوع در زبان Vbscript صادق نمی باشد. Vbscript از Variant Vciriables هایی استفاده می کند که متغییرهایی هستند که شامل مقادیری از هر نوع می تواند باشد.
مقدار دادن به یک متغیر
در تعدادی از زبانهای برنامه نویسی قبل از اینکه شما از متغییرها استفاده کنید باید به سیستم اعلام نمایید که از چه نوعی از داده می خواهید در داخل متغیر استفاده کنید و چه کاری با آن متغیر می خواهید انجام دهید. برای مثال در زبان برنامه نویسی c++ شما باید بگویید که
int my-variable;
my-variable = 2;
Vbscript همه چیز را کمی ساده تر می کند در Vbscript لازم نیست که نوع متغیر را یعنی char, real, integer یا هر نوع متغیری را که ایجاد می کنید تعیین نمایید. در Vbscript همه متغیرها به وسیله کلمة کلیدی dim تعریف می گردند این بدین خاطر است که در Vbscript از variant variables ها استفاده می گردد . بنابراین جملة معادل برای آن چیزی که در c++ توصیف شد عبارت زیر است
Dim my_variable
در اینجا در اولین خط my_variable به عنوان متغیر توصیف گشته است بدون اینکه my_variable را به عنوان یک متغیر از نوع integer تعیین نماییم.
حتی خط اول ابداً لزومی ندارد در Vbscript استفاده از خط دو بدون اینکه اشاره أی به my_variable شود به سادگی قابل قبول می باشد به این کار implicit declaration می گویند.
از dashes,perrids,Spaces استفاده نکنید . استفاده از هر کدام از موارد ذکر شده در نام متغیرتان یک پیغام خطا را ایجاد می کنند در عوض اگر شما می خواهید چیزی را گسترش دهید سعی کنید از علامت (_) استفاده نمایید برای مثال my_first_variable یک نام متغیر است در صورتی که my first variable چنین نمی باشد.
نامهای متغیر ها باید با یک حرف شروع شوند Underscore و اعداد می توانند در داخل نامهای متغیرتان تعریف گردند اما نه به عنوان کاراکتر اول.
نام متغیرها نباید طولانی تر از 255 کاراکتر باشد.
از کلمات کلیدی به عنوان متغیرها استفاده نکنید.
از نام متغیرها دوباره استفاده ننمایید شما می توانید از نام متغیرها دوباره استفاده نمایید فقط آگاه باشید که شما نمی توانید از همان نام برای دو متغیر مختلف استفاده نمایید.
همان طوری که پیش از این ذکر گردید پیش از این ذکر گردید Vbscript از variant variable
لینک دانلود و خرید پایین توضیحات
فرمت فایل word و قابل ویرایش و پرینت
تعداد صفحات: 46
Data Types
انواع مختلفی از داده ها در ASP
Integer
یک عدد صحیح می باشد.
دو نوع داده با Integer وابستگی دارند . byte, long .
long می تواند اعداد بزرگتر از محدوده integer را در خود ذخیره نماید. یک byte کوچکتر می باشد.
اعداد اعشاری یا Floating-point numbers
اعداد اعشاری اعداد decimal می باشند . توجه به این نکته مهم می باشد که اعداد ممیز شناور و اغلب گرد شده یا بریده می شوند تا به اندازه فضایی شوند که به آنها اختصاص داده شده است .
نوع داده ای single , double به اعداد ممیز شناور ، اختصاص داده شده اند فرق بین این دو دقت اعدادی که در خود ذخیره می کنند می باشند در نوع دادة double دو برابر single حافظه لازم دارید اما بدیهی است که محدودة اعداد بزرگتر را می تواند در خود نگهداری کند و همچنین دقت بیشتری نسبت به single دارد.
رشته String
یک رشته می تواند زنجیره ای از حروف ، اعداد، و نشانه ها را در داخل خود نگهداری کند.
اطلاعات Data
یک ویژگی مفید Vbscript که در دیگر زبانهای برنامه نویسی وجود ندارد مدیریت اطلاعات می باشد . اگر چه می توان داده ها را به صورت رشته ها یا اعداد نمایش داد ولی استفاده از این متغیر داده ای می تواند زمان یا تاریخ و اطلاعات متنوع توابع تاریخ Vbscript و عملگرهایی که فرمت و اطلاعات مربوط به تاریخ را چاپ می نمایند را نگهداری کنند.
Boolean
یک متغیر boolean مقادیر درست یا غلط را در خود نگهداری می کند.
نوع داده Currency
یک عدد دقیق که تنها برای ذخیره مقادیر پولی به خوبی کار خواهد کرد اما Vbscript یک نوع داده مخصوص برای پول مهیا می کند که با چندین تابع ویژه Vbscript کار می کند
Object
این قسمت به اشیاء مخصوص اشاره دارد در کارکردن با عملگرهای مربوطه به پایگاه های داده استفاده می شود.
Variant Variables
در بیشتر زبانهای برنامه نویسی تفاوتی باید بین متغیرهای داده های مختلف وجود داشته باشد. یک متغیر که برای نگهداری رشته ها استفاده می شود بعداً برای نگهداری یک عدد نمی تواند مورد استفاده قرار بگیرد البته این موضوع در زبان Vbscript صادق نمی باشد. Vbscript از Variant Variables هایی استفاده می کند که متغیرهایی هستند که شامل مقادیری از هر نوع می تواند باشد.
مقدار دادن به یک متغیر
در تعدادی از زبانهای برنامه نویسی قبل از اینکه شما از متغیرها استفاده کنید باید به سیستم اعلام نمایید که از چه نوعی از داده می خواهید در داخل متغیر استفاده کنید و چه کاری با آن متغیر میخواهید انجام دهید. برای مثال در زبان برنامه نویسی c++ شما باید بگویید که
int my_variable;
my_variable = 2;
Vbscript همه چیز را کمی ساده تر می کند در Vbscript لازم نیست که نوع متغیر را یعنی char, real, integer یا هر نوع متغیری را که ایجاد میکنید تعیین نمایید. در Vbscript همه متغیرها به وسیله کلمة کلیدی dim تعریف میگردند این بدین خاطر است که در Vbscript از variant variables ها استفاده میگردد . بنابراین جملهی معادل برای آن چیزی که در c++ توصیف شد عبارت زیر است:
Dim my_variable
در اینجا در اولین خط my_variable به عنوان متغیر توصیف گشته است بدون اینکه my_variable را به عنوان یک متغیر از نوع integer تعیین نماییم.
حتی در خط اول ابداً لزومی ندارد، در Vbscript استفاده از خط دوم بدون اینکه اشارهای بهmy_variable شود به سادگی قابل قبول میباشد به این کار implicit declaration می گویند.
از dashes, perrids, Spaces استفاده نکنید . استفاده از هر کدام از موارد ذکر شده در نام متغیرتان یک پیغام خطا را ایجاد میکنند در عوض اگر شما میخواهید چیزی را گسترش دهید سعی کنید از علامت (_) استفاده نمایید برای مثال my_first_variable یک نام متغیر است در صورتی که my first variable چنین نمی باشد.
نامهای متغیرها باید با یک حرف شروع شوند Underscore و اعداد می توانند در داخل نامهای متغیرتان تعریف گردند اما نه به عنوان کاراکتر اول.
نام متغیرها نباید طولانی تر از 255 کاراکتر باشد.
از کلمات کلیدی به عنوان متغیرها استفاده نکنید.
از نام متغیرها دوباره استفاده ننمایید شما می توانید از نام متغیرها دوباره استفاده نمایید فقط آگاه باشید که شما نمی توانید از همان نام برای دو متغیر مختلف استفاده نمایید.
همان طوری که پیش از این ذکر گردید Vbscript از variant variable ها استفاده مینماید که با وجود آنها شما دیگر نیازی برای ساختن یک متغیر مخصوص برای یک نوع داده را ندارید. آنها کدهای شما را برای خواندن دیگران سادهتر مینمایند اما بهتر از آن اینکه آنها چیزهایی را برای شما که میخواهید بنویسید راحتتر مینمایند.
لینک دانلود و خرید پایین توضیحات
دسته بندی : وورد
نوع فایل : .doc ( قابل ویرایش و آماده پرینت )
تعداد صفحه : 31 صفحه
قسمتی از متن .doc :
دانشکده برق و کامپیوتر
درس پایگاه دادههای پیشرفته 2
گزارش اول
مقدمهای بر دادهکاوی
مصطفی کیخا 810184097
علی عباسی 810184102
فهرست
1 مقدمه ای بر دادهکاوی 3
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟ 4
1-2 مراحل کشف دانش 6
1-3 جایگاه داده کاوی در میان علوم مختلف 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟ 12
1-5 داده کاوی و انبار داده ها 13
1-6 داده کاوی و OLAP 14
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی 15
2- توصیف داده ها در داده کاوی 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها 15
2-2 خوشه بندی 16
2-3 تحلیل لینک 16
3- مدل های پیش بینی داده ها 17
3-1 Classification 17
3-2 Regression 17
3-3 Time series 18
4 مدل ها و الگوریتم های داده کاوی 18
4-1 شبکه های عصبی 18
4-2 Decision trees 22
4-3 Multivariate Adaptive Regression Splines(MARS) 24
4-4 Rule induction 25
4-5 K-nearest neibour and memory-based reansoning(MBR) 26
4-6 رگرسیون منطقی 27
4-7 تحلیل تفکیکی 27
4-8 مدل افزودنی کلی (GAM) 28
4-9 Boosting 28
5 سلسله مراتب انتخابها 29
1 مقدمه ای بر دادهکاوی
در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند [1].
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد [2].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1-1 نشان داده شده است.
کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند [1]. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟
اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار وکنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد.
داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات: جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها. در شکل1-2 این روند تکاملی در پایگاه های داده نشان داده شده است ]3[.