دانشکده

دانلود فایل ها و تحقیقات دانشگاهی ,جزوات آموزشی

دانشکده

دانلود فایل ها و تحقیقات دانشگاهی ,جزوات آموزشی

تحقیق در مورد تجزیه و تحلیل داده ها (با فرمت word)

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 9

 

بنام خدا

ارزیابی و تحلیل داده های لایه‌های روزسازی

این مطالعات جهت ارزیابی و تعیین کیفیت و تکامل اطلاعات لایه های روسازی و داده های ضخامت لایه ها برای تهیه توضیحات و توصیه هایی برای گسترش اطلاعات موجود اخیر از داده های LTPP می باشد . تفاوت ضخامت لایه ها در بخشهای مختلفی کلاسه بندی شده است . بهمین ترتیب طراحی و ساخت لایه ها مقایسه شده‌اند . بعلاوه راهنمایی جهت پیشرفت اطلاعات لایه ای LTPP می باشد .

دسترسی و تکامل داده ها :

در قسمت مطالعات ، اطلاعات در دسترس از ضخامت لایه های روسازی (LTPP) مورد آزمایش و ارزیابی کیفی جهت تکمیل سرویس A تا E‌ قرار گرفته اند . ارزیابی داده های ضخامت لایه ها نشان دهندة آن است که سطوح TST-L05A و TST-Lo5B در برگیرندة جامعترین اطلاعات در مورد ساختار لایه ها و ضخامت آنها برای تجزیه و تحلیل سطوح مختلف است . تنها 16 ساختار روسازی از بخشهای معمول LTPP و 1 ساختار روسازی از بخش مکمل آن هیچ اطلاعاتی در مورد ساختار لایه ها چه TST-L05A و چه TST-L05B ندارند . تجزیه و تحلیل اطلاعات تکمیلی از سطح E ، 3457 ساختار لایه روسازی را در بخش آزمایشی مشخص کرده است . حدود 3240 تا از این ساختارها (یعنی 7/93 درصد) در بخش صفر TST-L05B ثبت شده اند در حالیکه 3229 ساختار آن (یعنی 4/93 درصد) در بخش TST-L05A ثبت شده اند .

استحکام و کیفیت لایه :

بدنبال تکمیل ارزیابی داده ها‌، ضخامت لایه های روسازی و دیگر داده های مرتبط از منابع مختلف اطلاعاتی ، جهت تعیین استحکام (ثبات) و توضیحات کاربردی لایه ها ، نوع جنس و اطلاعاتی از ضخامت میان منابع مختلف ، ارزیابی شدند . بعلاوه ، تنوع لایه ها از نظر مصالح ، استحکام و پارامترهای مختلف ، برای ارزیابی ضخامت لایه ها در دسترس می باشند . نتایج ارزیابی اطلاعات استحکامی نشان می دهد که توصیف کاربردی لایة روسازی بین سطوح مختلف LTPP برای 93 درصد از نمونه های ارزیابی شده در مطالعات صابت است و در مورد نوع جنس لایه ها مشخص شده است که 79 درصد بخشهای ارزیابی شده در مطالعات ثابت است ارزیابی جنس لایة در غیاب طرح یونیفاید مصالح و کد شناسایی آنها صورت پذیرفت ارزش نشان داده شده لایه ها بین سطوح مختلف برای 89 درصد از نمونه های روسازی در مطالعة آنها ثابت در نظر گرفته شده است . در مواردی که داده های منابع مختلف یکسان نبودند ، یک لایه برای مطالعات بیشتر برداشته می شد . عدم ثابت بودن داده ها در لایه ها مورد بررسی قرار گرفته و بصورت تحلیل داده ها و مرور عملیات و توصیه هایی برای حل داده های غیرمتعارف به مدیریت LTPP گزارش می شد .

بعلاوه سودمندی و نتیجه بخش بودن مصالح نیز مورد بررسی قرار گرفت . هدف از انجام و چک کردن خواص مصالح آن بود که مشخص شود آیا کد مصالح برای لایه با توصیفات کاربردی آن تطابق دارد یا خیر . زمانیکه بیشتر رکودها که دارای ارزش مصالحی هستند (642 درصد از بین 41111 حدود 56/1 درصد دارای کد مصالح نادرست هستند) و بعضی رکوردها که کد مصالح آنها از بین رفته است . رکودهای مشخص شده بصورت تحلیل داده ها و بررسی عملیات به FHWA (بخش بزرگراههای ایالتی) گزارش می شد . استدلالات داده ای لایه ها با استفاده از نشان دهندة تغییرات (شاخص) که بصورت SHRP-LTPP مشخص شده اند مورد بررسی قرار می گیرند و بعنوان یک نتیجه از ارزیابی لایه های روسازی به FHWA گزارش می شوند .

تغییرات ضخامت

تنوعی که در ضخامت لایه از تجزیه SPS در محلهای مختلف بدست آمده است با توجه به پراکندگی تئوری آماری مورد تجزیه و تحلیل قرار گرفته است . این تحلیل لایه ها با مصالح و کاربرد مختلف مختلف را شامل می شود که قسمتهای دسته اول (A-Class) و بیندر (binder) ، AC بیندر ، اساس متراکم ، اساس متراکم پرداخت شده ، اساس نفوذپذیر AC و اساس بتنی نرم و سطوح PCC را در بر می گیرد . برای تشخیص ویژگیهای لایه ها ، توصیفات آماری مانند وسایل نقلیه ، انحراف معیار (استاندارد) ، کجی (انحراف) و نقطه اوج آماری برای هر قسمت محاسبه شده است .و یک آزمایش ترکیبی برای انحراف و اوج نمودار آماری جهت آزمایش توزیع ضخامت نرمال 1034 لایة SPS انتخاب شده است . تحلیلهای آماری بیانگر آن است که برای 84 درصد همة لایه ها تنوع ضخامت در یک قطعه دلالت بر توزیع نرمال دارد . این نتایج می توانند بعنوان یک ورودی مهم برای مهندسی روسازی که شامل طراحی مطمئن و همچنین کیفیت مطمئن هستند بکار روند .

مقایسه ساختار و طرح لایه ها‌ :

هسته و ارتفاع ساختاری روسازی اندازه گیری و جهت طراحی لایه های جدید SPS مقایسه می شوند (یک طرح مبنا و استاندارد) . این داده ها برای مشخص کردن درصد اندازه‌گیرهای مشخص درون یا بیرون لایه های ویژه هدف ارزیابی می شوند . مقایسة تحلیلهای آماری وسایل اندازه گیری در مقابل ارزشهای طرحی با استفاده از t-test (آزمایش t) صورت گرفت .

آزمایش دو جانبة (t-test) t برای 95 درصد سطوح راحتی برای هر نوع مقطعی (برشی) جهت تخمین تفاوت بین طراحی و ساخت لایه ها قابل توجه است . آزمایش یک جانبة t برای 95 درصد سطوح راحتی برای هر نوع لایه ای با تفاوت طراحی وساخت در حدود 35/6 میلی لیتر (25/0 اینچ) ، 7/12 میلی لیتر (5/0 اینچ)و 4/25



خرید و دانلود تحقیق در مورد تجزیه و تحلیل داده ها (با فرمت word)


تحقیق در مورد تاریخچه مختصر پایگاه داده ها2 (با فرمت word)

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 69

 

دانشگاه شمال

پایان نامه :

برای دریافت لیسانس کامپیوتر

موضوع :

سیستم فروش شرکت تحت وب

نرم افزارهای استفاده شده :

Access ، HTML ، ASP و SQL

استاد راهنما :

استاد ارجمند جناب آقای دکتر منصوری

نگارش :

فرید یاوری دیزجیکان

سال تحصیلی : 83-1382

مقدمه ای بر بانک اطلاعاتی اکسس

تاریخچه مختصر پایگاه داده ها

سیستمهای پایگاه داده ها برای ذخیره کردن اطلاعات به کار می رود.

هم سیستمهای بزرگ زررواسیون شرکتهای هواپیمایی و هم دفترچه تلفنی که درجیب شما قراردارد پایگاه دادها محسوب می شوند زیرا از آنها برای ذخیره کردن داده ها و بازیابی اطلاعات استفاده میشود. تا چندین سال پیش سیستمهای بزرگ پایگاه داده ها تنها بر روی کامپیوترهای بزرگ (main frame) کار می کردند. به همین دلیل طراحی پیاده سازی ونگهداری آنها بسیار پر هزینه بود. با به بازارآمدن کامپیوتر ها شخصی (personal computer) قدرتمند و ارزان قیمت فعلی اینک برنامه نویسان می توانند نرم افزارهای لازم برای جمع آوری و ارائه اطلاعات را با هزینه های اندک و در زمان کوتاه تولید کنند.

شناخت پایگاه داده های اکسس (Access)

به طور کلی پایگاه داده مجموعه ای از انواع اطلاعات می باشد. برنامه اکسس پایگاه داده های نسبتا ساده و آسانی را ایجاد میکند. «جدول (table) به محفظه الکترونیکی گفته می شود که برنامه اکسس برای نگهداری داده های شما آن را ارائه می دهد. شکل 1-1

هر جدول (Table ) از سطرها و ستون ها تشکیل می شود. برنامه اکسس مدخل پایگاه داده ها (مثلا هر یک از کارمندان یا فقره موجودی) را در سطر مختص به خود ذخیره می کند. هر سطر یک سابقه record به حساب می آید و هر سابقه شامل اطلاعات خاصی مربوط به یک شخصی مکان و غیره می باشد.

هر سابقه به بخش های مجزایی از اطلاعات تقسیم می شود و هر یک از بخش ها میدان fied نام دارد.

در جدول هر میدان ستون جداگانه ای دارد و دارای بخش های مختلفی از اطلاعات می باشد که با هم جمع می شوند و تشکیل سابقه خاصی را می دهند مثلا last name یک میدان است همه نام های خانوادگی موجود در کل جدول در همان ستون به عنوان میدان last name شناخته می شوند.

برنامه اکسس نوع خاصی از پایگاه داده ها به نام پایگاه داده های رابطه ای (relational DataBase) می باشد این پایگاه داده ها اطلاعات را به زیر مجموعه‌های جداگانه تقسیم می کند . هر زیر مجموعه اطلاعات برای هدف



خرید و دانلود تحقیق در مورد تاریخچه مختصر پایگاه داده ها2 (با فرمت word)


تحقیق درباره داده های کامپیوتری 20 ص

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 22

 

Data types‌

انواع مختلفی از داده ها وجود دارند

Integer

یک عدد صحیح می باشد.

دو نوع داده با Integer وابستگی دارند . byte, long . long می تواند اعداد بزرگتر از محدوده integer را در خود ذخیره نماید. یک byte کوچکتر می باشد.

اعداد اعشاری یا Floating-point numbers

اعداد اعشاری اعداد decimal می باشند . توجه به این نکته مهم می باشد که اعداد ممیز شناور و اغلب گرد شده یا بریده می شوند تا به اندازه فضایی شوند که به آنها اختصاص داده شده است .

نوع داده أی single , double به اعداد ممیز شناور ، اختصاص داده شده اند فرق بین این دو دقت اعدادی که در خود ذخیره می کنند می باشند در نوع دادة double دو برابر single حافظه لازم دارید اما بدیهی است که محدودة اعداد بزرگتر را می تواند در خود نگهداری کند و همچنین دقت بیشتری نسبت به single دارد

رشته String

یک رشته می تواند زنجیره أی از حروف ، اعداد، و نشانه ها را در داخل خود نگهداری کند.

اطلاعات Data

یک ویژگی مفید Vbscript که در دیگر زبانهای برنامه نویسی وجود ندارد مدیریت اطلاعات می باشد . اگر چه می توان داده ها را به صورت رشته ها یا اعداد نمایش داد ولی استفاده از این متغیر داده أی می تواند زمان یا تاریخ و اطلاعات متنوع توابع تاریخ Vbscript و عملگرهایی که فرمت و اطلاعات مربوط به تاریخ را چاپ می نمایند را نگهداری کنند.

Boolean

یک متغیر boolean مقادیر درست یا غلط را در خود نگهداری می کند.

نوع داده Currency

یک عدد دقیق که تنها برای ذخیره مقادیر پولی به خوبی کار خواهد کرد اما Vbscript یک نوع داده مخصوص برای پول مهیا می کند که با چندین تابع ویژه Vbscript کار می کند .

Object

این قسمت به اشیاء مخصوص اشاره دارد در مارکردن با عملگرهای مربوطه به پایگاه های داده استفاده می شود.

Variant Vciriables

در بیشتر زبانهای برنامه نویسی یک فرقی باید بین متغیرهای داده های مختلف وجود داشته باشد. یک متغیر که برای نگهداری رشته ها استفاده می شود بعداً برای نگهداری یک عدد نمی تواند مورد استفاده قرار بگیرد البته این موضوع در زبان Vbscript صادق نمی باشد. Vbscript از Variant Vciriables هایی استفاده می کند که متغییرهایی هستند که شامل مقادیری از هر نوع می تواند باشد.

مقدار دادن به یک متغیر

در تعدادی از زبانهای برنامه نویسی قبل از اینکه شما از متغییرها استفاده کنید باید به سیستم اعلام نمایید که از چه نوعی از داده می خواهید در داخل متغیر استفاده کنید و چه کاری با آن متغیر می خواهید انجام دهید. برای مثال در زبان برنامه نویسی c++ شما باید بگویید که

int my-variable;

my-variable = 2;

Vbscript همه چیز را کمی ساده تر می کند در Vbscript لازم نیست که نوع متغیر را یعنی char, real, integer یا هر نوع متغیری را که ایجاد می کنید تعیین نمایید. در Vbscript همه متغیرها به وسیله کلمة کلیدی dim تعریف می گردند این بدین خاطر است که در Vbscript از variant variables ها استفاده می گردد . بنابراین جملة معادل برای آن چیزی که در c++ توصیف شد عبارت زیر است

Dim my_variable

در اینجا در اولین خط my_variable به عنوان متغیر توصیف گشته است بدون اینکه my_variable را به عنوان یک متغیر از نوع integer تعیین نماییم.

حتی خط اول ابداً لزومی ندارد در Vbscript استفاده از خط دو بدون اینکه اشاره أی به my_variable شود به سادگی قابل قبول می باشد به این کار implicit declaration می گویند.

از dashes,perrids,Spaces استفاده نکنید . استفاده از هر کدام از موارد ذکر شده در نام متغیرتان یک پیغام خطا را ایجاد می کنند در عوض اگر شما می خواهید چیزی را گسترش دهید سعی کنید از علامت (_) استفاده نمایید برای مثال my_first_variable یک نام متغیر است در صورتی که my first variable چنین نمی باشد.

نامهای متغیر ها باید با یک حرف شروع شوند Underscore و اعداد می توانند در داخل نامهای متغیرتان تعریف گردند اما نه به عنوان کاراکتر اول.

نام متغیرها نباید طولانی تر از 255 کاراکتر باشد.

از کلمات کلیدی به عنوان متغیرها استفاده نکنید.

از نام متغیرها دوباره استفاده ننمایید شما می توانید از نام متغیرها دوباره استفاده نمایید فقط آگاه باشید که شما نمی توانید از همان نام برای دو متغیر مختلف استفاده نمایید.

همان طوری که پیش از این ذکر گردید پیش از این ذکر گردید Vbscript از variant variable



خرید و دانلود  تحقیق درباره داده های کامپیوتری 20 ص


انواع مختلفی از داده ها در ASP 46 ص

لینک دانلود و خرید پایین توضیحات

فرمت فایل word  و قابل ویرایش و پرینت

تعداد صفحات: 46

 

Data Types

انواع مختلفی از داده ها در ASP

Integer

یک عدد صحیح می باشد.

دو نوع داده با Integer وابستگی دارند . byte, long .

long می تواند اعداد بزرگتر از محدوده integer را در خود ذخیره نماید. یک byte کوچکتر می باشد.

اعداد اعشاری یا Floating-point numbers

اعداد اعشاری اعداد decimal می باشند . توجه به این نکته مهم می باشد که اعداد ممیز شناور و اغلب گرد شده یا بریده می شوند تا به اندازه فضایی شوند که به آنها اختصاص داده شده است .

نوع داده ای single , double به اعداد ممیز شناور ، اختصاص داده شده اند فرق بین این دو دقت اعدادی که در خود ذخیره می کنند می باشند در نوع دادة double دو برابر single حافظه لازم دارید اما بدیهی است که محدودة اعداد بزرگتر را می تواند در خود نگهداری کند و همچنین دقت بیشتری نسبت به single دارد.

رشته String

یک رشته می تواند زنجیره ای از حروف ، اعداد، و نشانه ها را در داخل خود نگهداری کند.

اطلاعات Data

یک ویژگی مفید Vbscript که در دیگر زبانهای برنامه نویسی وجود ندارد مدیریت اطلاعات می باشد . اگر چه می توان داده ها را به صورت رشته ها یا اعداد نمایش داد ولی استفاده از این متغیر داده ای می تواند زمان یا تاریخ و اطلاعات متنوع توابع تاریخ Vbscript و عملگرهایی که فرمت و اطلاعات مربوط به تاریخ را چاپ می نمایند را نگهداری کنند.

Boolean

یک متغیر boolean مقادیر درست یا غلط را در خود نگهداری می کند.

نوع داده Currency

یک عدد دقیق که تنها برای ذخیره مقادیر پولی به خوبی کار خواهد کرد اما Vbscript یک نوع داده مخصوص برای پول مهیا می کند که با چندین تابع ویژه Vbscript کار می کند

Object

این قسمت به اشیاء مخصوص اشاره دارد در کارکردن با عملگرهای مربوطه به پایگاه های داده استفاده می شود.

Variant Variables

در بیشتر زبانهای برنامه نویسی تفاوتی باید بین متغیرهای داده های مختلف وجود داشته باشد. یک متغیر که برای نگهداری رشته ها استفاده می شود بعداً برای نگهداری یک عدد نمی تواند مورد استفاده قرار بگیرد البته این موضوع در زبان Vbscript صادق نمی باشد. Vbscript از Variant Variables هایی استفاده می کند که متغیرهایی هستند که شامل مقادیری از هر نوع می تواند باشد.

مقدار دادن به یک متغیر

در تعدادی از زبانهای برنامه نویسی قبل از اینکه شما از متغیرها استفاده کنید باید به سیستم اعلام نمایید که از چه نوعی از داده می خواهید در داخل متغیر استفاده کنید و چه کاری با آن متغیر می‌خواهید انجام دهید. برای مثال در زبان برنامه نویسی c++ شما باید بگویید که

int my_variable;

my_variable = 2;

Vbscript همه چیز را کمی ساده تر می کند در Vbscript لازم نیست که نوع متغیر را یعنی char, real, integer یا هر نوع متغیری را که ایجاد می‌کنید تعیین نمایید. در Vbscript همه متغیرها به وسیله کلمة کلیدی dim تعریف می‌گردند این بدین خاطر است که در Vbscript از variant variables ها استفاده می‌گردد . بنابراین جمله‌ی معادل برای آن چیزی که در c++ توصیف شد عبارت زیر است:

Dim my_variable

در اینجا در اولین خط my_variable به عنوان متغیر توصیف گشته است بدون اینکه my_variable را به عنوان یک متغیر از نوع integer تعیین نماییم.

حتی در خط اول ابداً لزومی ندارد‍، در Vbscript استفاده از خط دوم بدون اینکه اشاره‌ای بهmy_variable شود به سادگی قابل قبول می‌باشد به این کار implicit declaration می گویند.

از dashes, perrids, Spaces استفاده نکنید . استفاده از هر کدام از موارد ذکر شده در نام متغیرتان یک پیغام خطا را ایجاد می‌کنند در عوض اگر شما می‌خواهید چیزی را گسترش دهید سعی کنید از علامت (_) استفاده نمایید برای مثال my_first_variable یک نام متغیر است در صورتی که my first variable چنین نمی باشد.

نامهای متغیرها باید با یک حرف شروع شوند Underscore و اعداد می توانند در داخل نامهای متغیرتان تعریف گردند اما نه به عنوان کاراکتر اول.

نام متغیرها نباید طولانی تر از 255 کاراکتر باشد.

از کلمات کلیدی به عنوان متغیرها استفاده نکنید.

از نام متغیرها دوباره استفاده ننمایید شما می توانید از نام متغیرها دوباره استفاده نمایید فقط آگاه باشید که شما نمی توانید از همان نام برای دو متغیر مختلف استفاده نمایید.

همان طوری که پیش از این ذکر گردید Vbscript از variant variable ها استفاده می‌نماید که با وجود آنها شما دیگر نیازی برای ساختن یک متغیر مخصوص برای یک نوع داده را ندارید. آنها کدهای شما را برای خواندن دیگران ساده‌تر می‌نمایند اما بهتر از آن اینکه آنها چیزهایی را برای شما که می‌خواهید بنویسید راحتتر می‌نمایند.



خرید و دانلود  انواع مختلفی از داده ها در ASP 46 ص


تحقیق در مورد مقدمه ای بر داده کاوی

لینک دانلود و خرید پایین توضیحات

دسته بندی : وورد

نوع فایل :  .doc ( قابل ویرایش و آماده پرینت )

تعداد صفحه : 31 صفحه

 قسمتی از متن .doc : 

 

 

دانشکده برق و کامپیوتر

درس پایگاه دادههای پیشرفته 2

گزارش اول

مقدمهای بر دادهکاوی

مصطفی کیخا 810184097

علی عباسی 810184102

فهرست

1 مقدمه ای بر داده‌کاوی 3

1-1 چه چیزی سبب پیدایش داده کاوی شده است؟ 4

1-2 مراحل کشف دانش 6

1-3 جایگاه داده کاوی در میان علوم مختلف 11

1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟ 12

1-5 داده کاوی و انبار داده ها 13

1-6 داده کاوی و OLAP 14

1-7 کاربرد یادگیری ماشین و آمار در داده کاوی 15

2- توصیف داده ها در داده کاوی 15

2-1 خلاصه سازی و به تصویر در آوردن داده ها 15

2-2 خوشه بندی 16

2-3 تحلیل لینک 16

3- مدل های پیش بینی داده ها 17

3-1 Classification 17

3-2 Regression 17

3-3 Time series 18

4 مدل ها و الگوریتم های داده کاوی 18

4-1 شبکه های عصبی 18

4-2 Decision trees 22

4-3 Multivariate Adaptive Regression Splines(MARS) 24

4-4 Rule induction 25

4-5 K-nearest neibour and memory-based reansoning(MBR) 26

4-6 رگرسیون منطقی 27

4-7 تحلیل تفکیکی 27

4-8 مدل افزودنی کلی (GAM) 28

4-9 Boosting 28

5 سلسله مراتب انتخابها 29

1 مقدمه ای بر داده‌کاوی

در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند [‎1].

بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد [‎2].

واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1-1 نشان داده شده است.

کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید، و نهایتا الگوها و مدلهای قابل فهم در داده ها می باشد. داده کاوی، مرحله ای از فرایند کشف دانش می باشد و شامل الگوریتمهای مخصوص داده کاوی است، بطوریکه، تحت محدودیتهای مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می کند [‎1]. به بیان ساده تر، داده کاوی به فرایند استخراج دانش ناشناخته، درست، و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که، داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد، به نحوی که با استخراج آنها، در حوزه های تصمیم گیری، پیش بینی، پیشگویی، و تخمین مورد استفاده قرار گیرند. داده ها اغلب حجیم ، اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.

1-1 چه چیزی سبب پیدایش داده کاوی شده است؟

اصلی ترین دلیلی که باعث شد داده کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده ها و نیاز شدید به اینکه از این داده ها اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار وکنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می گیرد.

داده کاوی را می توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می باشد، نظیر عملیات: جمع آوری داده ها وایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده ها. در شکل1-2 این روند تکاملی در پایگاه های داده نشان داده شده است ]‎3[.



خرید و دانلود تحقیق در مورد مقدمه ای بر داده کاوی