کتاب پیچ بهترین و سریعترین سایت دانلود کارآموزی و پروژه

دانلود پایان نامه داده کاوی (Data Mining)

تعداد صفحات:81
نوع فایل:word
فهرست مطالب:
چکیده
فصل1 – مقدمه ای بر داده کاوی
تعریف داده کاوی
تاریخچه داده کاوی
چه چیزی سبب پیدایش داده کاوی شده است؟
اجزای سیستم داده کاوی
جایگاه داده کاوی در میان علوم مختلف
قابلیت های داده کاوی
چرا به داده کاوی نیاز داریم؟
داده کاوی چه کارهایی نمیتواند انجام دهد؟
کاربردهای داده کاوی
کاربردهای پیش بینی کننده
کاربردهای توصیف کننده
ابزارهای تجاری داده کاوی
داده کاوی و انبار داده ها
تعاریف انبار داده
چهار خصوصیت اصلی انبار داده
موارد تفاوت انبار داده و پایگاه داده
داده کاوی و OLAP
OLAP
انواع OLAP
مراحل فرآیند کشف دانش از پایگاه داده ها
انبارش داده ها
انتخاب داده ها
پاکسازی، پیش پردازش و آماده سازی
تبدیل داده ها
کاوش در داده ها (Data Mining)
تفسیر نتیجه
فصل 2 – قوانین ارتباطی
قوانین ارتباطی
اصول پایه
شرح مشکل جدی
پیمایش فضای جستجو
مشخص کردن درجه حمایت مجموعه اقلام
الگوریتم های عمومی
دسته بندی
BFS و شمارش رویدادها
BFS و دونیم سازی TID-list
DFS و شمارش رویداد
DFS و دو نیم سازی TID-list
الگوریتم Apriori
مفاهیم کلیدی
پیاده سازی الگوریتم Apriori
معایب Apriori و رفع آن ها
الگوریتم رشد الگوی تکرار شونده
چرا رشد الگوی تکرار سریع است؟
مقایسه دو الگوریتم Apriori و FP-growth
تحلیل ارتباطات
فصل 3 – وب کاوی و متن کاوی
وب کاوی
الگوریتم های هیتس و لاگسام
کاوش الگوهای پیمایش مسیر
متن کاوی
کاربردهای متن کاوی
جستجو و بازیابی
گروه بندی و طبقه بندی
خلاصه سازی
روابط میان مفاهیم
یافتن و تحلیل گرایشات
برچسب زدن نحوی (pos)
ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک
فرآیند متن کاوی
روش های متن کاوی
مراجع

فهرست اشکال:
مراحل فرآیند کشف دانش
سیر تکاملی صنعت پایگاه داده
معماری یک نمونه سیستم داده کاوی
نرخ رشد اطلاعات
کاربرد پیش بینی کننده
داده ها از انبار داده ها استخراج میگردند
داده ها از از چند پایگاه داده استخراج میگردند
دسته بندی الگوریتم ها
پایان الگوریتم Apriori
درخت الگوی تکرار
اندازه گیری کارکرد درجه حمایت برای پایگاه داده D1 40K
اندازه گیری Apriori با درجه حمایت/تراکنش
اندازه گیری FP-growth با درجه حمایت/تراکنش
مقداردهی اولیه الگوریتم HITS
مثالی از الگوهای پیمایش
فرآیند متن کاوی
مثال یافتن روابط

فهرست جداول:
کاوش FP-tree با ایجاد پایگاه های الگو شرطی
پارامترها
نتایج برای فاکتور درجه حمایت 5%
نتایج برای D1 150K با درجه حمایت
تراکنشهای توصیف شده توسط مجموعه ای از URLها
نمایش URLها بعنوان بردارهایی از فعالیت گروه تراکنش
یک SOM مرسوم که توسط توصیف URLها تولید شده است

چکیده:
در دو دهه قبل توانایی های فنی بشر برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستم های سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند.
به طور کلی استفاده همگانی از وب و اینترنت بعنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که بصورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. داده کاوی بعنوان یک راه حل برای این مسائل مطرح میباشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی میکنند، که این دانش بصورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
به لحاظ این که در چند سال اخیر مبحث داده کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانس ها قرار گرفته و نرم افزارهای آن در بازار به شدت مورد توجه قرار گرفته، از این رو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.
در این مقاله در فصل اول مروری بر داده کاوی خواهیم داشت. که بطور عمده به تاریخچه، تعاریف، کاربردها و ارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرآیند کشف دانش از پایگاه داده ها را ذکر کردیم که داده کاوی یکی از مراحل آن است.
در فصل 2 یکی از شیوه های داده کاوی که از سبد خرید گرفته شده است توضیح داده شده است. در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته بندی الگوریتم ها، الگوریتم Apriori (که یک الگوریتم پایه در این زمینه است) و الگوریتم FP-Growth (یک الگوریتم جدید می باشد) را با شرح یک مثال توضیح میدهیم و در آخر آن دو را با هم مقایسه میکنیم.
در فصل 3 مباحث وب کاوی و متن کاوی را که در بسیاری از مراجع جزء کاربردهای داده کاوی به حساب می آید شرح داده خواهد شد.

مقدمه:
امروزه با گسترش سیستم‌های پایگاهی و حجم بالای داده‌های ذخیره شده در این سیستم‌ها، نیاز به ابزاری است تا بتوان داده‌های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده از پرسشهای ساده در SQL و ابزارهای گوناگون گزارش‌گیری معمولی، میتوان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه‌گیری در مورد داده‌ها و روابط منطقی میان آن ها بپردازند. اما وقتی که حجم داده‌ها بالا باشد، کاربران هرچند زبر دست و باتجربه باشند نمی‌توانند الگوها مفید را در میان حجم انبوه داده‌ها تشخیص دهند و یا اگر قادر به این کار هم باشند، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است. از سوی دیگر، کاربران معمولاً فرضیه‌ای را مطرح می‌کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه میپردازند، در حالی که امروزه نیاز به روش هایی است که اصطلاحاً به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه‌های منطقی را بیان نمایند.
داده کاوی یکی از مهم ترین این روش ها است که به الگوهای مفید در داده‌ها با حداقل دخالت کاربران شناخته میشوند واطلاعاتی را در اختیار کاربران و تحلیل گران قرار میدهند تا براساس آن تصمیمات مهم و حیاتی در سازمان ها اتخاذ شوند.
اصطلاح داده کاوی زمانی به کار برده میشود که با حجم بزرگی از داده‌ها، در حد مگا یا ترابایت، مواجه باشیم. در تمامی منابع داده کاوی بر این مطلب تاکید شده است. هرچه حجم داده‌ها بیشتر و روابط آن ها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکل تر میشود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش، روشن‌تر میگردد.
داده کاوی به طور همزمان از چندین رشته علمی بهره میبرد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه‌های عصبی، آمار، الگو، سیستم‌های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده.

لینک دانلود

برچسب ها : OLAP, آماده سازی, آنتولوژی, ابزارهای تجاری, اتوماتیک, اسکن کردن متون, اطلاعات, الگوریتم, انبار داده, انبارش, بازیابی, بازیابی اطلاعات, تراکنش, توانايی, تکنولوژی, جستجو, خدمات دولتی, خلاصه سازی, داده کاوی, دانلود, سیستم, صنعت, طبقه بندی, فرآیند, ماهواره, متن کاوی, محاسبات, معماری, نرم افزار, هوش مصنوعی, پاکسازی, پایان نامه, پایگاه داده, پردازش, پیش پردازش, کاربران, کامپیوتر, کسب و کار, کشف دانش, گروه بندی,

امتياز : 3 | نظر شما : 1 2 3 4 5 6

نوشته شده توسط ketabpich در دوشنبه 17 اسفند 1394 ساعت 11:32 موضوع | تعداد بازديد : 277 | لينک ثابت

دانلود پروژه Olap چيست و چگونه كار مي كند؟

تعداد صفحات:54
نوع فايل:word
فهرست مطالب:
مقدمه
تاريخچه Sql Server
Sql Server چيست؟
اهداف Sql Server
آشنايي با Analysis Services و نحوه نصب آن
نصب پايگاه داده و منبع آن
نحوه ايجاد Cube
پيمانه چيست؟
نحوه اصافه كردن بعد به مكعب
طراحي منبع و پردازش مكعب
ايجاد مكعب پدر و فرزند
ويرايش اطلاعات مكعب
سرجمع (Aggregation) چيست؟
درك مفاهيم انبار كردن داده ها
درك مفاهيم انبار داده خاص (Data Marts)
ايجاد انبار داده ها
سرويس هاي Meta data
عضو محاسبه شده Calculated Member
ايجاد عضو محاسبه شده
چگونگي مشاهده اطلاعات عضو محاسبه شده
Roles در مكعب چيست؟
نحوه ايجاد Role در مكعب
نحوه ايجاد Role در بانك اطلاعات
خواص اعضا (member property)
نحوه ايجاد Member Property
ايجاد ابعاد مجازي
استخراج داده چيست ؟ (Olap Data Mining)
نحوه ايجاد Data Mining Model
فهرست منابع

چكيده:
MS SQL Server يكي از سيستم هاي مديريت بانك هاي اطلاعاتي رابطه اي (Relational) است كه توسط شركت مايكروسافت ارائه شده است. SQL Server از مدل سرويس دهنده – سرويس گيرنده (Client/Server) تبعيت مينمايد. در اين مدل، درخواست هاي (InQuery) سرويس گيرندگان براي سرويس دهنده ارسال و در سمت سرويس دهنده بررسي و آناليز ميگردند. در ادامه، پردازش هاي‌ مورد نياز بر روي اطلاعات ذخيره شده در بانك هاي اطلاعاتي انجام و در نهايت، نتايج براي سرويس گيرنده ارسال خواهد شد.MS SQL Server با استفاده از مجموعه عناصري (Components) كه به صورت هدفمند اجراء ميگردند، قادر به تامين نيازها و درخواست ها از مخازن داده (Data Storages) ميباشد. مخازن داده در SQL Server به دو روش زير مديريت ميگردند:
- OLTP (برگرفته از OnLine Transaction Processing System)
- OLAP (برگرفته از OnLine Analytical Processing System)
در مدل OLTP، مخازن داده به صورت جداول رابطه اي كه عموما به جهت جلوگيري از تكرار و ناهمگوني اطلاعات به صورت هنجار (Normalize) درآمده اند، سازماندهي ميشوند. اين نوع از بانك هاي اطلاعاتي براي درج و تغيير سريع اطلاعات توسط چندين كاربر به طور همزمان مناسب ميباشند. در مدل OLAP مخازن داده جهت تجزيه و تحليل و خلاصه سازي حجم زيادي از اطلاعات سازماندهي ميشوند. مخازن داده و ارتباط بين اطلاعات در اين مدل توسط SQL Server مديريت ميگردد.
يكي از اهداف مهم سيستم هاي مديريت بانك هاي اطلاعاتي، قابليت رشد و توسعه (Scalability) است. MS SQL Server مجموعه اي از پتانسيل ها را به منظور تامين هدف فوق ارائه نموده است كه به برخي از مهم ترين آن ها اشاره ميگردد:
- قابليت كار با بانك هاي اطلاعاتي حجيم (در حد ترابايت)
- قابليت دسترسي هزاران كاربر بطور همزمان به بانك اطلاعاتي
- قابليت خود سازگاري (Self Compatibility). با استفاده از ويژگي فوق، منابع مورد نياز هر كاربر (نظير حافظه، فضاي ديسك و …) به محض اتصال به سرور (Log in) به صورت اتوماتيك به وي تخصيص داده ميشود و پس از Log off، منابع اختصاص يافته به منظور استفاده ساير كاربران آزاد ميشوند.
- قابليت اعتماد و در دسترس بودن (Reliability). با استفاده از ويژگي فوق ميتوان بسياري از فعاليت هاي مديريتي را بدون توقف سرور انجام داد (نظير BackUp).
- برخورداري از سطوح امنيتي بالا. بدين منظور اعتبار سنجي كاربران توسط SQL با اعتبار سنجي ويندوز تجميع مي گردد. در چنين مواردي، ضرورتي به تعريف كاربر در MSSQL نخواهد بود و اعتبار سنجي وي توسط ويندوز انجام خواهد شد.
- پشتيباني از حجم بالايي از حافظه در سرور (در نسخه 2000 تا 64 گيگابايت و در نسخه 2005 متناسب با حافظه اي كه سيستم عامل از آن حمايت مي نمايد).
- استفاده از چندين پردازنده به صورت موازي (در نسخه 2000 تا 32 پردازنده همزمان و در نسخه 2005 محدوديتي وجود ندارد)
- پشتيباني از لايه ها و سوكت هاي امنيتي نظير SSL، خصوصا جهت استفاده در وب.
يكي ديگر از ويژگي هاي مهم سيستم هاي مديريت بانك هاي اطلاعاتي‌، ايجاد تسهيلات لازم به منظور مديريت بانك هاي اطلاعاتي است. SQL Server با ارائه برنامه هاي جانبي نظير Enterprise Manager استفاده و مديريت بانك هاي اطلاعاتي را آسان نموده است. MS SQL Server به طور اتوماتيك در Active Directory ثبت ميشود (Register)، بنابراين كاربران شبكه به راحتي ميتوانند آن را در Active Directory جستجو و در صورت نياز به آن متصل شوند. همچنين، MS SQL Server توسط IIS پشتيباني ميگردد و مرورگرها با استفاده از پروتكل HTTP قابليت استفاده از آن را خواهند داشت .
از جمله نكات مهم در خصوص MS SQL Server، اجراي آن به صورت يك سرويس است. بنابراين، در صورتي كه كاربري به ماشيني كه MS SQL Server بر روي آن اجراء شده است، Logon نكرده باشد، همچنان سيستم در دسترس كاربران خواهد بود. علاوه بر اين، ميتوان از سيستم مانيتورينگ ويندوز به منظور مانيتورينگ SQL Server استفاده نمود. يكي از مهم ترين و شاخص ترين ويژگي هاي MS SQL Server كه از نسخه 2000 در آن ايجاد شده است، امكان نصب چندين نسخه SQL بر روي يك ماشين ميباشد (Multi Instance)، بطوري كه هر يك از نسخه ها فايل هاي باينري مخصوص به خود را داشته و به طور جداگانه مديريت و راهبري ميگردند، ولي تمام نسخه ها به طور همزمان اجرا ميشوند (دقيقا مشابه اين است كه چندين نسخه بر روي چندين كامپيوتر نصب شده باشد).
با توجه به اين كه نسخه (Instance) قراردادي فاقد نام است و ساير نسخه ها مي بايست داراي نام باشند به آن ها نسخه هاي داراي نام (Named Instance) ميگويند. نسخه هاي داراي نام را ميتوان هر زمان نصب نمود (قبل و يا بعد از نسخه قراردادي). ابزارهاي همراه SQL نظيرSQL Enterprise Manager يك مرتبه نصب خواهند شد و در تمامي نسخه هاي SQL به صورت مشترك استفاده خواهند شد.
تاكنون نسخه هاي متعددي از MS SQL Server ارائه شده است. استفاده از نسخه هاي 2000 و 2005 بيش از ساير نسخه ها، متداول است. هر يك از نسخه هاي MS SQL Server، در مدلهاي مختلف (با توجه به نوع استفاده و اندازه سازمان متقاضي)، ارائه شده اند كه در يك مقاله جداگانه به بررسي‌ ويژگي هر يك از آن ها خواهيم پرداخت.

لينك دانلود

برچسب ها : olap, sql server, آناليز, اتوماتيك, اعتبار سنجي, بانك اطلاعات, برنامه, تجزيه و تحليل, ترابايت, حافظه, خلاصه سازي, دانلود پروژه, سازماندهي, سرويس دهنده, سرويس گيرنده, سرويس گيرندگان, سوكت هاي امنيتي, سيستم, سيستم عامل, شبكه, فضاي ديسك, مانيتورينگ, مايكروسافت, مجازي, مديريت, مقاله, مكعب, ويندوز, پايگاه داده, پتانسيل, پردازش, پروتكل, كامپيوتر,

امتياز : 3 | نظر شما : 1 2 3 4 5 6

نوشته شده توسط ketabpich در چهارشنبه 9 فروردين 1396 ساعت 13:30 موضوع | تعداد بازديد : 238 | لينک ثابت

صفحه قبل 1 صفحه بعد