ساخت پاوپوینت با هوش مصنوعی
کم تر از 5 دقیقه با هوش مصنوعی کافه پاورپوینت ، پاورپوینت بسازید
برای شروع ساخت پاورپوینت کلیک کنید
شما در این مسیر هستید :خانه / محصولات / Powerpoint / دانلود پاورپوینت آشنایی با طراحی صفحات وب (کد17051)
سفارش انجام پاورپوینت - بهترین کیفیت - کم ترین هزینه - تحویل در چند ساعت 09164470871 ای دی e2proir
شناسه محصول و کد فایل : 17051
نوع فایل : Powerpoint پاورپوینت
قابل ویرایش تمامی اسلاید ها دارای اسلاید مستر برای ویرایش سریع و راحت تر
امکان باز کردن فایل در موبایل - لپ تاپ - کامپیوتر و ...
با یک خرید میتوانید بین 342000 پاورپینت ، 25 پاورپوینت را به مدت 7 روز دانلود کنید
فایل های مشابه شاید از این ها هم خوشتان بیاید !!!!
كلمات كليدي
دستهبندي صفحات وب، دستهکننده، درخت تصميمگيري، دستهکننده بيزي، ماشين بردار پشتيبان، خصوصيات درون صفحه، خصوصيات مجاورين، انتخاب قابليت
1- مقدمه
دستهبندي در بسياري از وظايف مديريت وبازيابي اطلاعات يک نقش حياتي ايفا مي کند. در وب دستهبندي محتوي صفحات وب براي تمرکز خزيدن[1]، کمک به توسعه راهنماهاي وب[2]، تحليل بر اساس موضوع[3] لينکهاي وب و براي تحليل ساختار موضوعي وب ضروري است. دستهبندي صفحات وب همچنين مي تواند به بهبود شرايط جستجوي وب نيز کمک نمايد[1].
دستهبندي صفحات وب که به گروه بندي صفحات وب نيز معروف است عبارتست از فرايند نسبت دادن يک صفحه وب به يک يا چند گروه از پيش تعيين شده. دستهبندي اغلب بعنوان يک مسئله يادگيري مطرح مي شود که در آن از يکسري داده هاي برچسب گذاري شده براي آموزش و تمرين دستهکننده استفاده مي شود تا بر اساس آن دستهکننده بتواند داده ها را برچسب گذاري کند.
2- کاربردهاي دستهبندي صفحات وب
2-1- ايجاد ، پشتيباني يا توسعه راهنماهاي وب
برخي از سايتها مانند Yahoo! و dmoz ODP يکسري راهنماي وب دارند که بر اساس آن مي توان يکسري جستجو در گروههاي از پيش تعيين شده انجام داد که در حال حاضر اين راهنماها توسط انسان ايجاد مي شوند. در جولاي 2006 در dmoz ODP، 73354 اديتور راهنما وجود داشت. با گسترش روزافزون صفحات وب ديدگاه سنتي به اين قضيه ديگر نمي تواند موثر باشد . اما با استفاده از دستهبندي صفحات وب مي توان اين راهنماها را براحتي ايجاد کرد و توسعه داد[1].
2-2- بهبود کيفيت نتايج جستجو
گنگ بودن پرس و جوها[1] يکي از مشکلات اساسي براي نتايج جستجو مي باشد. بعنوان مثال کلمه bank هم به معني ساحل و هم به معني بانک است. رويکردهاي مختلفي براي بازيابي اطلاعات در اينگونه موارد مطرح گرديده است. Chekuri و گروهش دستهبندي اتوماتيک صفحات وب به منظور افزايش دقت جستجو در وب را مورد مطالعه قرار دادند. به يک دستهکننده آماري با استفاده از يکسري صفحات موجود آموزش داده شد، سپس اين دستهکننده بر روي يکسري صفحات جديد بکار گرفته شد که يک ليست مرتب از گروهها را ايجاد کرد که صفحات وب مي توانند در آن قرار گيرند. در زمان پرس و جو[2] از کاربر خواسته مي شود تا يک يا چند گروه را انتخاب نمايد بطوريکه فقط اطلاعات مربوط به آن گروهها برگردانده مي شوند يا اينکه موتور جستجو فقط يک ليست از گروههايي را نشان مي دهد که اطلاعات مورد نظر در آنها وجود دارد. اما اين رويکرد فقط زماني ثمربخش است که کاربر به دنبال يک چيز معلوم و مشخص بگردد.
-3- کمک به سيستمهاي پاسخ به سوال[1]
يک سيستم پاسخ به سوال ممکن است تکنيکهاي دستهبندي را براي بهبود کيفيت پاسخهايش بکار ببرد.
يک سوال جالب که در نوشته هاي سابق پاسخ داده نشده اين است که چطور دستهبندي موضوعي صفحات وب در سيستمهاي پاسخ به سؤال مفيد است. در قسمت قبلي يک تعداد رويکرد در مورد استفاده از اطلاعات موضوعي صفحات وب برا ي بهبود کارايي جستجوي وب را ديديم. بطور مشابه توسط تعيين گروه مورد انتظار پاسخ يک سوال و دستهبندي صفحاتي وبي که ممکن است شامل يک پاسخ کانديد باشند، يک سيستم پاسخ يه سوال مي تواند در هر دو زمينه دقت و کارايي مفيد واقع شود[1].
2-4- کاربردهاي ديگر
در کنار کاربردهاي ذکر شده، دستهبندي صفحات وب در فيلترينگ محتواي وب، کمک به مرور وب و ساختمان بر پايه دانش نيز ميتواند مفيد واقع شود.
3- تکنيک هاي دستهبندي صفحات وب
همانطور که اشاره شد دستهبندي صفحات وب شامل نسبت دادن اسناد وب به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[2] که معمولاً خصوصيات[3] ناميده مي شود توصيف مي شوند. برخلاف خوشهبندي[4] اسناد وب که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف دستهبندي تحليل داده هاي ورودي و ايجاد يک مدل دقيق براي هر دسته با استفاده از اين خصوصيات است. اسناد جديد در داخل يکي از اين دسته ها دستهبندي مي شوند.
الگوريتمهاي درخت تصميمگيري اصلي در دو گروه زير دستهبندي شده اند:
دستهکنندهها از نوع يادگيري ماشين مانند ID3، C4.5وCART.
دستهکنندهها براي پايگاه دادهاي بزرگ مانند SLIQ، SPRINT، SONARوRainForest.
شکل (2) : درخت تصميم گيري براي ريسک رانندگي
يک دستهکننده درخت تصميم گيري با استفاده از يک آستانه معين بر روي مقادير ويژگيها يک مجموعه داده را بر اساس تصميمات گسسته جدا مي کند. يک گره ريشه در بالاي ساختار درخت وجود دارد که خصوصيت را مشخص مي کند که در ابتدا بر اساس بيشترين تفاوت(تبعيض) شکسته مي شود. گره هاي داخلي درخت قوانين تصميم گيري ساده اي را روي يک يا چند ويژگي نشان مي دهد، بطوريکه گره هاي برگ برچسب دسته هاي پيش بيني شده هستند. مثلا در شکل شماره (2) که ريسک در رانندگي را مشخص مي کند ابتدا درخت توسط خصوصيت سن تقسيم بندي شده است و سپس در مرحله بعد بر اساس نوع ماشين. همانطور که در شکل مي بينيد برگها دستههاي تعيين شده بر اساس خصوصيات هستند.
ساخت درخت ميتواند توسط ماکزيمم ساختن اطلاعات متقابل[1] عمومي از کل درخت، يا توسط بهينه سازي محلي بهره اطلاعات[2] انجام گيرد. گاهي اوقات معيارهاي فاصله اي مثل شاخص جيني[3] تنوع نيز استفاده مي شود. هم بهينهسازي محلي بهره اطلاعات و هم معيار تقسيم بندي بر اساس فاصله درختهاي کوچک، کم عمق و دقيق توليد مي کنند.
به منظور جداسازي در يک گره الگوريتم بصورت زير پيش مي رود:
يک ويژگي را که بهترين نمونه جداسازي از کلاسهاي مختلف است را بر مي دارد.
کمي کردن فاکتور شهودي براي اندازه گيري جداپذيري. يک I(S) پالايش نشده از يک مجموعه قراردادي S شامل دسته را مشخص مي کند، که مي تواند بصورت زير باشد:
اطلاعات بي نظمي بصورت زير سنجيده ميشود:Entropy(S)=
Entropy(S)= (1)
بطوريکه Pi فراواني نسبي دسته i در S است(يک احتمال قياسي) که مقدار آن وقتي همه الگوها فقط متعلق به يک دسته باشند صفر است و مقدرا آن زماني که همه دستهها به تعداد برابري هستند يک است.
نشانه گذاري جيني که بصورت زير بيان ميشود:
Gini(S) = 1 - (2)
محاسبه بهره اطلاعات در تقسيم S به r زير مجموعه. اين بعنوان ناخالصي S کمترين مجموع ناخالصي وزن دار هر زير مجموعه شمرده مي شود. براي مثال:
Gain(S,S1,…,Sr) = I(S) -
بطوريکه |S| کارديناليتي S و I(S) فاکتور شهودي مشخص شده بعنوان هر Entropy(S) يا Gini(S).
ويژگيهايي که بيشترين بهره اطلاعاتي را فراهم مي کنند براي تقسيم بندي گره استفاده مي شوند. بهر حال اول لازم است که تمام نقاط جداسازي ممکن براي هر ويژگي محاسبه شود[2].
ID3
يک رويکرد نظري اطلاعاتي را بکار مي برد. روند کار به اين صورت است که در هر نقطه خصوصيتي را که بيشترين بهره اطلاعاتي يا بطور معادل بزرگترين کاهش در بي نظمي را دارد مورد آزمايش قرار ميگيرد.
را فراهم کند براي شکستن گره انتخاب مي شود.(2)
SPRINT [1]
SPRINT يک دستهکننده درخت تصميم گيري براي داده کاوي است که قادر است تا با مجموعههاي آموزشي بزرگ بر روي ديسک کار کند بدون محدوديت بر روي اندازه مجموعه آموزشي، و به آساني قابل موازي سازي است. براي هر ويژگي در مجموعه داده ها يک ليست نگهداري مي شود. وروديها در يک ليست ويژگي شامل مقادير ويژگي، مقادير دسته و شناسه رکورد(RID) است. الگوريتم اين دستهکننده يک درخت درهم[2] مناسب با اندازه مجموعه آموزشي استفاده ميکند تا RIDها را ذخيره کند.
روش کار: روش کار بصورت زير خلاصه شده است:
هر گره از دستهکننده درخت تصميمگيري نياز دارد تا بطور کارا تمام شکستهاي آن روي هر مقدار از هر ويژگي آن آزمايش گردد.
بعد از انتخاب يک ويژگي براي تقسيم، نياز است تا تمام دادهها درون زيرمجموعه بخشبندي شوند.
مادامي که تقسيم روي ويژگي هاي عددي ارزيابي شود، داده ها بر اساس مقدار ويژگي مرتب شده و بصورت افزايشي شاخص گذاري جيني محاسبه مي گردد.
مادامي که تقسيم روي ويژگي هاي قطعي(بي شرط) صورت گيرد، شاخص گذاري جيني براي هر زير مجموعه يافت ميشود و بهترين انتخاب مي گردد. براي مجموعه دادههاي بزرگ يک روش حريصانه به کار مي رود[2].
دستهکننده بيزي نامقيد[1]
برخلاف دستهکننده بيز ساده در اين مورد فرض مستقل بودن کلمات در نظر گرفته نمي شود. اين نوع يک نوع مشتق شده بصورت دستهکننده بيزي نيمه ساده است که متناوباً يک جفت از ويژگيها را بهم متصل مي کند تا فرضيات مستقل قوي را کاهش دهد. پياده سازي آن ساده است و نتايج آن نيز براحتي قابل تفسيرند. از طرف ديگر بخاطر فرض استقلال شروط کلمات محاسبات آن پيچيدگي نمايي دارد[3].
يادگيرندههاي برپايه نمونه
قوانين نزديکترين مجاور بر پايه مفهوم کمترين فاصله دستهها از نمونههاست و ميتواند هر يک از يک نمونه اوليه يا چندين نمونه اوليه را درگير کند. وقتي الگوي يک کلاس به يک قالب محکم مربوط به يک الگوي معرف نوعي براي تمام دسته ها تمايل داشته باشد، ما يک نمونه اوليه تکي از آنها را استفاده مي کنيم تا کمترين فاصله را محاسبه کنيم. اجازه دهيد نمونه اوليه براي دستههاي باشد، بطوريکه فاصله بين نمونهي قراردادي بردار و امين نمونه اوليه داده شده توسط بيان ميشود.
وقتي يک اندازه گيري غير اقليدسي شبيه فاصله Mahalanobis استفاده شود، مشابه دستهکننده کمترين فاصله دستهکننده Mahalanobis ناميده مي شود. داريم:
INSTANCE-BASED LEARNERS typical representative
دستهکننده هاي فاصله کمينه
در اين گروه از قوانين تصميمگيري، فرضيهسازي از يک توزيع احتمال صورت نمي گيرد. دستهکننده فاصله کمينه، فاصله يک نمونه را از الگوي اوليه هر دسته محاسبه مي کند و نمونه را به دسته اي که نزديکتر از بقيه است نسبت مي دهد. Minimum distance classifiers
ارزيابي الگوريتمهاي دستهبندي
الگوريتمهاي دستهبندي بر اساس دو اصطلاح سرعت[1] و دقت[2] ارزيابي ميشوند. سرعت دستهکننده بايد بطور جداگانه براي دو وظيفه متفاوت ارزيابي گردد: يادگيري (آموزش يک دستهکننده) و دستهبندي نمونههاي جديد. ملاک بسياري از ارزيابيها براي دستهبندي بر اين هدف بيان شده است. ملاکهاي دقت و فراخواني نيز اغلب ذکر شده است.
آستانه تصميم در الگوريتمهاي دستهبندي مي تواند به منظور توليد دقت بالاتر اصلاح گردد يا برعکس. در مورد دستهبندي تکي[3] تعدادي از محققين يک اندازه نرخ خطايي را گزارش کرده اند که درصد اسناد دسته نشده است.
مهم است که به اين قضيه توجه شود که کارايي دستهکننده تا حد زيادي به تقسيم[4] تنه اصلي[5] در دادههاي آموزشي و آزمايش دارد. آزمايش دستهکننده روي دادههاي آموزشي که براي يادگيري دستهکننده استفاده مي شود اغلب منجر به توليد نتايج بهتري ميگردد. مسأله و مشکل در ارزيابي دستهکنندهها وابستگي دامنه آنهاست. هر دستهکننده يک زير دامنه براي اظمينان بيشتر[6] دارد. به منظور غلبه بر اين مطلب چندين دستهکننده يادگيرنده ترکيب شدند تا منجر به ايجاد دستهبندي دقيقتري گردند[2].
Kan and Ti نشان دادند که به جاي استخراج اطلاعات از محتوي صفحات يک صفحه وب مي تواند بر اساس آدرس URLاش دستهبندي شود. اين ديدگاه مخصوصاً زماني سودمند است که محتوي صفحات در دسترس نيست يا راندمان زمان و حافظه به شدت مهم است[1].
تحليل تصويري
هر صفحه وب دو نوع نمايش دارد. يکي نمايش متني نوشته شده در HTML است و ديگري نمايش تصويري ايجاد شده توسط مرورگر وب. اين دو نوع نمايش ديدهاي متفاوتي از صفحه را ايجاد ميکنند. بيشتر ديدگاهها بر روي نمايش متني متمرکزند در حالي که اطلاعات بصري را ناديده ميگيرند. با اين وجود نمايش بصري نيز ميتواند مفيد واقع شود .
يک رويکرد دستهبندي وب بر اساس تحليل تصويري توسط Kovacevic و گروهش ارائه شد که در آن هر صفحه وب توسط يک گراف چندگانه مجاورتي بصري سلسله مراتبي نمايش داده مي شود[10]. در اين گراف هر گره بعنوان يک شي HTML نمايش داده ميشود و هر لبه پيوند فضايي در نمايش بصري را نشان ميدهد. بر مبناي نتايج حاصل از تحليل بصري، يکسري قوانين ابتکاري بکار مي روند تا محيطهاي منطقي چندگانه را تشخيص دهند که با قسمتهاي معنيدار متفاوت از صفحه مطابق است. آنها اين ديدگاه را با ديدگاه يک مشت کلمه مقايسه کردند و بهبود فوق العادهاي را نشان دادند(جدول2).
Visual analysis heuristic rules
شکل(7) : يک نما که لينک، متن لنگرو مفهوم متن دربرگيرنده متن لنگر را نشان مي دهد.
استفاده از چند نوع از مجاورين نيز مي تواند مزاياي بيشتري را فراهم آورد. Qi و Davison يک روش براي تسهيل دستهبندي صفحات وب توسط استفاده از دسته و اطلاعات محتواي صفحات مجاور در گراف پيوند[1] ارائه کردند. گروههايي که به نمايندگي از چهار نوع از صفحات مجاورين بودند (والد، فرزند، هم نژاد و همسر) با هم ترکيب شدند تا به صفحه مورد بحث کمک کنند. مطالعات آنها معلوم کرد که صفحات هم نژاد نسبت به ساير انواع مجاورين از درجه اهميت بيشتري برخوردارند و ارزش بيشتري دارند.
بطور خلاصه اگر چه تمام صفحات مجاور در دستهبندي مفيدند اما صفحات هم نژاد به عنوان بهترين منبع شناسايي شدهاند. از سوي ديگر اگر چه استفاده از اطلاعات صفحات مجاور ممکن است بسياري از اطلاعات اضافي را کاهش دهد اما بايد از آنها با دقت استفاده نمود.
همانطور که گفته شد در زمينه آزمايش اثرات صفحات با بيش از دو مرحله فاصله کار کمي انجام شده است. حداقل دو دليل براي اين قضيه ميتوان بيان نمود. اول اينکه به خاطر تعداد بسيار زياد (رو به انفجار) صفحات مجاور، استفاده از خصوصيات اين صفحات مجاور در يک فاصله طولاني گران است. دوم اينکه صفحات مجاور با فاصله بيشتر عموماً در مورد موضوع شباهت کمتري با صفحهاي دارند که ميخواهد دستهبندي شود پس از آنها کمتر در دستهبندي استفاده ميشود[1].
دانلود پاورپوینت آشنایی با طراحی صفحات وب
نتيجه
در اين مقاله ما مسائل مربوط به دستهبندي صفحات وب را مطرح کرديم. در دستهبندي صفحات وب اولين مسأله اين است که از چه رويکردي براي دستهبندي استفاده کرد. اين خصويات شامل خصوصيات داخل صفحه مثل تگها و ويژگيهاي تصويري و خصوصيات صفحات مجاور مي باشد. در اين زمان بايد توجه داشت که کدام يک از خصوصيات ميتواند به ما بيشتر کمک نمايد. مثلاً در صفحاتي که اطلاعات داخل خود صفحه کاملاً دقيق و مشخص است ديگر نيازي به استفاده از خصوصيات صفحات مجاور نيست زيرا اين امر موجب اتلاف هزينه زيادي ميگردد. پس از انتخاب خصوصيت و رويکرد مورد نظر نوبت به انتخاب روش دستهبندي ميرسد. در اين جا ميتوانيم يکي از روشهاي ذکر شده در مقاله را بکار ببريم(البته روشهاي ديگري نيز براي اين کار وجود دارد)، اما بايد يکسري مسائل مربوطه را نيز در نظر بگيريم. مثلاً در درختهاي تصميمگيري نيازي به دانش اوليه نداريم ولي در دسته کنندههاي بيزي بايد يکسري احتمالات اوليه را داشته باشيم که بايد در اين گونه موارد موازنهاي ميان هزينه و سرعت انجام گيرد. ضمناً بايد يکسري مسائل در مورد دقت و سرعت را نيز در نظر گرفت مثلاً در جايي که دقت براي ما مهمتر از زمان است مي توانيم از دستهکنندهاي استفاده کنيم که زمان آموزش و آزمايش زيادي را مي گيرد اما داراي دقت بالايي است. اصولاً در اين گونه موارد نيز يک موازنه بين سرعت و دقت برقرار ميشود تا نتيجه مطلوبي حاصل گردد. برای مقايسه تکنيکها و رويکردها نياز به مقايسه آماری تکتک آنهاست که خارج از بحث اين مقاله است زيرا ترکيبات آنها حالتهای بسيار زيادی را به وجود خواهد آورد اما توجه به شرايط پيش رو در موارد خاص کمک بسيار زيادی به ما در دستهبندی مطلوب خواهد نمود.
30 تا 70 درصد پروژه | پاورپوینت | سمینار | طرح های کارآفرینی و توجیهی | پایان-نامه | پی دی اف مقاله ( کتاب ) | نقشه | پلان طراحی | های آماده به صورت رایگان میباشد ( word | pdf | docx | doc | )
تو پروژه یکی از بزرگ ترین مراجع دانلود فایل های نقشه کشی در کشو در سال 1394 تاسیس گردیده در سال 1396 کافه پاورپوینت زیر مجموعه تو پروژه فعالیت خود را در زمینه پاورپوینت شروع کرده و تا به امروز به کمک کاربران و همکاران هزاران پاورپوینت برای دانلود قرار داده شده
با افتخار کافه پاورپوینت ساخته شده با وب اسمبلی