فایل های مشابه شاید از این ها هم خوشتان بیاید !!!!
توضیحات محصول دانلود پاورپوینت تحلیل و بررسی انواع الگوریتم های ریشه یابی کلمات فارسی (کد14184)
دانلود پاورپوینت تحلیل و بررسی انواع الگوریتم های ریشه یابی کلمات فارسی
\nریشه یابی کلمات فارسی
\n\n عنوان های پاورپوینت :
\n\nتحلیل و بررسی انواع الگوریتم های ریشه یابی کلمات فارسی
\nریشه یابی کلمات فارسی
\nمقدمه
\nانواع الگوریتم های ریشه یابی
\nبررسی الگوریتم porter :
\nبررسی الگوریتم porter – مراحل روش
\nبررسی الگوریتم porter - فلوچارت
\nبررسی الگوریتم porter :
\nبررسی الگوریتم porter – نتایج اجرای این روش
\nالگوریتم کاظم تقوی برای زبان فارسی
\nارزیابی ریشه یاب فارسی کاظم تقوی
\nالگوریتم کراوتز
\nالگوریتم کراوتز بهبود یافته
\nایده اصلی
\nنتایج عملی
\n\n \n\n \n\n
\n\nقسمت ها و تکه های اتفاقی از فایل\n\n \n\nبررسی الگوریتم porter – نتایج اجرای این روش\n\nدر واژگانی با 10000 کلمه کاهش در اندازة ریشه بصورت مراحل زیر صورت می گیرد:\n\nSuffix stripping of a vocabulary of 10,000 words\n\nحدودا 3650 تا کاهش انجام شده ، که سرانجام واژگان ریشة حاصل شامل 6370 کلمة یکتاست . بنابراین این متد جداسازی پسوند، سایز واژگان را به یک سوم کاهش می دهد.\n\nالگوریتم کاظم تقوی برای زبان فارسی\n\nاین الگوریتم شباهت زیادی به الگوریتم پورتر در انگلیسی دارد. الگوریتم بر مبنای ریخت شناسی هستند.\n\nهر دو ریشه یاب به دنبال پسوندهای خاصی جستجو می کنند و مراحل مختلفی را بر طبق لیست قوانین پسوندی پشته گذاری شده طی میکنند. . با این حال تفاوتهای مهمی بین این دو الگوریتم وجود دارد.\n\nبرای مثال الگوریتم ریشه یاب پورتر به منظور تخمین محتوای اطلاعات، الگوی حروف صدادار و بی صدا را تشخیص می دهد؛ اما در فارسی بسیاری از حروف صدادار نوشته نمی شوند، بنابراین ریشه یاب فارسی از طول رشته برای تعریف کران پائین محتوای ریشه استفاده می کند.( در حال حاضر مینیمم طول ریشه 3 است).این محدودیت در بعضی موارد باعث خطا میگردد بخصوص زمانیکه یک زیررشته که قسمتی از یک کلمه کوتاه است ، به اشتباه به عنوان یک پسوند در نظر گرفته شود. تفاوت دیگر این دو الگوریتم ان است که این الگوریتم بر خلاف الگوریتم پورتر ، پیشوندها را هم شناسایی می کند.\n\nالگوریتم کاظم تقوی برای زبان فارسی\n\nDFA به صورت یک آرایه دوبعدی کُد می شود. ردیف ها نمایانگر حالات و ستون ها نمایانگر حروف ورودی هستند.\n\nDFA از پایان ورودی ریشه یاب شروع می کند و تا به سومین حرف از ورودی از ابتدا ادامه می دهد. DFA هرگز دو حرف ابتدای کلمه ( از سمت راست) را چک نمی کند. در هر دور درایورِ DFA با مشاهدة داده در ردیف s وستون l ، حالت بعدی را مشخص می کند.( s حالت فعلی و l کاراکتر ورودی است) هنگامیکه ماشین DFA به یک حالت نهایی می رسد، کلمه و شماره حالت به پَس پردازشگر برای حذف پسوند فرستاده می شود.\n\nالگوریتم کاظم تقوی برای زبان فارسی\n\nارزیابی ریشه یاب فارسی کاظم تقوی\n\nبه منظور ارزیابی این الگوریتم، اثر ان بر روی مقادیر precision/recall در سیستم بازیابی اطلاعات که متشکل از یک مجموعه کوئریِ فارسی و مجموعة ثابتی از اسناد بوده، بر مبنای مدل فضای برداری(VSM) مشاهده شده است.\n\nیک مجموعه که از 1647 سند فارسی که اغلباً فایلهای اینترنتی بوده اند مجموعة سند را تشکیل داده بود. یک لیست از 60 کوئریِ فارسی توسط فارسی زبانان محلی تهیه شد.\n\nالگوریتم کراوتز\n\nالگوریتم کراوتز برای اولین بار در سال 1993 در یک مقاله توسط کراوتز معرفی شد.\n\nاین الگوریتم از روشهای ریخت شناسی و از یک فرهنگ لغت برای آزمودن ریشه های یافت شده استفاده می کند.\n\nاین الگوریتم برای زبانهایی که ساخت کلمات در آنها قانونمند است، کارائی خوبی را نشان داده است.\n\nالگوریتم کراوتز پسوند و پیشوند کلمات را بررسی می کند و در ماشینهای مترجم کارائی خوبی را نشان داده است.\n\nاولین کاربرد این ایده برای زبان انگلیسی معرفی شده است. صرف افعال زبان انگلیسی و همچنین افزودن s/es به انتهای اسامی برای جمع بستن آنها مورد بررسی قرار می گیرد. همانطور که ملاحظه می شود این تغییرات نقش کلمات را تغییر نمی دهند، به همین دلیل برای ماشین های مترجم مناسب هستند.\n\nالگوریتم کراوتز\n\nالگوریتم کراوتز تعدادی از پسوندها را مورد بررسی قرار می دهد و در هر مرحله با زدودن پسوند یافت شده، ریشه بدست آمده را مورد بررسی قرار می دهد. در صورتیکه این ریشه در فرهنگ لغات موجود باشد، عمل ریشه یابی متوقف می شود.\n\nگاهی افزودن یک پسوند باعث تغییراتی در ساختار یک کلمه می شود برای کشف چنین کلماتی در صورتیکه ریشة کلمه در فرهنگ لغات نباشد، بر روی کلمه یک سری تغییراتی اِعمال می کند تا هنگامی که ریشه در فرهنگ لغات یافت شود.\n\nالگوریتم کراوتز بهبود یافته\n\nدر سال 2006 توسط رضا حسامی فرد و غلامرضا قاسم ثانی الگوریتمی بهبود یافته از الگوریتم کراوتز ارائه شد.\n\nدر این الگوریتم از نقش کلمات علاوه بر وجود یا عدم وجود آنها در فرهنگ لغت استفاده می کند.\n\nبه عنوان مثال در فرآیند ریشه یابی کلمة "being" ابتدا "bee" جستجو می شود که در فرهنگ لغت هم موجود می باشد. بنابراین به عنوان ریشه برگردانده می شد اما با توجه به اینکه bee یک اسم است نمی توان به آن پسوند ing افزود. بنابراین الگوریتم این ریشه را به عنوان ریشة اصلی انتخاب نمی کند و به این ترتیب با ادامة الگوریتم به ریشة درست کلمه که همان "be" است می رسیم.\n\nایده اصلی\n\nمسئله ای که در الگوریتم های فارسی به آن دقت نشده است این است که شرایط مسئله نیز در انتخاب پسوند تأثیرگذار هستند.\n\nاید اصلی توجه به شرایط کلمه در جداسازی پسوند می باشد.\n\nبرای این کار 10000 کلمه از مجله کامپیوتر سایت تبیان انتخاب شدند\n\nاین کلمات کاملا عامیانه هستند\n\nاین متون دارای حوزه های معنایی گسترده ای هستند\n\nاین متون توسط افراد مختلف تهیه شده اند\n\nکلمات به صورت دستی ریشه یابی شدند و نتایج آمار برروی شرایط مختلف این کلمات تحقیق شدند. از جمله شرایط مورد توجه موارد زیر بوده اند:\n\nحرف آخر\n\nتعداد حروف\n\nتعداد حروف صدادار\n\nنتایج عملی\n\nتعداد حروف بی صدا\n\nنوع حرف آخر از لحاظ با صدا یا بی صدا بودن و یا خواص دیگر قابل ذکر برای حروف\n\nتعداد هجاها\n\nنقش کلمه در جمله\n\nاین نتایج به صورت جداگانه بررسی شده اند\n\nدر گام بعد باید نتایج این معیارها را با هم ترکیب و نتیجه ای واحد به عنوان مجموعه قوانین اتخاذ گردند.\n\nساده ترین معیار بالا تأثیر حرف آخر کلمه در پسوند بودن یک ترکیب از حروف می باشد.\n\nدر 10000 کلمه بررسی شده 6276 مورد استفاده از پسوندها رخ داده بود.\n\nاز این میان پسوند «ی» با 2106 مورد و «ها» با 423 مورد بیشترینها بودند.\n\n \n\n \n\n30 تا 70 درصد پروژه | پاورپوینت | سمینار | طرح های کارآفرینی و توجیهی | پایان-نامه | پی دی اف مقاله ( کتاب ) | نقشه | پلان طراحی | های آماده به صورت رایگان میباشد ( word | pdf | docx | doc )