برچسب زنی اجزای گفتار

۱۳۹۴-۰۷-۲۲

یکی از کارهای اساسی در پردازش زبان طبیعی ، برچسب زنی اجزای گفتار می باشد .

برچسب زنی اجزای گفتار

راضیه احمدی

دانشگاه فردوسی ؛ دانشکده ادبیات و علوم انسانی دکتر علی شریعتی؛1389

شماره ثبت: 5831561
چکیده

یکی از کارهای اساسی در پردازش زبان طبیعی ، برچسب زنی اجزای گفتار می باشد . برچسب زنی ، تعیین مقوله های دستوری برای هر نماد در متن می باشد .

در برچسب زنی دو حوزه ساختواژه و نحو زبان برای تعیین مقوله های دستوری با یکدیگر تعمل دارند . تحلیل های ساخنواژی ، یکی از مسائل اصلی در تحلیل های رایانه ای متون فارسی است و پردازش متون رایانه ای فارسی را با مشکلاتی روبرو کرده است ، از جمله این مشکلات ، شناسایی واژه های ناشناخته در متن و مشکلات خط فارسی می باشد .

برای برچسب زنی ، سیستمهای متفاوتی با الگوریتمهای متفاوت وجود دارد ، از جمله این سیستمها ، سیستم برچسب زن گیت (gate )می باشد که در این پژوهش ، به بررسی برچسب زنی و مشکلات مربوط به آن پرداخته می شود . الگوریتم بکار رفته در این سیستم الگوریتم هپل (Hepple ) می باشد که ترکیبی از دو رویکرد آماری و قاعده بنیاد است . در سیستمهای برچسب زنی از پیکره های برچسب گذاری شده استفاده می شود . دراین سیستم ، از پیکره برچسب گذاری شده بی جن خان که تقریبا شامل دو میلیون و پانصد هزار واژه و 550 برچسب می باشد، استفاده شده است . قابل ذکر می باشد که مجموعه برچسب زیاد ، برچسب زنی را با مشکل مواجه می کند ، به همین دلیل در این پژوهش از 40 مجموعه برچسب کاهش یافته از 550 برچسب بی جن خان استفاده شده است .

دراین سیستم ، برچسب زنی روی متون استاندارد از روزنامه همشهری صورت گرفته است و سعی بر این است که در این متون ، مشکلات مربوط به تحلیل رایانه ای متون فارسی حل شود . نتیجه ارزیابی و دقت سیستم دراین متون 97 درصد می باشد . هدف بعدی این است که سیستم درمورد متون غیر استاندارد نیز به نتیجه مطلوبی برسد . دقت سیستم برای این متون 92 در صد می باشد که در مقایسه با متون استاندارد ، دقت مطلوبی است .

کلیدواژه : برچسب زنی ، نماد خوانی، واژه های ناشناخته ، خط فارسی ، الگوریتم قاعده بنیاد ، الگوریتم آماری

برچسب ها:

برچسب زنی ، نماد خوانی، واژه های ناشناخته ، خط فارسی ، الگوریتم قاعده بنیاد ،الگوریتم آماری

سازندگان:

زحمتکش

منابع:

کتابخانه تخصصی ادبیات آستان قدس رضوی

افزودن دیدگاه جدید:

چهل حدیث از امام جعفرصادق (علیه السلام)

خف الله كأنك تراه و إن كنت لا تراه فإنه يراك امام جعفر صادق (ع) : چنان از خدا بترس كه گويا او را مي بيني و اگر تو او را نمي بيني او تو را مي بيند . اصول كافي ، ج 3 ، ص 110

سال نو مبارک

نوبهار است در آن کوش که خوشدل باشی که بسی گل بدمد باز و تو در گل باشی

نظامی گنجوی

بهاری داری از وی بر خور امروز که هر فصلی نخواهد بود نوروز گلی کو را نبوید آدمی زاد چو هنگام خزان آید برد باد

حلول ماه نزول رحمت خدا مبارک

این دهان بستی دهانی باز شد تا خورنده لقمه‌های راز شد لب فروبند از طعام و از شراب سوی خوان آسمانی کن شتاب گر تو این انبان ز نان خالی کنی پر ز گوهرهای اجلالی کنی طفل جان از شیر…

هوشنگ ابتهاج

‏گاهی چُنان در این شب ِ تب‌کرده‌ی ِ عبوس ‏پای ِ زمان به قیر فرو می‌رود که مَرد ‏اندیشه می‌کند ‏شب را گذار نیست ‏اما به چشم‌های ِ تو‌ ‏ای چشمه‌ی ِ امید! ‏شب پایدار نیست. هوشنگ…

سعدی

به تو حاصلی ندارد غَمِ روزگار گفتن که شبی نَخُفته باشی به درازنای سالی

مولانا

چون که اسرارت نهان در دل شود ** آن مرادت زودتر حاصل شود

نظرسنجی

تصاویر شاعران

مطالب پربازدید

آشنایی با مولفه های ادبیات داستانی پست مدرن

وحشی بافقی و داستان عشق وی

شعر کم نظیر شهریار در مورد امام حسین علیه السلام

This block is broken or missing. You may be missing content or you might need to enable the original module.

سازمان کتابخانه ها،موزه ها و مرکز اسناد آستان قدس رضوی

کتابخانه تخصصی ادبیات آستان قدس رضوی

متن ساده

HTML محدود

نظر شما در مورد مطالب این وب سایت چیست؟