در مقاله حاضر می کوشیم روشی خودکار برای تبدیل متون فارسی به زنجیره واجی ارائه دهیم. خط فارسی به دلیل دشواری های پردازشی ...
تبدیل متن فارسی به زنجیره واجی با استفاده از تحلیگر صرفی
نوشته : وحید مواجی و محرم اسلامی
چکیده
در مقاله حاضر می کوشیم روشی خودکار برای تبدیل متون فارسی به زنجیره واجی ارائه دهیم. خط فارسی به دلیل دشواری های پردازشی که دارد ورودی مناسبی برای برنامه های پردازش متن به حساب نمی آید. از ویژگی های خط فارسی می توان به عدم نمایش واه های کوتاه و به دنبال آن موضوع هم نوسیه گی ، مساله کسره اضافه، فاصله بین اجزای کلمه واحد، فقدان فاصله بین کلمه های مستقل، موضوع جدا نویسی و پیوسته نویسی و غیره اشاره کرد. برخورداری خط فارسی از ویژه گی های که برشمردیم موجب می شود قبل از انجام هرگونه پردازشی ، متون فارسی را به زنجیره واجی تبدیل کنیم. خروجی برنامه تبدیل متن به زنجیره واجی کاربردهای متعددی منجمله در تبدیل خودکار متن به گفتار، واج نویسی صحیح متون، آموزش زبان فارسی به غیر فارسی زبانان، فرهنگ نویسی و غیره دارد. در این مقاله با استفاده از تحلیلگر صرفی پارس – مورف که توسط نگارندگان طراحی و پیاده سازی شده است، متن ورودی از لحاظ صرفی تحلیل شده و اجزای صرفی آن از قبیل پیشوندها، پسوندها،اشتقاق و ترکیب بدست آمده و سپس با استفاده از واژگان زبان فارسی، صورت واجی آنها با هم ترکیب شده و در نهایت صورت واجی متن ورودی بدست می آید.
کلمات کلیدی
متن فارسی، زنجیره واجی، تحلیلگرصرفی، تبدیل متن به گفتار
درصورت نیاز به اصل مقاله عنوان مقاله را به آدرس ذیل ارسال نمایید.
hzahmatkesh@chmail.ir