صفحه نخست درباره پروژه
درباره پروژه
دقت سیستم PDF چاپ نامه الکترونیک
نوشته شده توسط محمد مهدي مجيري   

وزن، نظم و تناسب خاصي است در اصوات شعر (=هجاها) اين نظم و تناسب اصوات به انحاي گوناگون نزد ملل مختلف مبين نوعي آهنگ و موسيقي است. وزن شعر فارسي مبتني بر توالي‌هاي خاصي از هجاهاي کوتاه و بلند در يک مصراع و تکرار عين آن در مصراع‌هاي ديگر است. بنابراين وزن شعر فارسي مجموعه‌اي از هجاهاي کوتاه و بلند است که با نظم مشخصي پي در پي قرار گرفته باشد. هر نظم خاص، وزن خاصي را به ذهن متبادر مي‌کند. پس: شعر فارسي به طور کلي مبتني بر کميت (کوتاه و بلندي) هجاهاست. (شميسا، سيروس، آشنايي با عروض و قافيه)

سیستمی که هم اکنون در این وبگاه قرار داده شده است، نسخه 1.10 می‌باشد، در این نسخه ما توانسته‌ایم برای31 وزن معروف فارسی به دقت 70% و برای 8 وزن پرکاربرد به دقت 80% درصد برسیم. در برازندگی‌های بالای 90 دقت سیستم به بیش از 90% رسیده است.

در این سیستم شما با وارد کردن یک بیت شعر سنتی فارسی، علاوه بر وزن عروضی و تقطیع شعر، می‌توانید اختیارات شاعری استفاده شده در شعر را مشاهده نمایید.

آخرین به روز رسانی در شنبه ۲۱ شهریور ۱۳۸۸ ساعت ۰۷:۵۳
 
مقالات و گزارشات PDF چاپ نامه الکترونیک
نوشته شده توسط محمد مهدي مجيري   

اعتقاد ما بر اين است که براي پيشرفت و ارتقاي علمي کشور، بايد از کار موازي پرهيز کرد. بنابر همين عقيده در اين وبگاه تمامي نتايج به دست آمده و همچنين داده‌هاي توليدي قرار داده مي‌شود، تا ديگر محققان بتوانند از نتايج اين تحقيقات استفاده کرده و همچنين بدون انجام کارهايي که قبلا انجام شده، تحقيقات را ادامه دهند.

در اين بخش گزارشاتي که از کار آماده شده است به همراه مقالات و ياداشت‌هايي که احساس شود براي محققان مفيد است، قرار داده مي‌شود.

Attachments:
Fileتوضیحاتنوع فايلFile sizeآخرین ویرایش
Download this file (KashanU-Presentation-01.pptx)ارائه در دانشگاه کاشان PPTX2476 Kb۰۹/۰۷/۲۰ 15:19
Download this file (Doc-001.pdf)گزارش شماره 1 محمد مهدي مجيري، پروژه پاياني کارشناسي: سيستم هوشمند تشخيص وزن عروضي اشعار فارسي، دانشگاه کاشان ، مردادماه 1387 PDF3418 Kb۰۹/۰۷/۲۰ 15:18
Download this file (Lecture-001.pdf)سيستم هوشمند تشخيص وزن عروضي اشعار فارسي: کاربرد جديدي از متن کاوي محمد مهدي مجيري، بهروز مينايي، کنفرانس ملي داده‌کاوي ايران، 21 و 22 آبان 1387 دانشگاه اميرکبير PDF279 Kb۰۹/۰۷/۱۸ 16:22
آخرین به روز رسانی در شنبه ۲۱ شهریور ۱۳۸۸ ساعت ۰۷:۵۴
 
داده‌ها PDF چاپ نامه الکترونیک
نوشته شده توسط محمد مهدي مجيري   

يکي از مشکلات موجود بر سر تحقيقات فارسي نبود يک مجموعه داده براي آزمايش برنامه‌هاي توليدي مي‌باشد. در صورتي که انواع مجموعه داده‌ها به زبان انگليسي بر روي فضاي سايبر وجود دارد. در مورد اين پروژه خاص نيز اين مشکل وجود داشت. به همين دليل بر آن شديم که يک مجموعه داده مناسب براي اين پروژه طراحي بنماييم. براي اين کار از اشعار ديوان غزليات خواجه حافظ شيرازي و ديوان شمس مولانا جلال الدين استفاده کرديم.

براي يافتن اوزان اشعار در مورد ديوان حافظ، از ديوان حافظ دکتر خطيب رهبر و همچنين کتاب استاد حسين آهي استفاده کرديم. و در مورد ديوان شمس از خانم ده‌نمکي يکي از اساتيد ادبيات کمک گرفتيم، که جا دارد در اين جا باز هم از زحمات ايشان قدرداني نمايم. ايشان وزن عروضي بيش از 450 غزل از اين مجموعه را استخراج نمودند.

با حذف موارد اختلافي و استفاده از يک انتخاب تصادفي نزديک به 1300 بيت از اشعار حافظ و مولانا همراه با کد وزن آنها به صورت قالب استاندارد تعريفي درآورديم. يکي از مواردي که در ساخت اين مجموعه داده مورد توجه قرار گرفته تعداد هر کد وزن است. تعداد هر کد وزن بسته به کاربرد هر وزن تعيين شده، مثلا براي کد وزن 1002 که پرکاربردترين وزن فارسي است بيشترين تعداد بيت در نظر گرفته شده است. براي بالا بردن دقت اوزان انتخابي تمامي ابيات انتخابي دوبار بررسي گرديده است.

نسخه 1/00 مجموعه داده و همچنين ديوان شمس، غزليات حافظ و مثنوي مولانا از همين پايگاه وب قابل دريافت است. همچنين مجموعه کلمات زبان فارسي به همراه تلفظ و ديگر خصوصيات کلمات هم قابل دريافت هستند. اين مجموعه کلمات از برنامه متن‌باز «واژگان زاياي زبان فارسي» استخراج شده‌اند.

Attachments:
Fileتوضیحاتنوع فايلFile sizeآخرین ویرایش
Download this file (DS-v2.00.rar)مجموعه داده نسخه 2.00تعداد ابيات نسبت به نسخه قبل تغييري نکرده است. تغييرات جديد عبارتند از: درهم سازي مجموعه به وسيله Close Hash و جداسازي مجموعه Train و Test، توضيحات بيشتر در فايل Comment.doc داخل همين مجموعه موجود استRAR59 Kb۰۹/۰۷/۲۰ 15:26
Download this file (DS-v1.00.rar)مجموعه داده نسخه 1.00شامل حدود 1300 بيت از اشعار مولانا و حافظ به همراه کد وزن آنها، توضيحات بيشتر در فايل Comment.doc داخل همين مجموعه موجود است RAR53 Kb۰۹/۰۷/۲۰ 15:26
Download this file (FLEXICON.rar)مجموعه کلماتمجموعه کلمات برنامه متن باز «لغات زاياي زبان فارسي» شامل بيش از 50000 کلمه فارسي به همراه تلفظ آنها و نوع کلمه. شامل مجموعه‌اي از پيشوندها و پسوندهاي فارسي.RAR1771 Kb۰۹/۰۷/۲۰ 15:25
Download this file (Shams-01.rar)ديوان شمسديوان غزليات شمس، مولانا جلال الدين محمد بلخي. به صورت هفت فايل Word. به همراه فهرست غزل‌ها بر اساس مطلع غزليات. RAR1163 Kb۰۹/۰۷/۲۰ 15:25
Download this file (Hafez-01.rar)ديوان حافظ شامل 495 غزل خواجه حافظ شيرازي به صورت يک فايل HTM. RAR133 Kb۰۹/۰۷/۲۰ 15:25
Download this file (Masnavi-01.rar)مثنوي معنويشامل شش دفتر مثنوي تايپ و تصحيح توسط حسين ُکرد از روي نسخه "کلاله خاور". به صورت شش فايل Word. به همراه فهرست بر اساس مطلع اشعار. دريافت شده از سايت www.guidinglights.orgRAR1079 Kb۰۹/۰۷/۲۰ 15:22
Download this file (Masnavi-02.rar)مثنوي معنويشامل شش دفتر مثنوي تايپ و تصحيح توسط حسين ُکرد از روي نسخه "کلاله نيکلسون". به صورت شش فايل Word. به همراه فهرست بر اساس مطلع اشعار. دريافت شده از سايت www.guidinglights.org RAR759 Kb۰۹/۰۷/۲۰ 15:21
آخرین به روز رسانی در سه شنبه ۱۷ شهریور ۱۳۸۸ ساعت ۰۶:۳۷