فروشگاه تخصصی علمی آموزشی فایل ویکی تمامی رشته ها فایل ویکی1 دروس تخصصی موفقیت پاورپوینت ارتباط با ما دانلود

دانلود پاورپوینت شرح کار پروژه دادگان وابستگی زبان فارسی

دانلود پاورپوینت شرح کار پروژه دادگان وابستگی زبان فارسی

دادگان زبانی در زبان‌شناسی رایانه‌ای:

امروزه در عمدۀ روش‌های هوشمند پردازش زبانی از دادگان و پیکره‌های متنی برچسب‌دار استفاده می‌شود.
با وجود هزینۀ زیاد برای آماده‌سازی پیکره‌ها، پروژه‌های بسیاری در زبان‌های مختلف تعریف شده است.
در رویکردهای مبتنی بر پیکره‌ها نتایج پردازشی بهتری نسبت به رویکردهای مبتنی بر قاعده به دست آمده است.
در پروژه‌های اخیر پژوهش‌های دفاعی ایالات متحده، یکی از دغدغه‌های اصلی در پردازش هوشمند متون، فرایند تهیۀ دادگان زبانی اعلام شده است.
انتخاب نظریۀ زبانی مناسب برای تهیۀ پیکره‌های زبانی از اهمیت بسیار زیادی برخوردار است
 
هزینۀ مربوط به تهیۀ پیکره‌های زبانی:
معمولاً تهیۀ پیکرۀ زبانی هزینه‌های بسیار زیادی را از نظر زمانی و نیروی انسانی در بر می‌گیرد.
به عنوان مثال دو مرحله از تهیۀ پیکرۀ درختی چینی در مجموع 5 سال به طول انجامید.
برای این که پیکرۀ متنی نمایندگی کافی برای دادگان زبانی داشته باشد، باید اطلاعات اولیۀ مناسبی در مورد ویژگی‌های زبانی کسب کرد که این خود فرایندی زمان‌بر است.
 
زبان فارسی و رایانه:
با توجه به دغدغه‌های موجود در زبان فارسی، پروژه‌هایی با حمایت دبیرخانۀ شورای عالی اطلاع‌رسانی شکل گرفت.
پروژۀ ویراستیار اولین گام جدی در کاربردی کردن مسائل علمی دنیای پردازش متن در نرم‌افزارهای زبان فارسی بوده است.
پس از اتمام نسخۀ 1 ویراستیار دغدغه‌های پردازشی برای تحلیل نحو و معنا در زبان فارسی به وجود آمد.
 
نتایج حاصل از تحقیقات:
برای پردازش نحو در زبان فارسی نیاز به دو مسألۀ اساسی است:
انتخاب یک نمایش زبانی مناسب و اصولی با توجه به خاصیت‌های زبان فارسی
نیاز جدی به یک پیکرۀ برچسب‌خوردۀ نحو در زبان فارسی
در 28 زبان زندۀ دنیا چنین پیکره‌ای وجود داشته است.
 
وضعیت دادگانی امروز در نحو زبان فارسی:
تا آن زمان تنها پیکرۀ برچسب‌خوردۀ مناسب برای فهم زبان فارسی، پیکرۀ متنی بی‌جن‌خان بوده است.
تنها در آن اطلاعات ساخت‌واژی زبان برچسب خورده است و اطلاعاتی در مورد ساختار نحوی و معنایی جملات وجود ندارد.
 
انتخاب بازنمایی نحوی مناسب:
هم‌اکنون دو نوع بازنمایی مرسوم در پیکره‌های نحوی و معنایی زبانی در دنیا وجود دارد:
.1دستور زایشی: مانند پیکرۀ درختی پن، در این نوع از نمایش، جمله به عبارت‌هایی و عبارات به زیرعبارات و زیرعبارت‌ها به واژه‌ها تقسیم‌بندی می‌شوند.
.2دستور وابستگی: مانند پیکرۀ وابستگی پراگ که در این نوع از نمایش، ارتباط‌های وابستگی بین واژه‌ها مشخص می‌شود.
 
مقایسۀ بازنمایی زایشی و وابستگی:
در هر دو نوع از بازنمایی می‌توان سطح نحو و معنا را پوشش داد.
در بازنمایی وابستگی امکان نشان دادن جملات با بی‌ترتیبی زبانی نسبت به بازنمایی زایشی بیش‌تر و مناسب‌تر است.
به همین دلیل در زبان‌های بی‌ترتیب مانند چکی، ترکی و عربی پیکره‌های وابستگی ترجیح داده شده‌اند.
در زبان فارسی نیز بی‌ترتیبی وجود دارد.
پیکره‌های با بازنمایی دستور وابستگی قابل تبدیل به پیکرۀ زایشی هستند ولی عکسِ این مسأله به صورت صد در صد امکان‌پذیر نیست.
دستور وابستگی به نمایش انسانی نزدیک‌تر است.
در دستور وابستگی بسیاری از اطلاعات واژگانی (مانند ظرفیت نحوی و معنایی) را می‌توان به طور صریح در کمان‌های وابستگی نشان داد.
با وجود این مسائل به این نتیجه رسیده‌ایم که دستور وابستگی را به عنوان بازنمایی نحوی پیکرۀ زبان فارسی برگزینیم.
 
سرنخ تحقیقات: Valency:
این اصطلاح در کتاب «Dependency Parsing» دیده شد و با توجه به غریب بودن این مطلب تحقیقات در جهت شناخت این مسأله به وجود آمد.
در نهایت کتاب «ظرفیت فعل در زبان فارسی» به عنوان تنها کتاب مربوط به زبان فارسی پیدا شد.
 
مفهوم ظرفیت واژگانی در زبان:
واژه‌ها نیز مانند عناصر دارای ظرفیت هستند.
هر واژه‌ای دارای ظرفیت ترکیب نحوی/معنایی خاصی است.
 
کاربرد زبانی ظرفیت واژگانی:
با دانستن ظرفیت واژه‌ها می‌توان تولید زبان انجام داد.
ترجمۀ خودکار (Machine Translation)
تحلیل نحوی (Syntactic Analysis)
تولید زبان (Language Generation)
 
دستور وابستگی:
در دستور وابستگی مبنا روابط نحوی/معنایی بین واژه‌های درون جمله است.
در این دستور مفهوم گروه معنا ندارد.
واژه‌ها بر اساس ظرفیتشان و نوع قرار گرفتن در جمله وابسته‌هایی می‌گیرند.
 
مقایسۀ اجمالی با دستور زایشی:
در دستور زایشی (Generative)، با گروه‌ها سر و کار داریم.
دستور مستقل از متن (CFG)
دستور مبتنی بر عبارات
امکان وجود بی‌ترتیبی در جملات وجود ندارد
در دستور وابستگی با واژه‌ها سر و کار داریم.
امکان بی‌ترتیبی در جملات وجود دارد.
 
درخت‌های وابستگی:
فرض‌های زبانی متفاوتی در مورد درخت‌های وابستگی می‌شود.
فرض‌های ما
درخت وابستگی بدون دور است.
هر جمله دارای یک واژۀ فرضی به عنوان ریشۀ جمله است.
هر واژه (غیر از ریشۀ جمله) تنها یک هسته دارد.
درخت‌های وابستگی دو نوع هستند
افکنشی (Projective)
هیچ کمانی دیگری را در صورت رسم کمان‌ها از یک سمت بر روی کاغذ قطع نمی‌کند.
غیرافکنشی (Non-projective)
ممکن است کمانی باشد که برخی دیگر از کمان‌ها را قطع کرده باشد.
در جملات بی‌ترتیب زبانی دیده می‌شود.
 
 شامل 58 اسلاید POWERPOINT

اشتراک بگذارید:


پرداخت اینترنتی - دانلود سریع - اطمینان از خرید

پرداخت هزینه و دریافت فایل

مبلغ قابل پرداخت 7,000 تومان

درصورتیکه برای خرید اینترنتی نیاز به راهنمایی دارید اینجا کلیک کنید


فایل هایی که پس از پرداخت می توانید دانلود کنید

نام فایلحجم فایل
POWERPOINT_1810877_7937.zip3.1 MB





آخرین محصولات فروشگاه