2 نتیجه برای مدلسازی موضوعی
علی منصوری، فاطمه زرمهر، حسین کارشناس،
دوره 7، شماره 1 - ( 3-1399 )
چکیده
زمینه و هدف : در این پژوهش چهار روش متنکاوی بررسی میشود و بر درک و شناسایی خصوصیات و محدودیتهای آنها در کشف موضوع تمرکز میکند. این چهار روش عبارتاند از 1) تجزیهوتحلیل معنایی پنهان(LSA) 2) تحلیل معنایی پنهان احتمالاتی(PLSA)، 3) تخصیص دیریکله پنهان(LDA) و 4) مدلسازی موضوعی همبسته(CTM).
روش پژوهش: پژوهش حاضر از نوع کتابخانهای است که در آن، ادبیات حوزه متنکاوی و مدلسازی موضوعی مرور و تحلیل شده است.
یافتهها: تجزیهوتحلیل معنایی پنهان میتواند برای تشخیص موضوعات خاص و منحصربهفرد در مدارکی که تنها به یک موضوع پرداختهاند استفاده شود. سه روش دیگر متنکاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی برای مدارکی که به یک موضوع پرداختهاند قابلاستفاده است اما برخلاف تجزیهوتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالیکه تخصیص دیریکله پنهان در مورد مدارکی که به چندین موضوع پرداختهاند کاربرد بیشتری دارد. روش مدلسازی موضوعی همبسته میتواند در تشخیص ارتباط بین دستههای موضوعی مختلف استفاده شود.
نتیجهگیری: رویکردهای متنکاوی به خاطر بهرهگیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است
نصرت ریاحی نیا، فرزانه شادانپور، کیوان برنا، غلامعلی منتظر،
دوره 9، شماره 3 - ( 7-1401 )
چکیده
زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتابهای الکترونیکی فارسی حوزۀ علوم با استفاده از مدلسازی موضوعی ال. دی. اِی.، سنجش شباهت کلیدواژههای خروجی با کلیدواژههای استاندارد و ارزیابی کاربران از کلیدواژههای استخراجشده بهصورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهشهای متنکاوی و به جنبۀ روشهای مورداستفاده در آن پژوهش آمیخته است. از مدلسازی موضوعی ال. دی. اِی. برای استخراج کلیدواژه از فهرستهای مندرجات کتابها استفادهشده و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافتهها: فهرستهای مندرجات مورد بررسی با میانگین پیراسته ۲۶۰.۰۲ کلمه از متون با طول متوسط محسوب میشوند و حدود ۲۰ درصد از کلمات آنها را ایستواژهها تشکیل دادهاند. میان کلیدواژههای استاندارد سرعنوانی و کلیدواژههای خروجی مدل ال. دی. اِی. کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژههای خروجی مدل موضوعی ال. دی. اِی. حوزه موضوعی کل پیکره را نشان میدهند، اما ازنظر کاربران به ترتیب کلیدواژههای سرعنوانی استاندارد، کلیدواژههای مستخرج از مدل در زیرحوزههای موضوعی و کلیدواژههای مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفقاند.
نتیجهگیری: کلیدواژههای بهدستآمده از مدل موضوعی ال. دی. اِی. را میتوان در مجموعههای ناشناخته بهمنظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق موضوع به مدرک در پیکرههای بزرگ با موضوعات ناهمگن و متنوع، نمیتوان از این روش استفاده کرد. این روش در رویههای رسمی توصیف موضوعی تکتک مدارک بهصورت مستقل میتواند بهعنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایهساز به کار گرفته شود.