علی منصوری، فاطمه زرمهر، حسین کارشناس،
دوره 7، شماره 1 - ( 3-1399 )
چکیده
زمینه و هدف : در این پژوهش چهار روش متنکاوی بررسی میشود و بر درک و شناسایی خصوصیات و محدودیتهای آنها در کشف موضوع تمرکز میکند. این چهار روش عبارتاند از 1) تجزیهوتحلیل معنایی پنهان(LSA) 2) تحلیل معنایی پنهان احتمالاتی(PLSA)، 3) تخصیص دیریکله پنهان(LDA) و 4) مدلسازی موضوعی همبسته(CTM).
روش پژوهش: پژوهش حاضر از نوع کتابخانهای است که در آن، ادبیات حوزه متنکاوی و مدلسازی موضوعی مرور و تحلیل شده است.
یافتهها: تجزیهوتحلیل معنایی پنهان میتواند برای تشخیص موضوعات خاص و منحصربهفرد در مدارکی که تنها به یک موضوع پرداختهاند استفاده شود. سه روش دیگر متنکاوی، بر موضوعات و گرایش کلی متن متمرکز هستند. تحلیل معنایی پنهان احتمالاتی برای مدارکی که به یک موضوع پرداختهاند قابلاستفاده است اما برخلاف تجزیهوتحلیل معنایی پنهان ، این روش در کشف موضوعات و مضامین کلی متن کاربرد دارد. درحالیکه تخصیص دیریکله پنهان در مورد مدارکی که به چندین موضوع پرداختهاند کاربرد بیشتری دارد. روش مدلسازی موضوعی همبسته میتواند در تشخیص ارتباط بین دستههای موضوعی مختلف استفاده شود.
نتیجهگیری: رویکردهای متنکاوی به خاطر بهرهگیری از تحلیل معنایی در کشف و استخراج موضوع متون مناسب است