نصرت ریاحی نیا، فرزانه شادانپور، کیوان برنا، غلامعلی منتظر،
دوره 9، شماره 3 - ( 7-1401 )
چکیده
زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتابهای الکترونیکی فارسی حوزۀ علوم با استفاده از مدلسازی موضوعی ال. دی. اِی.، سنجش شباهت کلیدواژههای خروجی با کلیدواژههای استاندارد و ارزیابی کاربران از کلیدواژههای استخراجشده بهصورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهشهای متنکاوی و به جنبۀ روشهای مورداستفاده در آن پژوهش آمیخته است. از مدلسازی موضوعی ال. دی. اِی. برای استخراج کلیدواژه از فهرستهای مندرجات کتابها استفادهشده و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافتهها: فهرستهای مندرجات مورد بررسی با میانگین پیراسته ۲۶۰.۰۲ کلمه از متون با طول متوسط محسوب میشوند و حدود ۲۰ درصد از کلمات آنها را ایستواژهها تشکیل دادهاند. میان کلیدواژههای استاندارد سرعنوانی و کلیدواژههای خروجی مدل ال. دی. اِی. کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژههای خروجی مدل موضوعی ال. دی. اِی. حوزه موضوعی کل پیکره را نشان میدهند، اما ازنظر کاربران به ترتیب کلیدواژههای سرعنوانی استاندارد، کلیدواژههای مستخرج از مدل در زیرحوزههای موضوعی و کلیدواژههای مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفقاند.
نتیجهگیری: کلیدواژههای بهدستآمده از مدل موضوعی ال. دی. اِی. را میتوان در مجموعههای ناشناخته بهمنظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق موضوع به مدرک در پیکرههای بزرگ با موضوعات ناهمگن و متنوع، نمیتوان از این روش استفاده کرد. این روش در رویههای رسمی توصیف موضوعی تکتک مدارک بهصورت مستقل میتواند بهعنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایهساز به کار گرفته شود.