مقاله انگلیسی رایگان در مورد ساخت سلسله مراتب و دسته بندی متن – الزویر ۲۰۱۸

مقاله انگلیسی رایگان در مورد ساخت سلسله مراتب و دسته بندی متن – الزویر ۲۰۱۸

 

مشخصات مقاله
ترجمه عنوان مقاله ساخت سلسله مراتب و دسته بندی متن بر مبنای استراتژی آزادسازی و مدل حداقل اطلاعات
عنوان انگلیسی مقاله Hierarchy construction and text classification based on the relaxation strategy and least information model
انتشار مقاله سال ۲۰۱۸
تعداد صفحات مقاله انگلیسی  ۸ صفحه
هزینه دانلود مقاله انگلیسی رایگان میباشد.
پایگاه داده نشریه الزویر
نوع نگارش مقاله
مقاله پژوهشی (Research article)
مقاله بیس این مقاله بیس نمیباشد
نمایه (index) scopus – master journals – JCR
نوع مقاله ISI
فرمت مقاله انگلیسی  PDF
ایمپکت فاکتور(IF)
۴٫۸۴۴ در سال ۲۰۱۷
شاخص H_index ۱۴۵ در سال ۲۰۱۹
شاخص SJR ۱٫۲۷۱ در سال ۲۰۱۷
شناسه ISSN ۰۹۵۷-۴۱۷۴
شاخص Quartile (چارک) Q1 در سال ۲۰۱۷
رشته های مرتبط  مدیریت
گرایش های مرتبط  مدیریت فناوری اطلاعات
نوع ارائه مقاله
ژورنال
مجله / کنفرانس Expert Systems with Applications
دانشگاه Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China
کلمات کلیدی دسته بندی سلسله مراتب، استراتژی آزاد سازی، نظریه حداقل اطلاعات، وزن دهی واژه
کلمات کلیدی انگلیسی Hierarchy classification, Relaxation strategy, Least Information Theory, Term weighting
شناسه دیجیتال – doi
https://doi.org/10.1016/j.eswa.2018.02.003
کد محصول E11809
وضعیت ترجمه مقاله  ترجمه آماده این مقاله موجود نمیباشد. میتوانید از طریق دکمه پایین سفارش دهید.
دانلود رایگان مقاله دانلود رایگان مقاله انگلیسی
سفارش ترجمه این مقاله سفارش ترجمه این مقاله

 

فهرست مطالب مقاله:
Outline
Highlights
Abstract
Keywords
۱٫ Introduction
۲٫ Related work
۳٫ Hierarchy construction with relaxation strategy
۴٫ Hierarchical classification based on the Least Information Theory for term weighting
۵٫ Experimental evaluation
۶٫ Conclusions
Acknowledgment
References

بخشی از متن مقاله:

Abstract

Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM (Support Vector Machine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF*IDF, LIT-based methods achieves significant improvement on the classification performance.

Introduction

The task of text classification is to assign a predefined category to a free text document. With more and more textual information available online, hierarchical organization of text documents is becoming increasingly important to manage the data. The research on automatic classification of documents to the categories in the hierarchy is needed.

Most of the classifiers make the decision in the same flat space. Classification performance degrades quickly with larger scale data sets and more categories, especially in terms of the classification time. On the other hand, a hierarchical classification method organizes all of the categories into a tree like structure and trains a classifier on each node in the hierarchy. The classification process begins from the root of the tree until it reaches the leaf node which denotes the final category for the document.

ثبت دیدگاه