مشخصات مقاله | |
ترجمه عنوان مقاله | ساختارهای داده ای I/O کارآمد برای نمایه سازی غیر همپوشانی |
عنوان انگلیسی مقاله | I/O-efficient data structures for non-overlapping indexing |
انتشار | مقاله سال 2021 |
تعداد صفحات مقاله انگلیسی | 17 صفحه |
هزینه | دانلود مقاله انگلیسی رایگان میباشد. |
پایگاه داده | نشریه الزویر |
نوع نگارش مقاله |
مقاله پژوهشی (Research Article) |
مقاله بیس | این مقاله بیس نمیباشد |
نمایه (index) | scopus – master journals – JCR |
نوع مقاله | ISI |
فرمت مقاله انگلیسی | |
ایمپکت فاکتور(IF) |
1.231 در سال 2020 |
شاخص H_index | 110 در سال 2021 |
شاخص SJR | 0.570 در سال 2020 |
شناسه ISSN | 0304-3975 |
شاخص Quartile (چارک) | Q2 در سال 2020 |
مدل مفهومی | ندارد |
پرسشنامه | ندارد |
متغیر | ندارد |
رفرنس | دارد |
رشته های مرتبط | مهندسی کامپیوتر |
گرایش های مرتبط | مهندسی نرم افزار، مهندسی الگوریتم ها و محاسبات |
نوع ارائه مقاله |
ژورنال |
مجله | علوم کامپیوتر نظری – Theoretical Computer Science |
دانشگاه | Informatics Institute, Istanbul Technical University, Turkey |
کلمات کلیدی | درخت پسوند، ساختار داده، الگوریتم های رشته |
کلمات کلیدی انگلیسی | Suffix Trees – Data Structure – String Algorithms |
شناسه دیجیتال – doi |
https://doi.org/10.1016/j.tcs.2020.12.006 |
کد محصول | E15284 |
وضعیت ترجمه مقاله | ترجمه آماده این مقاله موجود نمیباشد. میتوانید از طریق دکمه پایین سفارش دهید. |
دانلود رایگان مقاله | دانلود رایگان مقاله انگلیسی |
سفارش ترجمه این مقاله | سفارش ترجمه این مقاله |
فهرست مطالب مقاله: |
Abstract Keywords 1. Introduction and related work 2. Preliminaries and basic structures 3. Non-overlapping indexing – cache obliviously 4. Range non-overlapping indexing in cache-aware model Declaration of Competing Interest Acknowledgement References |
بخشی از متن مقاله: |
1. Introduction and Related Work
Text indexing is fundamental to many areas in Computer Science such as Information Retrieval, Bioinformatics, etc. The primary goal here is to preprocess a long text T[1, n] (given in advance), such that whenever a shorter pattern P[1, m] comes as query, all occ occurrences (or simply, starting positions) of P in T can be reported efficiently. Such queries can be answered in optimal O(m + occ) time using the classic Suffix tree data structure [1, 2]. It takes O(n) words of space. In this paper, we focus on a variation of the text indexing problem, known as the non-overlapping indexing, which is central to data compression [3, 4]. Problem 1 (Non-overlapping Indexing). Preprocess a text T[1, n] into a data structure that supports the following query: given a pattern P[1, m], report a largest set of occurrences of P in T (denote its size by nocc), such that any two (distinct) text positions in the output are separated by at least m characters. |