مشخصات مقاله | |
ترجمه عنوان مقاله | معماری ALU با پشتیبانی دقت دینامیکی |
عنوان انگلیسی مقاله | ALU Architecture with Dynamic Precision Support |
انتشار | مقاله سال 2012 |
تعداد صفحات مقاله انگلیسی | 8 صفحه |
هزینه | دانلود مقاله انگلیسی رایگان میباشد. |
پایگاه داده | نشریه IEEE |
نوع نگارش مقاله |
مقاله پژوهشی (Research article) |
مقاله بیس | این مقاله بیس نمیباشد |
نوع مقاله | ISI |
فرمت مقاله انگلیسی | |
رشته های مرتبط | مهندسی کامپیوتر |
گرایش های مرتبط | معماری کامپیوتری |
نوع ارائه مقاله |
کنفرانس |
مجله / کنفرانس | سمپوزیوم در مورد شتاب دهنده های برنامه در محاسبات با کارایی بالا – Symposium on Application Accelerators in High Performance Computing |
دانشگاه | Department of Electrical Engineering and Computer Science University of Tennessee Knoxville, TN, USA |
کلمات کلیدی | دقت دینامیکی، ALUs، FPGAs، محاسبه با کارایی بالا، اصلاح تکراری |
کلمات کلیدی انگلیسی | dynamic precision, ALUs, FPGAs, high-performance computing, iterative refinement |
شناسه دیجیتال – doi |
https://doi.org/10.1109/SAAHPC.2012.29 |
کد محصول | E11616 |
وضعیت ترجمه مقاله | ترجمه آماده این مقاله موجود نمیباشد. میتوانید از طریق دکمه پایین سفارش دهید. |
دانلود رایگان مقاله | دانلود رایگان مقاله انگلیسی |
سفارش ترجمه این مقاله | سفارش ترجمه این مقاله |
فهرست مطالب مقاله: |
Abstract I. Introduction II. Previous Work III. Proposed Approach IV. Imprementation Results and a Case Study V. Conclusion |
بخشی از متن مقاله: |
Abstract
Exploiting computational precision can improve performance significantly without losing accuracy in many applications. To enable this, we propose an innovative arithmetic logic unit (ALU) architecture that supports true dynamic precision operations on the fly. The proposed architecture targets both fixed-point and floating-point ALUs, but in this paper we focus mainly on the precision-controlling mechanism and the corresponding implementations for fixed-point adders and multipliers. We implemented the architecture on Xilinx Virtex-5 XC5VLX110T FPGAs, and the results show that the area and latency overheads are 1% ~ 24% depending on the structure and configuration. This implies the overhead can be minimized if the ALU structure and configuration are chosen carefully for specific applications. As a case study, we apply this architecture to binary cascade iterative refinement (BCIR). 4X speedup is observed in this case study.
INTRODUCTION
In computational science and engineering, users continually seek to solve ever more challenging problems: faster computers with bigger memory capacity enable the analysis of larger systems, finer resolution, and/or the inclusion of additional physics. For the past several decades, standardized floatingpoint representations have enabled more predictable numeric behavior and portability, but at the expense of making it impractical for users to exploit customized precision with good performance. The introduction of reconfigurable computing platforms provides scientists with an affordable accelerating solution that not only has the computational power of dedicated hardware processors (ASICs and DSPs), but also the flexibility of software due to the fabric and circuit configurability [13].
|