由于此商品库存有限,请在下单后15分钟之内支付完成,手慢无哦!
100%刮中券,最高50元无敌券,券有效期7天
活动自2017年6月2日上线,敬请关注云钻刮券活动规则更新。
如活动受政府机关指令需要停止举办的,或活动遭受严重网络攻击需暂停举办的,或者系统故障导致的其它意外问题,苏宁无需为此承担赔偿或者进行补偿。
正版 软件优化技术 陈虎,汤德佑,黄敏 著 提升软件性能的技术宝典 9787111742456 机械工业出版社 教材
¥ ×1
| |
商品名称: | 软件优化技术 |
作 者: | 陈虎 汤德佑 黄敏
|
市 场 价: | 69.00
|
ISBN 号: | 9787111742456
|
出版日期: |
|
页 数: | 215
|
开 本: |
|
出 版 社: | 机械工业出版社 |
前言 第 1 章 引言 1 1.1 软件优化概述 1 1.1.1 软件优化的主要方法 1 1.1.2 软件性能工程 3 1.1.3 关于软件优化的一些观点 4 1.2 评价软件性能的指标和方法 6 1.2.1 延迟和吞吐率 6 1.2.2 加速比和效率 7 1.2.3 Amdahl 定理 8 1.2.4 M/M/k 模型 9 1.3 常用软件工具和时间测量方法 10 1.3.1 常用软件工具 10 1.3.2 时间测量 13 1.4 一个程序性能分析的实例 15 1.5 扩展阅读 16 1.6 习题 17 1.7 实验题 18 参考文献 20 第 2 章 CPU 上的基本优化方法 21 2.1 计算机体系结构基础 21 2.1.1 指令集体系结构 21 2.1.2 指令铁律 24 2.1.3 流水线及其相关性 26 2.1.4 超标量和乱序执行 27 2.1.5 典型微处理器的微结构 29 2.2 针对算术逻辑指令的优化 31 2.2.1 现代微处理器的算术逻辑指令延迟与吞吐率 31 2.2.2 选择合适的数据类型 32 2.2.3 使用简单指令代替复杂指令 33 2.2.4 使用特殊指令 34 2.2.5 查表法 35 2.3 针对条件分支指令的优化 36 2.3.1 分支预测 36 2.3.2 消除分支 38 2.3.3 组合多个分支以提高分支预测的准确度 38 2.3.4 使用条件执行指令 39 2.3.5 合理使用 switch 语句40 2.4 针对 Cache 的优化 41 2.4.1 现代微处理器的Cache 41 2.4.2 数据对齐 43 2.4.3 SoA 的结构组织方式 44 2.4.4 数据分块以提升 Cache命中率 45 2.4.5 Cache 预取 46 2.5 针对循环结构的优化 47 2.5.1 消除循环 47 2.5.2 循环展开 47 2.6 综合实例 49 2.6.1 Linux 内核中的 ECC 计算 49 2.6.2 Hash 表的构建 53 2.7 扩展阅读 55 2.8 习题 56 2.9 实验题 57 参考文献 59 第 3 章 基于 SIMD 指令系统的优化方法 61 3.1 SIMD 指令系统简介 61 3.1.1 SIMD 指令系统概况 61 3.1.2 软件系统使用 SIMD 指令的方法 63 3.2 SIMD 内嵌原语 64 3.2.1 内嵌原语的数据类型 64 3.2.2 向量设置操作 65 3.2.3 计算操作 66 3.2.4 比较操作 68 3.2.5 访存操作 69 3.2.6 数据排列操作 71 3.3 基于内嵌原语的 SIMD 程序设计 72 3.3.1 数据对齐和数据宽度 73 3.3.2 SoA 结构 74 3.3.3 数据比较 76 3.3.4 特殊指令 77 3.3.5 寄存器数量 79 3.4 SIMD 程序实例 81 3.4.1 使用 SSE 指令去除空格 81 3.4.2 基于 SIMD 指令的双调排序和归并排序 82 3.4.3 fftw 的可移植设计 84 3.5 扩展阅读 88 3.6 习题 88 3.7 实验题 88 参考文献 90 第 4 章 基于多线程的优化方法 94 4.1 多核处理器体系结构 94 4.1.1 多线程处理器 94 4.1.2 多核处理器系统 96 4.1.3 Cache 一致性协议 98 4.2 操作系统级线程调用 100 4.2.1 线程 100 4.2.2 线程基本 API 102 4.2.3 Linux 的线程同步和互斥 105 4.2.4 Windows 的线程同步和互斥 110 4.3 OpenMP 113 4.3.1 for 编译制导语句 114 4.3.2 共享变量和私有变量 115 4.3.3 归约子句 116 4.3.4 nowait 子句 117 4.3.5 single 制导指令 118 4.3.6 critical 子句 119 4.3.7 barrier 子句 119 4.3.8 其他子句 120 4.4 多线程程序的一些问题 120 4.4.1 临界区 120 4.4.2 Cache 伪共享 123 4.4.3 多线程的并行化设计方法 124 4.5 多线程并行化实例 125 4.5.1 Horner算法的并行化 125 4.5.2 构建 Hash 表 126 4.5.3 归并排序 127 4.6 扩展阅读 129 4.7 习题 130 4.8 实验题 131 参考文献 133 第 5 章 GPU 的优化方法 135 5.1 GPU 体系结构 135 5.1.1 面向吞吐率优化的异构 计算 135 5.1.2 GPU 总体结构 136 5.1.3 SIMT 机制 136 5.1.4 存储器结构 139 5.2 GPU 基本编程方法 139 5.2.1 线程的组织结构 139 5.2.2 GPU 函数说明 140 5.2.3 存储器管理以及与主机的数据交换 141 5.2.4 GPU 上线程之间的同步 143 5.2.5 OpenCL 的程序对象和内核对象 144 5.2.6 程序实例 145 5.3 GPU 程序优化方法 148 5.3.1 指令吞吐率 148 5.3.2 资源利用率 149 5.3.3 共享存储器 150 5.3.4 全局存储器 152 5.3.5 掩盖主机和 GPU 之间的数据传输延迟 152 5.3.6 动态并行机制 154 5.4 GPU 程序实例 155 5.4.1 矩阵乘法 155 5.4.2 LU 分解 157 5.5 扩展阅读 159 5.6 习题 159 5.7 实验题 160 参考文献 160 第 6 章 面向对象程序设计语言的优化方法 162 6.1 C++ 的性能优化 162 6.1.1 C++ 实现简介 162 6.1.2 STL 167 6.2 Java 的性能优化 168 6.2.1 Java 虚拟机简介 168 6.2.2 Java 字节码的执行机制 170 6.2.3 Java 本地接口 172 6.2.4 Java 的多线程机制 174 6.3 垃圾回收 176 6.3.1 垃圾回收基本技术 176 6.3.2 HotSpot JVM 中的垃圾回收 181 6.4 扩展阅读 183 6.5 习题 184 6.6 实验题 184 参考文献 186 第 7 章 系统级软件优化 188 7.1 硬盘系统与文件系统的性能优 化 189 7.1.1 硬盘系统 189 7.1.2 文件系统 191 7.1.3 性能优化方法 193 7.1.4 实例:外排序 194 7.2 网络连接的性能优化 196 7.2.1 网络连接硬件 196 7.2.2 网络编程简介 197 7.2.3 性能优化方法 200 7.2.4 实例:Web 服务器的结构 204 7.3 软件总体结构的设计考虑 207 7.3.1 用户友好性设计 207 7.3.2 可移植性设计 208 7.3.3 错误处理设计 209 7.3.4 系统可维护性设计 210 7.4 扩展阅读 211 7.5 习题 212 7.6 实验题 212 参考文献 213 |
本书介绍了在现代计算机系统上充分利用微处理器计算能力以提高软件性能的主要优化方法,共分为七章。 |
亲,大宗购物请点击企业用户渠道>小苏的服务会更贴心!
亲,很抱歉,您购买的宝贝销售异常火爆让小苏措手不及,请稍后再试~
非常抱歉,您前期未参加预订活动,
无法支付尾款哦!
抱歉,您暂无任性付资格