选择特殊符号

Ф δ ° × # Ⅱ Ⅲ ½ ¼

选择搜索类型

市场价信息价参考价询价供应商云知资讯文库百科

热门搜索

造价通

请输入搜索

首页 > 百科 > 建设工程百科

寻路大数据目录

寻路大数据目录

目录 第1部分大数据时代指引 1 第1章数据成功四原则 3 1.1 当数据成为一件“大”事 3 1.2 数据和单台服务器 4 1.3 大数据的权衡 5 1.3.1 构建可（无限）扩展的解决方案 6 1.3.2 构建可（在互联网上）共享数据的系统 7 1.3.3 构建解决方案，而非基础设施 8 1.3.4 关注从数据中解放价值 8 1.4 大数据流水线剖析 9 1.5 终极数据库 10 1.6 总结 10 第2部分收集和共享海量数据 13 第2章托管和共享TB 级原始数据 15 2.1 文件之殇 16 2.1.1 共享大量文件的挑战 16 2.2 存储：基础设施即服务 17 2.2.1 网络很慢 18 2.3 选择合适的数据格式 18 2.3.1 XML ：数据，描述你自己 20 2.3.2 JSON ：程序员的选择 21 2.4 字符编码 22 2.4.1 文件转换 24 2.5 移动中的数据：数据序列化格式 25 2.5.1 Apache Thrift 和Protocol Buffers 26 2.6 总结 27 第3章构建基于NoSQL 的Web 应用采集众包数据 29 3.1 关系型数据库：命令及控制 30 3.1.1 关系数据库的ACID 测试 32 3.2 当关系型数据库遇上互联网 33 3.2.1 CAP 原理与BASE 34 3.3 非关系型数据库的模式 36 3.3.1 键- 值数据库 36 3.3.2 文档存储 38 3.4 为写入性能优化：Redis 40 3.5 在多个Redis 实例上分片 43 3.5.1 使用Twemproxy 自动分区 44 3.5.2 Redis 的替代选项 46 3.6 NewSQL ：Codd 归来 46 3.7 总结 47 第4章解决数据孤岛问题的策略 49 4.1 堆满术语的仓库 49 4.1.1 实践中的问题 51 4.1.2 数据合规与安全规划 52 4.1.3 走进数据仓库 53 4.1.4 数据仓库的口诀：抽取、转换和加载 54 4.2 Hadoop ：数据仓库中的大象 55 4.3 数据孤岛也可能是个优点 55 4.3.1 专注于数据问题，而不是技术 56 4.3.2 鼓励员工提出他们自己的问题 57 4.3.3 投资沟通数据孤岛的技术 57 4.4 融合：数据孤岛的终结 58 4.4.1 Luhn 的商业智能系统是否能成为现实 59 4.5 总结 59 第3部分数据探究 61 第5章使用Hadoop、Hive 和Shark 探索大规模数据集 63 5.1 什么是数据仓库 64 5.2 Apache Hive ：在Hadoop 上进行交互式查询 66 5.2.1 Hive 用例 66 5.2.2 Hive 实战 67 5.2.3 在Hive 中使用其他数据源 71 5.3 Shark ：以内存的速度进行查询 72 5.4 云中的数据仓库 73 5.5 总结 74 第6章使用Google BigQuery 构建数据信息中心 77 6.1 分析型数据库 78 6.2 Dremel ：均贫富 79 6.2.1 Dremel 与MapReduce 的不同之处 80 6.3 BigQuery ：数据分析即服务 81 6.3.1 BigQuery 的查询语言 82 6.4 建造自己的大数据信息面板 83 6.4.1 授权访问BigQuery API 84 6.4.2 运行查询并获取结果 87 6.4.3 缓存查询结果 88 6.4.4 添加可视化图形 89 6.5 分析型查询引擎的未来 91 6.6 总结 91 第7章探索大数据的可视化策略 93 7.1 警世良言：将数据翻译成故事 94 7.2 人类尺度 VS 机器尺度 97 7.2.1 交互性 97 7.3 开发交互式数据应用 98 7.3.1 使用R 和ggplot2 实现交互式可视化 98 7.3.2 matplotlib: Python 的2D 图形库 100 7.3.3 D3.js ：用于Web 的交互式可视化库 100 7.4 总结 104 第4部分构建数据流水线 107 第8章整合：MapReduce 数据流水线 109 8.1 数据流水线是什么 109 8.1.1 正确的工具 110 8.2 使用Hadoop Streaming 搭建数据流水线 111 8.2.1 MapReduce 和数据转换 111 8.2.2 最简单的流水线：stdin 到stdout 113 8.3 单步MapReduce 变换 115 8.3.1 从原始NVSS 数据中抽取相关信息：map 阶段 116 8.3.2 合计每月出生数：reducer 阶段 117 8.3.3 在本地测试MapReduce 流水线 118 8.3.4 在Hadoop 集群上运行我们的MapReduce 作业 119 8.4 降低复杂性：Hadoop 上Python 的MapReduce 框架 120 8.4.1 使用mrjob 重写Hadoop Streaming 示例 121 8.4.2 建造一个多步流水线 122 8.4.3 在Elastic MapReduce 上运行mrjob 脚本 124 8.4.4 其他基于Python 的MapReduce 框架 125 8.5 总结 125 第9章使用Pig 和Cascading 构建数据转换工作流 127 9.1 大规模数据工作流实战 128 9.2 多步MapReduce 转换真复杂 128 9.2.1 Apache Pig ：拒绝复杂 129 9.2.2 使用交互式Grunt shell 运行Pig 130 9.2.3 过滤和优化数据工作流 132 9.2.4 以批处理模式运行Pig 脚本 132 9.3 Cascading ：构建健壮的数据工作流应用 133 9.3.1 以source 和sink 的方式思考 134 9.3.2 构建Cascading 应用 135 9.3.3 创建一个Cascade ：一个简单的JOIN 例子 136 9.3.4 在Hadoop 集群上部署Cascading 应用 138 9.4 何时选择Pig 或Cascading 139 9.5 总结 140 第5部分基于大规模数据集的机器学习 141 第10章使用Mahout 构建数据分类系统 143 10.1 机器能否预测未来 144 10.2 机器学习的挑战 144 10.2.1 贝叶斯分类 146 10.2.2 聚类 146 10.2.3 推荐引擎 148 10.3 Apache Mahout ：可伸缩的机器学习工具 148 10.3.1 使用Mahout 进行文本分类 149 10.4 MLbase ：分布式机器学习框架 152 10.5 总结 152 第6部分基于大规模数据集的统计分析 155 第11章使用R 语言处理大数据集 157 11.1 统计学为什么性感 158 11.1.1 R 处理大型数据集的局限性 159 11.1.2 R 的数据帧和矩阵 161 11.2 处理大数据集的策略 162 11.2.1 大矩阵处理：bigmemory 和biganalytics 162 11.2.2 ff: 使用大于内存的数据帧 164 11.2.3 biglm ：大规模数据集的线性回归 165 11.2.4 RHadoop: 使用R 访问Apache Hadoop 166 11.3 总结 168 第12章使用Python 和Pandas 构建分析工作流 171 12.1 数据乐园中自在的蟒蛇——Python 172 12.1.1 为统计性计算选择一门语言 172 12.1.2 扩展现有代码 173 12.1.3 工具和测试 174 12.2 用于数据处理的Python 库 174 12.2.1 NumPy 175 12.2.2 SciPy ：Python 的科学计算库 176 12.2.3 数据分析库Pandas 178 12.3 构建更复杂的工作流 182 12.3.1 处理损坏或丢失的记录 184 12.4 iPython ：科学计算工具链的最后一环 185 12.4.1 在集群上并行执行iPython 186 12.5 总结 190 第7部分展望未来 191 第13章何时选择自制、购买或外包 193 13.1 功能重合的解决方案 193 13.2 理解你的数据问题 195 13.3 自制还是购买问题的参考手册 197 13.3.1 你已经对哪些技术有所投入 197 13.3.2 从小处着手 198 13.3.3 规划时考虑可扩展性 198 13.4 私人数据中心 199 13.5 了解开源的成本 201 13.6 一切皆服务 202 13.7 总结 202 第14章未来：数据科技的几个趋势 205 14.1 Hadoop ：搅局者与被搅局者 206 14.2 一切皆在云中 208 14.3 数据科学家的兴衰 209 14.4 融合：终极数据库 212 14.5 文化融合 213 14.6 总结 214

寻路大数据造价信息

市场价
信息价
询价

大数据基础平台

规格型号：
数据接入管理、数据资源管理、数据接口管理、数据服务管理、搜索查询服务等功能
价格行情：
材料单位：
套
材料品牌：
材料税率：
13%
供应商：
郑州信大捷安信息技术股份有限公司
报价时间：
2022-12-07

查看价格

大数据基础平台

规格型号：
数据接入管理、数据资源管理、数据接口管理、数据服务管理、搜索查询服务等功能
价格行情：
材料单位：
套
材料品牌：
材料税率：
13%
供应商：
深圳市睿策者科技有限公司
报价时间：
2022-12-07

查看价格

大数据应用服务平台

规格型号：
涉车犯罪应用、手机话单应用、移动应用、智能业务应用服务等功能
价格行情：
材料单位：
套
材料品牌：
材料税率：
13%
供应商：
郑州信大捷安信息技术股份有限公司
报价时间：
2022-12-07

查看价格

大数据主服务器

规格型号：
2×E5-2660(2.20GHz/8c)/8.0GT/20ML3,SAS 4×600GB ,内存128G,2个千兆网卡,双通道8Gb HBA卡,外插512M RAID卡,热插拔冗余电源,含硬盘托架、背板、DVD刻录机,导轨、原厂安装,原厂三年7×24小时上门维保(硬盘不返还).提供原厂的项目供货证明.
价格行情：
材料单位：
台
材料品牌：
材料税率：
13%
供应商：
郑州信大捷安信息技术股份有限公司
报价时间：
2022-12-07

查看价格

大数据主服务器

规格型号：
2×E5-2660(2.20GHz/8c)/8.0GT/20ML3,SAS 4×600GB ,内存128G,2个千兆网卡,双通道8Gb HBA卡,外插512M RAID卡,热插拔冗余电源,含硬盘托架、背板、DVD刻录机,导轨、原厂安装,原厂三年7×24小时上门维保(硬盘不返还).提供原厂的项目供货证明.
价格行情：
材料单位：
台
材料品牌：
材料税率：
13%
供应商：
深圳市睿策者科技有限公司
报价时间：
2022-12-07

查看价格

数据电视

规格型号：
价格行情：
材料单位：
个
材料税率：
地区时间：
云浮市罗定市2016年3季度信息价
所属行业：
建筑工程
备注说明：

查看价格

数据电视

规格型号：
价格行情：
材料单位：
个
材料税率：
地区时间：
云浮市罗定市2016年1季度信息价
所属行业：
建筑工程
备注说明：

查看价格

数据电视

规格型号：
价格行情：
材料单位：
个
材料税率：
地区时间：
云浮市罗定市2015年3季度信息价
所属行业：
建筑工程
备注说明：

查看价格

数据转发器

规格型号：
GGA7541
价格行情：
材料单位：
个
材料税率：
地区时间：
湛江市2005年2月信息价
所属行业：
建筑工程
备注说明：

查看价格

数据转发器

规格型号：
GGA7541
价格行情：
材料单位：
个
材料税率：
地区时间：
湛江市2005年1月信息价
所属行业：
建筑工程
备注说明：

查看价格

融合大数据

规格型号：
/人体),WiFi无热数据冷数据:人脸8亿 × N/车辆20亿× N/人体10亿× N/WiFi 40亿 × N注:多种数据的时候按比例折算推荐硬件:型号:DS-VBD2SI-II物料代码
需求量：
2台
报价数：
3
材料品牌：
材料档次：
中高档
费用说明：
不含税费 | 含运费
询价时间：
2020-03-09

查看价格

融合大数据-人脸数据应用

规格型号：
DS-VJMNC-3XY人脸数据应用
需求量：
1套
报价数：
3
材料品牌：
材料档次：
高档
费用说明：
含税费 | 含运费
询价时间：
2020-04-14

查看价格

融合大数据

规格型号：
、人体、车辆、mac等数据从下级大数据服务器级联到上级大数据服务器;支持将布控的车辆、人脸等信息从上级大数据级联到下级大数据; 支持关联人脸、人体、车辆进行综合查询.
需求量：
3台
报价数：
1
材料品牌：
材料档次：
中档
费用说明：
含税费 | 含运费
询价时间：
2019-11-27

查看价格

大数据平台

规格型号：
1.名称:大数据平台 2.品牌:徽粤大海/DHWL 3.型号:DHWL-XLZS 4.产地:中国5.功能参数:系统通过云计算、物联网、大数据等先进的技术手段对平台所有数据进行多维度的挖掘分析,可直接进行预警,给我们的工作人员及领导做出一个决策建议 ,辅助领导作出决策
需求量：
1套
报价数：
3
材料品牌：
材料档次：
高档
费用说明：
不含税费 | 含运费
询价时间：
2020-10-23

查看价格

融合大数据-WIFI数据应用

规格型号：
DS-VJMNC-3XY WIFI数据应用
需求量：
1套
报价数：
3
材料品牌：
材料档次：
高档
费用说明：
含税费 | 含运费
询价时间：
2020-04-14

查看价格

寻路大数据作者简介

Michael Manoochehri 是个企业家、作家和乐观主义者。凭借自己与企业、研究机构和非营利性机构多年的合作经验，他力图让可扩展数据分析变得更加廉价和易获取。Michael 是Google 云平台开发者关系组的成员之一，关注云计算和数据开发者产品。

寻路大数据内容简介

这是一个数据爆发的时代，更是一个数据技术爆发的时代，各行各业都在因此进行深刻的变革。如何从众多的数据技术中选择正确的工具、如何使用这些工具从海量数据中挖掘出有价值的东西，无疑是非常具有挑战性的问题。 本书作者结合自己在Google 大数据平台工作的丰富经验，阐述了数据技术的方方面面。从数据收集、共享到数据存储，从分布式数据平台、分析型数据库到数据可视化，从数据工作流构建到大规模数据分析，作者不仅进行了全面而深入的介绍，更覆盖了目前流行的各种数据技术与工具，同时对技术选型提出了指导性的建议。最后，作者对数据挑战的非技术因素进行了深刻的分析，并对数据技术的发展趋势进行了展望，引人深思。

寻路大数据目录常见问题

大数据的价值是什么

大数据对企业产生的一个重要价值就是分析数据的质量，此外，企业内部是否会形成一个个孤立的数据孤岛，数据是否会成就企业内某些人或团队新的权力，导致数据不能得到实时有效地分享，这些都会是阻碍大数据在企业中有...
关联大数据的保存问题

如果保存了应该有轴网及框架柱的，你检查一下是否点到层数不对，如在二层画的，打开后软件直接出现的是一层，所以没有；另一个可以按柱的快捷键“Z”看看是否显示框架柱，切换楼层看看其它层是否有框架柱。
贵阳大数据中心在哪里

贵州省大数据产业发展中心在贵阳市云岩区大西门北京贵阳大数据应用展示中心在贵阳国家高新技术产业开发区西部研发基地（阳关大道28号）

寻路大数据目录文献

化工大数据

化工大数据

化工大数据

格式：pdf

大小：939KB

页数： 1页

广州化工第 20期 .indd 26 2018/10/26 16:06:26

在线阅读立即下载

HDPE物性大数据表

HDPE物性大数据表

HDPE物性大数据表

格式：pdf

大小：939KB

页数： 35页

实用标准文档文案大全 HDPE&NBSP;5310M&NBSP;中石化扬子石油化工股份有限公司 &NBSP;电线电缆 ①原料描述部分规格级别：电缆绝缘料外观颜色：本色用途概述：用于低、中、高速绝缘生产线备注说明：性能 :由乙烯、丁烯集合而成的双峰高密度聚乙烯，并含有适量助剂的本色粒料。因为其分子量呈双峰分布，所以它具有优异的加工性能、很好的力学性能及良好的电性能。 ②原料技术数据性能项目试验条件 [状态 ] 测试方法测试数据数据单位基本性能密度 / / 0.941-0.959 g/cm3 熔体流动速率 / / ≤1.0 g/10min 机械性能拉伸强度 / / ≥19.0 MPa 断裂伸长率 / / ≥400 % 耐环境应力开裂性 48h / ≤2/10 / 电气性能介电常数 1MHz / ≤2.40 / 体积电阻率 / / ≥1×101

在线阅读立即下载

寻路大数据海量数据与大规模分析内容简介

这是一个数据爆发的时代，更是一个数据技术爆发的时代，各行各业都在因此进行深刻的变革。如何从众多的数据技术中选择正确的工具、如何使用这些工具从海量数据中挖掘出有价值的东西，无疑是非常具有挑战性的问题。 《寻路大数据：海量数据与大规模分析》作者结合自己在Google 大数据平台工作的丰富经验，阐述了数据技术的方方面面。从数据收集、共享到数据存储，从分布式数据平台、分析型数据库到数据可视化，从数据工作流构建到大规模数据分析，作者不仅进行了全面而深入的介绍，更覆盖了目前流行的各种数据技术与工具，同时对技术选型提出了指导性的建议。最后，作者对数据挑战的非技术因素进行了深刻的分析，并对数据技术的发展趋势进行了展望，引人深思。 《寻路大数据：海量数据与大规模分析》对企业管理者、技术经理、数据分析师、数据应用开发人员和相关从业者都有很好的参考价值。决策者可以从中看到技术趋势，把握时代发展脉搏；数据分析人员可以看到经验的总结和工具的应用；其他从业者可以从中了解数据技术所涉及的各个方面。

寻路大数据海量数据与大规模分析图书目录

第1 部分大数据时代指引 1 第1 章数据成功四原则 3 1．1 当数据成为一件“大”事 3 1．2 数据和单台服务器 4 1．3 大数据的权衡 5 1．3．1 构建可（限）扩展的解决方案 6 1．3．2 构建可（在互联网上）共享数据的系统 7 1．3．3 构建解决方案，而非基础设施 8 1．3．4 关注从数据中解放价值 8 1．4 大数据流水线剖析 9 1．5 终极数据库 10 1．6 总结 10 第2 部分收集和共享海量数据 13 第2 章托管和共享TB 级原始数据 15 2．1 文件之殇 16 2．1．1 共享大量文件的挑战 16 2．2 存储：基础设施即服务 17 2．2．1 网络很慢 18 2．3 选择合适的数据格式 18 2．3．1 XML ：数据，描述你自己 20 2．3．2 JSON ：程序员的选择 21 2．4 字符编码 22 2．4．1 文件转换 24 XXII 目录 2．5 移动中的数据：数据序列化格式 25 2．5．1 Apache Thrift 和Protocol Buffers 26 2．6 总结 27 第3 章构建基于NoSQL 的Web 应用采集众包数据 29 3．1 关系型数据库：命令及控制 30 3．1．1 关系数据库的ACID 测试 32 3．2 当关系型数据库遇上互联网 33 3．2．1 CAP 原理与BASE 34 3．3 非关系型数据库的模式 36 3．3．1 键- 值数据库 36 3．3．2 文档存储 38 3．4 为写入性能优化：Redis 40 3．5 在多个Redis 实例上分片 43 3．5．1 使用Twemproxy 自动分区 44 3．5．2 Redis 的替代选项 46 3．6 NewSQL ：Codd 归来 46 3．7 总结 47 第4 章解决数据孤岛问题的策略 49 4．1 堆满术语的仓库 49 4．1．1 实践中的问题 51 4．1．2 数据合规与安全规划 52 4．1．3 走进数据仓库 53 4．1．4 数据仓库的口诀：抽取、转换和加载 54 4．2 Hadoop ：数据仓库中的大象 55 4．3 数据孤岛也可能是个优点 55 4．3．1 专注于数据问题，而不是技术 56 4．3．2 鼓励员工提出他们自己的问题 57 4．3．3 投资沟通数据孤岛的技术 57 4．4 融合：数据孤岛的终结 58 目录XXIII 4．4．1 Luhn 的商业智能系统是否能成为现实 59 4．5 总结 59 第3 部分数据探究 61 第5 章使用Hadoop、Hive 和Shark 探索大规模数据集 63 5．1 什么是数据仓库 64 5．2 Apache Hive ：在Hadoop 上进行交互式查询 66 5．2．1 Hive 用例 66 5．2．2 Hive 实战 67 5．2．3 在Hive 中使用其他数据源 71 5．3 Shark ：以内存的速度进行查询 72 5．4 云中的数据仓库 73 5．5 总结 74 第6 章使用Google BigQuery 构建数据信息中心 77 6．1 分析型数据库 78 6．2 Dremel ：均贫富 79 6．2．1 Dremel 与MapReduce 的不同之处 80 6．3 BigQuery ：数据分析即服务 81 6．3．1 BigQuery 的查询语言 82 6．4 建造自己的大数据信息面板 83 6．4．1 授权访问BigQuery API 84 6．4．2 运行查询并获取结果 87 6．4．3 缓存查询结果 88 6．4．4 添加可视化图形 89 6．5 分析型查询引擎的未来 91 6．6 总结 91 第7 章探索大数据的可视化策略 93 7．1 警世良言：将数据翻译成故事 94 7．2 人类尺度 VS 机器尺度 97 XXIV 目录 7．2．1 交互性 97 7．3 开发交互式数据应用 98 7．3．1 使用R 和ggplot2 实现交互式可视化 98 7．3．2 matplotlib： Python 的2D 图形库 100 7．3．3 D3．js ：用于Web 的交互式可视化库 100 7．4 总结 104 第4 部分构建数据流水线 107 第8 章整合：MapReduce 数据流水线 109 8．1 数据流水线是什么 109 8．1．1 正确的工具 110 8．2 使用Hadoop Streaming 搭建数据流水线 111 8．2．1 MapReduce 和数据转换 111 8．2．2 最简单的流水线：stdin 到stdout 113 8．3 单步MapReduce 变换 115 8．3．1 从原始NVSS 数据中抽取相关信息：map 阶段 116 8．3．2 合计每月出生数：reducer 阶段 117 8．3．3 在本地测试MapReduce 流水线 118 8．3．4 在Hadoop 集群上运行我们的MapReduce 作业 119 8．4 降低复杂性：Hadoop 上Python 的MapReduce 框架 120 8．4．1 使用mrjob 重写Hadoop Streaming 示例 121 8．4．2 建造一个多步流水线 122 8．4．3 在Elastic MapReduce 上运行mrjob 脚本 124 8．4．4 其他基于Python 的MapReduce 框架 125 8．5 总结 125 第9 章使用Pig 和Cascading 构建数据转换工作流 127 9．1 大规模数据工作流实战 128 9．2 多步MapReduce 转换真复杂 128 9．2．1 Apache Pig ：拒绝复杂 129 目录XXV 9．2．2 使用交互式Grunt shell 运行Pig 130 9．2．3 过滤和优化数据工作流 132 9．2．4 以批处理模式运行Pig 脚本 132 9．3 Cascading ：构建健壮的数据工作流应用 133 9．3．1 以source 和sink 的方式思考 134 9．3．2 构建Cascading 应用 135 9．3．3 创建一个Cascade ：一个简单的JOIN 例子 136 9．3．4 在Hadoop 集群上部署Cascading 应用 138 9．4 何时选择Pig 或Cascading 139 9．5 总结 140 第5 部分基于大规模数据集的机器学习 141 第10 章使用Mahout 构建数据分类系统 143 10．1 机器能否预测未来 144 10．2 机器学习的挑战 144 10．2．1 贝叶斯分类 146 10．2．2 聚类 146 10．2．3 推荐引擎 148 10．3 Apache Mahout ：可伸缩的机器学习工具 148 10．3．1 使用Mahout 进行文本分类 149 10．4 MLbase ：分布式机器学习框架 152 10．5 总结 152 第6 部分基于大规模数据集的统计分析 155 第11 章使用R 语言处理大数据集 157 11．1 统计学为什么性感 158 11．1．1 R 处理大型数据集的局限性 159 11．1．2 R 的数据帧和矩阵 161 XXVI 目录 11．2 处理大数据集的策略 162 11．2．1 大矩阵处理：bigmemory 和biganalytics 162 11．2．2 ff：使用大于内存的数据帧 164 11．2．3 biglm ：大规模数据集的线性回归 165 11．2．4 RHadoop：使用R 访问Apache Hadoop 166 11．3 总结 168 第12 章使用Python 和Pandas 构建分析工作流 171 12．1 数据乐园中自在的蟒蛇――Python 172 12．1．1 为统计性计算选择一门语言 172 12．1．2 扩展现有代码 173 12．1．3 工具和测试 174 12．2 用于数据处理的Python 库 174 12．2．1 NumPy 175 12．2．2 SciPy ：Python 的科学计算库 176 12．2．3 数据分析库Pandas 178 12．3 构建更复杂的工作流 182 12．3．1 处理损坏或丢失的记录 184 12．4 iPython ：科学计算工具链的最后一环 185 12．4．1 在集群上并行执行iPython 186 12．5 总结 190 第7 部分展望未来 191 第13 章何时选择自制、购买或外包 193 13．1 功能重合的解决方案 193 13．2 理解你的数据问题 195 13．3 自制还是购买问题的参考手册 197 13．3．1 你已经对哪些技术有所投入 197 13．3．2 从小处着手 198 13．3．3 规划时考虑可扩展性 198 目录XXVII 13．4 私人数据中心 199 13．5 了解开源的成本 201 13．6 一切皆服务 202 13．7 总结 202 第14 章未来：数据科技的几个趋势 205 14．1 Hadoop ：搅局者与被搅局者 206 14．2 一切皆在云中 208 14．3 数据科学家的兴衰 209 14．4 融合：终极数据库 212 14．5 文化融合 213 14．6 总结 214

寻路大数据海量数据与大规模分析作者简介

Michael Manoochehri，是个企业家、作家和乐观主义者。凭借自己与企业、研究机构和非营利性机构多年的合作经验，他力图让可扩展数据分析变得更加廉价和易获取。Michael 是Google 云平台开发者关系组的成员之一，关注云计算和数据开发者产品，例如Google BigQuery。此外，Michael 是技术博客ProgrammableWeb.com的作者之一，曾在乌干达农村地区研究移动电话的使用，拥有UC Berkeley 信息学院的信息管理与系统文学硕士学位。 陈冠诚，并行实验室创建者。在导师Prof. Per Stenström指导下完成硕士毕业设计“关于并行程序中锁竞争的性能分析”。2011年加入IBM中国研究院系统组，从事云计算系统架构、海量数据处理等相关研究工作。

相关推荐

相关百科
相关知识
相关专栏

免费服务热线: 400-888-9639