考题列表
- 判断题 一个进程中只能有一个线程在工作,可以处理多个数据分区(例如运...
- 判断题 DAG是一种非常重要的图论数据结构。
- 判断题 join算子操作既可以属于窄依赖,也可以属于宽依赖。
- 判断题 Hadoop的MapReduce进行计算时,每次产生的中间结...
- 判断题 RDD采用了惰性调用。
- 判断题 RDD的分区原则是分区的个数尽量等于集群中的CPU核心(Co...
- 判断题 Application中包含了多个驱动器(Driver)进程...
- 判断题 flatMap(func)与map(func)相似,应用于(...
- 判断题 Spark可以运行在Hadoop模式、Mesos模式、Sta...
- 判断题 Spark生态系统已经发展成为一个可应用于大规模数据处理的统...
- 判断题 RDD的持久化操作有两种方法,分别是cache()方法和pe...
- 判断题 对于迭代式计算和交互式数据挖掘,RDD可以将中间计算的数据结...
- 判断题 Spark不支持在各种集群管理器(Cluster Manag...
- 判断题 Cluster Manager负责整个集群的统一资源管理,W...
- 判断题 在数据科学应用中,数据工程师可以利用Spark进行数据分析与建模。
- 判断题 Spark计算框架在处理数据时,所有的中间数据都保存在磁盘中。
- 判断题 Worker Node为执行器的工作单元。
- 多项选择题 下列选项中,属于Spark生态圈的组件有()。
- 多项选择题 下列选项中,属于RDD行动算子的有()。
- 多项选择题 Spark编程支持的语言有()。
- 单项选择题 下列选项中,用于提交和监控Task任务的是()。
- 单项选择题 在Spark运行过程中,每个Job可以划分为更小的Task集...
- 单项选择题 Spark集群的任务是由()进行调度的。
- 单项选择题 持久化RDD的存储级别中,将RDD分区全部存储到磁盘上的存储...
- 单项选择题 在RDD的转换算子中,用于将每个元素传递到函数func中,并...
- 单项选择题 下列选项,不属于集群管理器的有()。
- 单项选择题 在RDD的转换算子中,主要用于(Key,Value)键值对的...
- 单项选择题 Spark与Hadoop在基于内存的运算中,说法正确的是()。
- 单项选择题 在Spark RDD中,划分Stage的依据是()。
- 单项选择题 如果一个有向图无法从任意顶点出发经过若干条边回到该点,则这个...
- 单项选择题 在RDD的行动算子中,用于用于返回数组的第一个元素的行动算子是()。
- 单项选择题 下列选项中,可以支持Scala和Python编程的交互式解释...
- 单项选择题 下列选项中,可以用于退出Spark-Shell客户端的命令是()。
- 填空题 Spark支持的操作可以分为Transformation和A...
- 填空题 spark生态圈的核心是()。
- 填空题 scala中获取数组第一个元素可以用()。
- 填空题 scala中声明常量的关键词为()。
- 填空题 scala的REPL提供了()模式,用于粘贴大量的代码。
- 填空题 scala解释器也称为()。
- 填空题 词频TF(t,d)是指词语t在()中出现的次数。