问题: 我试图在一个独立的实例(solr-5.3.0和hadoop2.7)中创建HDFS上的solr
详情分类:hdfs
Spark metrics错误:CsvReporter:写入时出错jvm.PS版-MarkSweep.count
问题: 我已经将Spark配置为在两个节点上运行,HDFS托管输入文件。我想转储提供的所有统计文件指
详情Cloudera 5.4.2:使用Flume和Twitter流时,Avro块大小无效或太大
问题: 云时代2.5有小问题的时候试试。根据这篇文章 Apache Flume-获取Twitter数
详情PySpark和光栅(GeoTiff)数据
问题: 我尝试使用Spark(PySpark)来对存储在多波段geotiff中的数据运行分析。我还是
详情使用Hadoop Flume检索google分析数据
问题: 我想检索谷歌分析数据使用谷歌分析API。我想用Hadoop Flume来实现这一点,以便将它
详情在纱线模式下火花作业失败
问题: 我有一个用Scala编写的Spark程序,从HDFS读取CSV文件,计算一个新列并将其保存为
详情使用SQOOP进行数据摄取[duplicate]
问题: 我必须使用Sqoop在HDFS中摄取CSV文件 问题是我使用了一个“,”(逗号)作为分隔符,
详情使用烫伤读取多个文件并输出单个文件
问题: 这些天我遇到了一个问题,我试图从多个文件中读取,并用一个文件创建一个输出。我的代码是: de
详情Filebeat中的纱线或HDFS原木
问题: 如果我想将HDFS中的日志摄取到Filebeat中,我该怎么做?我可以指定本地驱动器上的任何
详情配置单元-带空十进制值的ORC读取问题-java.io.EOFException:读取超过EOF的BigInteger
问题: 我在加载一个ORC外部表时遇到了一个有关配置单元的问题,该表的列定义为DECIMAL(31,
详情Cassandra vs HDFS存储分析数据
问题: 我们有一个apachespark集群,可以分析HDFS(.parquet)中存储的数据。 谢
详情Hadoop distcp-可以保持每个文件相同(保留文件大小)?
问题: 当我运行一个简单的distcp命令时: hadoop distcp s3://src-buc
详情删除DataNode目录时的HDFS行为
问题: 我设置了一个Hadoop集群(hdp2.6),它包含3个节点,每个节点上都有以下HDFS挂载
详情hadoophdfs-在虚拟机上执行JAR文件
问题: 我在NetBeans中用Maven构建了一个Java应用程序。生成项目时调用主项目-快照.j
详情当会话在写入过程中被终止时,Spark saveAsTable是否回滚?
问题: 使用saveAsTable附加到配置单元管理的表时,不完整的saveAsTable所做的工作
详情DfsInkDfsMiniFiedCluster不满足错误org.apache.hadoop是 啊。本地的。$Windows.access0
问题: 进行以下操作时: new MiniDFSCluster.Builder(config).bu
详情如何在python中使用pyarrow连接到hdfs
问题: 我已经安装了pyarrow,并想连接到Hadoop集群中的hdfs文件。我有下面的一行,它给
详情复制hadoop目录中除1以外的所有文件
问题: 我正在编写一个shell脚本来将我所有的文件放在hadoop目录中 我使用命令: hadoo
详情在配置单元上启动SQL实时
问题: 我实际上是在问我自己使用sparksql和Hive进行实时分析的性能。 但是,使用spark
详情Namenode未启动-Namenode join中出现异常
问题: 我的namenode没有启动。在 尝试在重新启动之前格式化和删除tmp目录。但它没有出现。在
详情