index task failed with storage type as "hdfs"

```
java.lang.Exception: java.lang.IllegalArgumentException: Pathname /druid/segment_data/datasource1/datasource1/2013-08-20T03:00:00.000Z_2013-08-20T04:
00:00.000Z/2015-02-12T10:21:15.522Z/0 from hdfs://master.hadoop:9000/druid/segment_data/datasource1/datasource1/2013-08-20T03:00:00.000Z_2013-08-20T0
4:00:00.000Z/2015-02-12T10:21:15.522Z/0 is not a valid DFS filename.
        at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)
        at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:529)
Caused by: java.lang.IllegalArgumentException: Pathname /druid/segment_data/datasource1/datasource1/2013-08-20T03:00:00.000Z_2013-08-20T04:00:00.000Z
/2015-02-12T10:21:15.522Z/0 from hdfs://master.hadoop:9000/druid/segment_data/datasource1/datasource1/2013-08-20T03:00:00.000Z_2013-08-20T04:00:00.00
0Z/2015-02-12T10:21:15.522Z/0 is not a valid DFS filename.
        at org.apache.hadoop.hdfs.DistributedFileSystem.getPathName(DistributedFileSystem.java:187)
        at org.apache.hadoop.hdfs.DistributedFileSystem.access$000(DistributedFileSystem.java:101)
        at org.apache.hadoop.hdfs.DistributedFileSystem$16.doCall(DistributedFileSystem.java:820)
        at org.apache.hadoop.hdfs.DistributedFileSystem$16.doCall(DistributedFileSystem.java:816)
        at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
        at org.apache.hadoop.hdfs.DistributedFileSystem.mkdirsInternal(DistributedFileSystem.java:816)
        at org.apache.hadoop.hdfs.DistributedFileSystem.mkdirs(DistributedFileSystem.java:809)
        at org.apache.hadoop.fs.FileSystem.mkdirs(FileSystem.java:1815)
        at io.druid.indexer.IndexGeneratorJob$IndexGeneratorReducer.serializeOutIndex(IndexGeneratorJob.java:408)
        at io.druid.indexer.IndexGeneratorJob$IndexGeneratorReducer.reduce(IndexGeneratorJob.java:388)
        at io.druid.indexer.IndexGeneratorJob$IndexGeneratorReducer.reduce(IndexGeneratorJob.java:253)
        at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:171)                                                                 
        at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:627)                                                    
        at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:389)                                                              
        at org.apache.hadoop.mapred.LocalJobRunner$Job$ReduceTaskRunnable.run(LocalJobRunner.java:319)                               
        at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:471)                                                   
        at java.util.concurrent.FutureTask.run(FutureTask.java:262)                                                                  
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)                                           
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)                                           
        at java.lang.Thread.run(Thread.java:745)   
```

The `fileSystem` here https://github.com/druid-io/druid/blob/master/indexing-hadoop/src/main/java/io/druid/indexer/IndexGeneratorJob.java#L435 supposed to be a `DistributedFileSystem` but it is not.

Note that it only go wrong in indexing service's remote mode. In local mode it is fine.


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

index task failed with storage type as "hdfs" #1116

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

index task failed with storage type as "hdfs" #1116

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions