[Task]: Spark Dataset runner should use default storage level MEMORY_AND_DISK

### What needs to happen?

Depending on the API Spark uses different defaults as storage level:
- RDD API: `MEMORY_ONLY`
- Dataset API: `MEMORY_AND_DISK`

Currently, the default storage level is set to `MEMORY_ONLY` for all runners. However, the default storage level of the Dataset runner should match Sparks default `MEMORY_AND_DISK`.

### Issue Priority

Priority: 3 (nice-to-have improvement)

### Issue Components

- [ ] Component: Python SDK
- [ ] Component: Java SDK
- [ ] Component: Go SDK
- [ ] Component: Typescript SDK
- [ ] Component: IO connector
- [ ] Component: Beam examples
- [ ] Component: Beam playground
- [ ] Component: Beam katas
- [ ] Component: Website
- [X] Component: Spark Runner
- [ ] Component: Flink Runner
- [ ] Component: Samza Runner
- [ ] Component: Twister2 Runner
- [ ] Component: Hazelcast Jet Runner
- [ ] Component: Google Cloud Dataflow Runner

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Task]: Spark Dataset runner should use default storage level MEMORY_AND_DISK #25737

What needs to happen?

Issue Priority

Issue Components

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

[Task]: Spark Dataset runner should use default storage level MEMORY_AND_DISK #25737

Description

What needs to happen?

Issue Priority

Issue Components

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions