Sample sbt project for spark

Build

Note: works with java 7 and 8 (not with jdk 9)

sbt package

Classes

io.elegans.exercises.TokenizeSentences

running using sparkSubmit plugin of sbt

sbt "sparkSubmit --class io.elegans.exercises.TokenizeSentences -- --help"

Tokenize a list of sentences with spark
Usage: TokenizeSentences [options]

  --help              prints this usage text
  --input <value>   the input file or directory with input text  default: sentences.txt
  --output <value>  the destination directory for the output  default: TOKENIZED_SENTENCES

running calling spark-submit

./scripts/run.sh io.elegans.exercises.TokenizeSentences --help

e.g.

./scripts/run.sh io.elegans.exercises.TokenizeSentences --input sentences.utf8.clean.txt  --output TOKENIZED

generation of a fat jar

export JAVA_OPTS="-Xms256m -Xmx4g"
sbt assembly

run the program using the fat jar

spark-submit --driver-memory 8g --class io.elegans.exercises.TokenizeSentences ./target/scala-2.11/exercises-assembly-0.1.jar  --help

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
project		project
scripts		scripts
src/main/scala/io/elegans		src/main/scala/io/elegans
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
build.sbt		build.sbt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sample sbt project for spark

Build

Classes

io.elegans.exercises.TokenizeSentences

running using sparkSubmit plugin of sbt

running calling spark-submit

generation of a fat jar

run the program using the fat jar

About

Releases

Packages

Languages

License

elegans-io/orac-stat-app

Folders and files

Latest commit

History

Repository files navigation

Sample sbt project for spark

Build

Classes

io.elegans.exercises.TokenizeSentences

running using sparkSubmit plugin of sbt

running calling spark-submit

generation of a fat jar

run the program using the fat jar

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages