Final Project for Databases Course

Requirements

Deploy Apache Hadoop Cluster using Cloudera's distribution
Load data inside: teachers, students, subjects, tests, scores
This should happen via DML script using Apache Hive QL
Develop .NET DDL library to perform CRUD operations
Develop report generator in Java: it will get data from Hadoop using Hive and load it to Oracle DB
Report generator is a standalone .jar artifact which uses data from OracleDB to generate HTML report in browser
Implement at least 1 stored procedure in OracleDB to perform CRUD on 2 entities
Develop Windows Forms App for testing and demonstration of all the above-mentioned (using .NET DDL)

Run

This will start Hadoop + Oracle DB.

$ docker-compose up -d

Hue Web UI Username: cloudera. Password: cloudera
Oracle Apex Web UI Username: ADMIN. Password: 0Racle$. Workspace: INTERNAL.

Load Data

This will upload .csv files with initial seed data to HDFS. Then it will create tables and import data into them.

$ docker build -t hive-loader ./hive-loader
$ docker run --rm hive-loader

Get Some Data

SELECT students.id AS student_id,
         students.group AS student_group,
         students.full_name AS full_name,
         students.avg_score AS previous_avg_score,
         average_test_scores.average AS current_avg_score
FROM students
JOIN
  (SELECT student_id,
         AVG(value) AS average
  FROM scores
  GROUP BY  student_id) average_test_scores
    ON (students.id = average_test_scores.student_id)

Other

Connect to Oracle DB with jdbc:oracle:thin:@localhost:1521:xe. Username: system. Password: oracle.

... or run Hadoop independently

$ docker run \
    --hostname=quickstart.cloudera \
    --privileged=true -it \
    -p 8888:8888 \
    -p 10000:10000 \
    -p 9083:9083 \
    cloudera/quickstart \
    /usr/bin/docker-quickstart

... or run Oracle DB independently

$ docker run -d \
    -p 8080:8080 \
    -p 1521:1521 \
    -v `pwd`/oracle:/u01/app/oracle \
    sath89/oracle-12c

Useful Links

Network Ports exposed by CDH 5

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
hive-loader		hive-loader
.gitignore		.gitignore
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Final Project for Databases Course

Requirements

Run

Load Data

Get Some Data

Other

Useful Links

About

Releases

Packages

Contributors 2

Languages

university-projects-se-6050103/course03db

Folders and files

Latest commit

History

Repository files navigation

Final Project for Databases Course

Requirements

Run

Load Data

Get Some Data

Other

Useful Links

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages