0% found this document useful (0 votes)

6 views5 pages

Revision Solution

Uploaded by

Asvini

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views5 pages

Revision Solution

Uploaded by

Asvini

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 5

Cloudera Folks Revision

==================
Slide 5
==================

=========
Insert the data
=========

mysql -uroot -pcloudera

drop database if exists zeyodbrev;
create database zeyodbrev;
use zeyodbrev;

CREATE TABLE customerrev(custid INT,firstname VARCHAR(20),lastname VARCHAR(20),city

varchar(50),age int,createdt date,transactamt int );

insert into customerrev values(1,'Arun','Kumar','chennai',33,'2015-09-20',100000);

insert into customerrev values(2,'srini','vasan','chennai',33,'2015-09-21',10000);
insert into customerrev values(3,'vasu','devan','banglore',39,'2015-09-22',90000);
insert into customerrev values(4,'mohamed','imran','hyderabad',33,'2015-09-
23',1000);
insert into customerrev values(5,'arun','basker','chennai',23,'2015-09-24',200000);
insert into customerrev values(6,'arun1','basker','chennai',23,'2015-09-
24',200000);
insert into customerrev values(7,'srini','vasan','chennai',33,'2015-09-21',10000);
insert into customerrev values(8,'vasu','devan','banglore',39,'2015-09-22',90000);
insert into customerrev values(9,'mohamed','imran','hyderabad',33,'2015-09-
23',1000);
insert into customerrev values(10,'mohamed','imran','hyderabad',33,'2015-09-
23',1000);

select * from customerrev;

quit

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 1 --delete-target-dir --target-dir
/user/cloudera/revimport

hadoop fs -ls /user/cloudera/revimport

hadoop fs -cat /user/cloudera/revimport/*

==================
Slide 6 --- import chennai with two columns
==================

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 1 --where "city='chennai'" --columns
firstname,lastname --delete-target-dir --target-dir /user/cloudera/whereimport

hadoop fs -ls /user/cloudera/whereimport

hadoop fs -cat /user/cloudera/whereimport/*

==================
Slide 7 --- same with query
==================

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera -m 1 --query "select firstname,lastname from customerrev where
city='chennai' and \$CONDITIONS" --delete-target-dir --target-dir
/user/cloudera/queryimport;

hadoop fs -ls /user/cloudera/queryimport

hadoop fs -cat /user/cloudera/queryimport/*

==================
Slide 8 --- Insert 11 and 12 alone
==================

========Normal Import===========

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 1 --delete-target-dir --target-dir
/user/cloudera/inimport

hadoop fs -ls /user/cloudera/inimport

hadoop fs -cat /user/cloudera/inimport/part-m-00000

========Add records===========

mysql -uroot -pcloudera

use zeyodbrev;
insert into customerrev values(11,'mohamed','imran','hyderabad',33,'2015-09-
23',1000);
insert into customerrev values(12,'mohamed','imran','hyderabad',33,'2015-09-
23',1000);
select * from customerrev;
quit

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 1 --target-dir /user/cloudera/inimport --
incremental append --check-column custid --last-value 10

hadoop fs -ls /user/cloudera/inimport

hadoop fs -cat /user/cloudera/inimport/part-m-00001

==================
Slide 9 --- Job
==================

echo -n cloudera>/home/cloudera/pfile
hadoop fs -rmr /user/cloudera/incrementalappendjob

sqoop job --create injobrev -- import --connect jdbc:mysql://localhost/zeyodbrev --

username root --password-file file:///home/cloudera/pfile --table customerrev -m 1
--target-dir /user/cloudera/incrementalappendjob --incremental append --check-
column custid --last-value 0;

sqoop job --list

sqoop job --exec injobrev

hadoop fs -ls /user/cloudera/incrementalappendjob

hadoop fs -cat /user/cloudera/incrementalappendjob/part-m-00000

sqoop job --show injobrev

==================
Slide 10 --- Parquet
==================

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 1 --delete-target-dir --target-dir
/user/cloudera/parquetimport --as-parquetfile

hadoop fs -ls /user/cloudera/parquetimport

==================
Slide 11 --- Parquet
==================

Sequence File Format --

TextFile - Readable,Row format, Huge in size,Query takes time

Avro- Row format, 60% Compression,Query takes time,Schema evolution
Parquet - Columnar, 60-80%Compression, query faster, Predicate pushdown,Target
System
orc - Columnar,90%Compression, query faster but not as parquet,Historical storage

==================
Slide 12 --- Parquet
==================

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

cloudera --table customerrev -m 2 --split-by custid --delete-target-dir --target-
dir /user/cloudera/mulmappers

hadoop fs -ls /user/cloudera/mulmappers

==================
Slide 14 Hive
==================

Hive is layer on HDFS

ETL- SQL and ELT - Hive
Load Time parsing and Query time parsing

==================
Slide 15 Hive
==================

hive --type and Go Inside

create database if not exists revhivedb;

use revhivedb;
create table revhivetab(id int,name string,chk string) row format delimited fields
terminated by ',';
quit;
hadoop fs -ls /user/hive/warehouse/
hadoop fs -ls /user/hive/warehouse/revhivedb.db/

==================
Slide 16 Hive
==================

cd
echo 1,Sai,I>INDTxns
echo 2,zeyo,I>>INDTxns
hive --type and Go Inside

use revhivedb;
load data local inpath '/home/cloudera/INDTxns' into table revhivetab;
select * from revhivetab;
quit;

==================
Slide 17 Hive
==================

cd
echo 1,Sai,I>INDTxns
echo 2,zeyo,I>>INDTxns
hadoop fs -rmr /user/cloudera/ldir
hadoop fs -mkdir /user/cloudera/ldir
hadoop fs -put INDTxns /user/cloudera/ldir

hive --type and Go Inside

create database if not exists revhivedb;

use revhivedb;
create table loctab(id int,name string,chk string) row format delimited fields
terminated by ',' location '/user/cloudera/ldir';
select * from loctab;
drop table loctab;
quit;

hadoop fs -ls /user/cloudera ------------u will not see ldir

==================
Slide 17 Hive
==================

cd
echo 1,Sai,I>INDTxns
echo 2,zeyo,I>>INDTxns
hadoop fs -rmr /user/cloudera/ldir
hadoop fs -mkdir /user/cloudera/ldir
hadoop fs -put INDTxns /user/cloudera/ldir

hive --type and Go Inside

create database if not exists revhivedb;

use revhivedb;
create external table loctabexternal(id int,name string,chk string) row format
delimited fields terminated by ',' location '/user/cloudera/ldir';
select * from loctabexternal;
drop table loctabexternal;
quit;

hadoop fs -ls /user/cloudera/ ------------u will see ldir

Big Data Practice
No ratings yet
Big Data Practice
93 pages
Sqoop Demo
No ratings yet
Sqoop Demo
7 pages
Lab Experiments 1,2&4
No ratings yet
Lab Experiments 1,2&4
8 pages
Data Ingest
No ratings yet
Data Ingest
5 pages
Session9 DataIngestion SQOOP
No ratings yet
Session9 DataIngestion SQOOP
4 pages
Cloudera Msazure Hadoop Deployment Guide
No ratings yet
Cloudera Msazure Hadoop Deployment Guide
39 pages
Data Import and Analytics Guide
No ratings yet
Data Import and Analytics Guide
10 pages
Sqoop Commands
No ratings yet
Sqoop Commands
4 pages
Hive 1
No ratings yet
Hive 1
3 pages
Week 3
No ratings yet
Week 3
11 pages
Apache Hive Notes
No ratings yet
Apache Hive Notes
15 pages
This Documents Are About Apache Sqoop
No ratings yet
This Documents Are About Apache Sqoop
23 pages
Hive Commands Simplin
No ratings yet
Hive Commands Simplin
5 pages
Sqoop 1
No ratings yet
Sqoop 1
29 pages
Slide 4 Data Loading Tool
No ratings yet
Slide 4 Data Loading Tool
77 pages
Hive Setup for Data Analysts
No ratings yet
Hive Setup for Data Analysts
2 pages
Hive Exercises
No ratings yet
Hive Exercises
3 pages
Cloudera & MySQL Setup Guide
No ratings yet
Cloudera & MySQL Setup Guide
5 pages
Lab ADT 1
No ratings yet
Lab ADT 1
31 pages
Cloudera Academic Partnership 8 PDF
No ratings yet
Cloudera Academic Partnership 8 PDF
69 pages
BDA 02 - Sqoop Installation
No ratings yet
BDA 02 - Sqoop Installation
13 pages
Impala vs Hive: Big Data Analytics
No ratings yet
Impala vs Hive: Big Data Analytics
33 pages
Sqoop Incremental Import PP 200913 222451 Unlocked
No ratings yet
Sqoop Incremental Import PP 200913 222451 Unlocked
27 pages
Hive Exercises
No ratings yet
Hive Exercises
7 pages
Hive Tutorial for Data Analysts
No ratings yet
Hive Tutorial for Data Analysts
11 pages
Sqoop Commands for MySQL Import
No ratings yet
Sqoop Commands for MySQL Import
12 pages
04 Sqoop
No ratings yet
04 Sqoop
30 pages
7th Jan FSDSnov (Hive Fsds Nov)
No ratings yet
7th Jan FSDSnov (Hive Fsds Nov)
6 pages
Ex3-Query Processing Using Hive and Beeswax
No ratings yet
Ex3-Query Processing Using Hive and Beeswax
4 pages
Creating A Table in RDBMS 3 2. Importing RDBMS Data Into H DFS 3 Exporting HDFS Data To RDBMS .. 6
No ratings yet
Creating A Table in RDBMS 3 2. Importing RDBMS Data Into H DFS 3 Exporting HDFS Data To RDBMS .. 6
5 pages
Hive Setup for Data Engineers
No ratings yet
Hive Setup for Data Engineers
8 pages
Cp4152 Database Practice Lab Manual R 2021
No ratings yet
Cp4152 Database Practice Lab Manual R 2021
48 pages
Hive Intoduction and Tables
No ratings yet
Hive Intoduction and Tables
31 pages
Sqoop Data Transfer Guide
No ratings yet
Sqoop Data Transfer Guide
9 pages
Apache Hive for Data Analysts
No ratings yet
Apache Hive for Data Analysts
51 pages
Sqoop Import Techniques Guide
No ratings yet
Sqoop Import Techniques Guide
18 pages
Bigdata@master: 4.set The Environmental Variable HIVE - HOME in Bashrc File
No ratings yet
Bigdata@master: 4.set The Environmental Variable HIVE - HOME in Bashrc File
91 pages
Sqoop Practice
No ratings yet
Sqoop Practice
5 pages
HDFSandhivecommands
No ratings yet
HDFSandhivecommands
15 pages
Class 4
No ratings yet
Class 4
3 pages
Using Sqooptool To Transfer Data Between Hadoop and Mysql: Implementation
No ratings yet
Using Sqooptool To Transfer Data Between Hadoop and Mysql: Implementation
4 pages
Hadoop Exam
No ratings yet
Hadoop Exam
67 pages
How Sqoop Works?: Sqoop "SQL To Hadoop and Hadoop To SQL"
No ratings yet
How Sqoop Works?: Sqoop "SQL To Hadoop and Hadoop To SQL"
27 pages
06 ImpalaHiveDataModeling
No ratings yet
06 ImpalaHiveDataModeling
47 pages
Production Issues: in Beginning Almost Every Time!
No ratings yet
Production Issues: in Beginning Almost Every Time!
8 pages
Sqoop Commands for Data Engineers
No ratings yet
Sqoop Commands for Data Engineers
2 pages
Spark SQL Hands - On
No ratings yet
Spark SQL Hands - On
3 pages
Sqoop MySQL to HDFS Data Transfer Guide
No ratings yet
Sqoop MySQL to HDFS Data Transfer Guide
7 pages
How Sqoop Works?: Relationaldatabase Servers in The Relational Database Structure
No ratings yet
How Sqoop Works?: Relationaldatabase Servers in The Relational Database Structure
7 pages
Sqoop Cammand
No ratings yet
Sqoop Cammand
8 pages
Hive
No ratings yet
Hive
29 pages
Knowledge About Apache Sqoop and Its All Basic Commands To Import and Export The Data
No ratings yet
Knowledge About Apache Sqoop and Its All Basic Commands To Import and Export The Data
7 pages
Hive Programs
No ratings yet
Hive Programs
7 pages
Module IV
No ratings yet
Module IV
5 pages
Visual Database Design for Teams
No ratings yet
Visual Database Design for Teams
21 pages
Mod 2
No ratings yet
Mod 2
70 pages
HiveQL Overview
No ratings yet
HiveQL Overview
71 pages
Practical 1-4
No ratings yet
Practical 1-4
14 pages
07 07 2025 SR Star Test 2 MS
No ratings yet
07 07 2025 SR Star Test 2 MS
6 pages
RFU and Applicationa and Tools Upgrade
No ratings yet
RFU and Applicationa and Tools Upgrade
56 pages
Data Frame
No ratings yet
Data Frame
17 pages
SQL Manual New
100% (2)
SQL Manual New
26 pages
Exporting SAP Version Databases
No ratings yet
Exporting SAP Version Databases
2 pages
DWH Architecture & Concepts
No ratings yet
DWH Architecture & Concepts
37 pages
Introduction To Data Analytics
No ratings yet
Introduction To Data Analytics
12 pages
Surrogate vs Natural Keys in ERD
No ratings yet
Surrogate vs Natural Keys in ERD
70 pages
JDBC Basics for Java Developers
100% (3)
JDBC Basics for Java Developers
53 pages
Icdl Module 5
No ratings yet
Icdl Module 5
2 pages
Recoverable Database Schedules Guide
No ratings yet
Recoverable Database Schedules Guide
15 pages
98 364 Questions
No ratings yet
98 364 Questions
6 pages
MCS 043
No ratings yet
MCS 043
4 pages
SQL Queries for Student Database
No ratings yet
SQL Queries for Student Database
12 pages
Alteryx Session 1
No ratings yet
Alteryx Session 1
13 pages
Exadata Backup
100% (1)
Exadata Backup
27 pages
NOSQL Lab Book
No ratings yet
NOSQL Lab Book
33 pages
Securiti - Ai Level 2 Notes
No ratings yet
Securiti - Ai Level 2 Notes
12 pages
Ultima Mentor Required Data Inputs For Huawei PDF
No ratings yet
Ultima Mentor Required Data Inputs For Huawei PDF
23 pages
Ty Bca Se Vi 2023 24
No ratings yet
Ty Bca Se Vi 2023 24
6 pages
Informatica Cloud Platform - kb570422
No ratings yet
Informatica Cloud Platform - kb570422
3 pages
DBMS Queries For 6th Sem
No ratings yet
DBMS Queries For 6th Sem
1 page
Oracle Database Error Troubleshooting
No ratings yet
Oracle Database Error Troubleshooting
10 pages
Airline Reservation Practical File Final
No ratings yet
Airline Reservation Practical File Final
8 pages
Sports Club DBMS Project
No ratings yet
Sports Club DBMS Project
39 pages
Data Manipulation Using SQL
No ratings yet
Data Manipulation Using SQL
5 pages
Chapter 2 Data Models Final
No ratings yet
Chapter 2 Data Models Final
18 pages
GP Getting Started
No ratings yet
GP Getting Started
56 pages
HDL Basics
No ratings yet
HDL Basics
4 pages
Earmarked Fund Archiving (FI-FM)
No ratings yet
Earmarked Fund Archiving (FI-FM)
4 pages

Revision Solution

Uploaded by

Revision Solution

Uploaded by

*Cloudera Folks Revision*

mysql -uroot -pcloudera

CREATE TABLE customerrev(custid INT,firstname VARCHAR(20),lastname VARCHAR(20),city

insert into customerrev values(1,'Arun','Kumar','chennai',33,'2015-09-20',100000);

select * from customerrev;

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/revimport

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/whereimport

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/queryimport

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/inimport

mysql -uroot -pcloudera

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/inimport

sqoop job --create injobrev -- import --connect jdbc:mysql://localhost/zeyodbrev --

sqoop job --list

sqoop job --exec injobrev

hadoop fs -ls /user/cloudera/incrementalappendjob

sqoop job --show injobrev

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/parquetimport

Sequence File Format --

TextFile - Readable,Row format, Huge in size,Query takes time

sqoop import --connect jdbc:mysql://localhost/zeyodbrev --username root --password

hadoop fs -ls /user/cloudera/mulmappers

Hive is layer on HDFS

hive --type and Go Inside

create database if not exists revhivedb;

hive --type and Go Inside

create database if not exists revhivedb;

hadoop fs -ls /user/cloudera ------------u will not see ldir

hive --type and Go Inside

create database if not exists revhivedb;

hadoop fs -ls /user/cloudera/ ------------u will see ldir

You might also like

Cloudera Folks Revision