Hooked on Hadoop: Log parsing in Hadoop -Part 2: Hive

Tuesday, July 2, 2013

Log parsing in Hadoop -Part 2: Hive

This post includes sample scripts, data and commands to parse a log file in Hive using regex serde.

Related blogs:

Log parsing in Hadoop -Part 1: Java
Log parsing in Hadoop -Part 2: Hive
Log parsing in Hadoop -Part 3: Pig
Log parsing in Hadoop -Part 4: Python
Log parsing in Hadoop -Part 5: Cascading
Log parsing in Hadoop -Part 6: Morphlines

8 comments:

UnknownNovember 19, 2013 at 10:06 AM
Good work. connect on google+
ReplyDelete
Replies
Anagha KhanolkarJanuary 1, 2014 at 9:51 PM
Thanks Prashant.
ReplyDelete
Replies
RamuFebruary 6, 2014 at 1:09 PM
good work...!
can you please share me any tutorial for regex on hive.
ReplyDelete
Replies
dinakaranAugust 13, 2014 at 11:43 PM
This comment has been removed by the author.
ReplyDelete
Replies
UnknownAugust 12, 2015 at 8:45 AM
Hi Anagha,
When i query the table it doesn't showing any data. please help me
The following steps i followed.
step:1
CREATE EXTERNAL TABLE reg_serde(
month_name STRING,
day STRING,
time STRING,
host STRING,
event STRING,
log STRING)
PARTITIONED BY(year int, month int)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "(\\w+)\\s+(\\d+)\\s+(\\d+:\\d+:\\d+)\\s+(\\w+\\W*\\w*)\\s+(.*?\\:)\\s+(.*$)"
)
stored as textfile;
-----------------------------------------------------------------------------------
step:2 load data into table

hive> load data local inpath '/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/04/messages' into table reg_serde;
Copying data from file:/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/04/messages
Copying file: file:/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/04/messages
Loading data to table hive_joins.reg_serde
OK
Time taken: 0.814 seconds

hive> load data local inpath '/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/05/messages' into table reg_serde;
Copying data from file:/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/05/messages
Copying file: file:/home/training/data/hive/regserde/LogParserSampleHive/logs/airawat-syslog/2013/05/messages
Loading data to table hive_joins.reg_serde
OK
Time taken: 3.193 seconds
------------------------------------------------------------------------------------
step:3 select statement
hive> select * from reg_serde;
OK
Time taken: 0.13 seconds
ReplyDelete
Replies
UnknownJuly 8, 2018 at 5:18 AM
thakyou it vry nice blog for beginners
https://www.emexotechnologies.com/courses/big-data-analytics-training/big-data-hadoop-training/
ReplyDelete
Replies
RenuAugust 17, 2018 at 3:00 AM
Good Post! Thank you so much for sharing this pretty post, it was so good to read and useful to improve my knowledge as updated one, keep blogging.

https://www.emexotechnologies.com/online-courses/big-data-hadoop-training-in-electronic-city/

ReplyDelete
Replies
raveenaMarch 7, 2020 at 9:07 PM
Thanks
Big Data and Hadoop Online Training
ReplyDelete
Replies

Add comment

Hooked on Hadoop

Tuesday, July 2, 2013

Log parsing in Hadoop -Part 2: Hive

8 comments:

Search

Blog archive

Popular Posts

Total Pageviews