Kettle5.4统计各部门工资总额-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Kettle5.4统计各部门工资总额

阅读量：4149 次

发布时间：2019-05-25

本文共 1426 字，大约阅读时间需要 4 分钟。

Kettle5.4统计各部门工资总额

实验环境及配置

版本：hadoop-2.7.3

模式：伪分布式

网络模式：NAT

虚拟机ip：192.168.215.135（读者根据自己得实际情况修改）

虚拟机主机名称：hadoop001

虚拟机内存：4G

kettle版本5.4（由于虚拟机内存有限，尽量使用低版本的）

kettle环境安装及配置（参考之前的博客）

一、任务说明

利用Kettle设计实现求出各个部分员工工资总和。

测试数据：

二、设计转换和作业

设计mapper的转换

设计reducer转换

设计Job作业

三、配置转换和作业

配置mapper转换
1. 上图所示中的 "Input"指的是左边菜单栏中Big Data菜单下的MapReduce Input 组件，双击进行编辑：
2. 上图所示中的"拆分字段" 指的是左边菜单栏中“转换”菜单下的“拆分字段”组件，双击进行编辑：注意： 其中的"字段名称":可以任意取名的，按照如图进行配置
3. 上图所示中的"利用Janino计算Java表达式" 指的是左边菜单栏中"脚本"菜单下的“利用Janino计算Java表达式” 组件，双击进行编辑：
4. 配置“利用Janino计算Java表达式"，如下所示：
5. 上图所示中的

配置reducer转换
1. 根据设计图，图中的 "Input"指的是左边菜单栏中Big Data菜单下的MapReduce Input 组件，双击进行编辑：
2. 上图所示中的"在内存进行分组" 指的是左边菜单栏中"统计"菜单下的“在内存进行分组” 组件，双击进行编辑：
3. 上图所示中的"ouput" 指的是左边菜单栏中Big Data菜单下的MapReduce Output 组件，双击进行编辑：

配置Job作业
1. 上图所示中的"START" 指的是左边菜单栏中"通用"菜单下的START组件，如下所示：
2. 上图所示中的"Pentaho MapReduce" 指的是左边菜单栏中Big Data菜单下的Pentaho MapReduce组件，双击进行编辑：
  1. 【A】配置Hadoop Cluster:
    
    特别注意： 如下配置，如果在Windows上(C:\Windows\System32\drivers\etc\hosts)配置了虚拟机主机名称和虚拟机的IP映射关系，则如下配置写IP地址或者主机名称都可以
  2. 【B】配置Mapper，把之前新建的mapper的转换放进来
  3. 【C】配置reducer，把之前新建的reducer的转换放进来
  4. 【D】配置Job Setup
  5. 【E】配置Cluster，选择自己新建的Hadoop Cluster即可

四、运行转换和作业

前提： 运行前，务必确保hadoop集群已经启动，并且HDFS上input目录下有文件，我的文件是testData.txt，文件内容就是前文所述的【测试数据】

选择job任务，切换到job视图后，点击kettle工作区顶部的启动按钮，在弹窗中，点击执行按钮

运行

五、查看结果

在kettle控制台查看结果：

在Hadoop上查看结果，即查看Yarn容器上是否接收到该任务：

等待执行结束！

成功后的查看结果：如成功，则可以查看下HDFS上的结果：
执行： hdfs dfs -cat /user/root/mr/emp/part-00000

如不成功，请查看报错日志，解决错误后，请在继续上述步骤
我的成功了_{，可以喝杯咖啡去咯}祝大家好运！！！！！

转载地址：http://rkpti.baihongyu.com/

你可能感兴趣的文章

[LeetCode]Combination Sum II

[LeetCode]Combinations

[LeetCode]Construct Binary Tree from Inorder and Postorder Traversal

[LeetCode]Convert Sorted Array to Binary Search Tree

[LeetCode]Longest Valid Parentheses

[LeetCode]Maximal Rectangle

[LeetCode]Maximum Subarray

[LeetCode]Median of Two Sorted Arrays

[LeetCode]Merge Intervals

[LeetCode]Merge k Sorted Lists

[LeetCode]Merge Sorted Array

[LeetCode]Merge Two Sorted Lists

[LeetCode]Minimum Depth of Binary Tree

[LeetCode]Minimum Path Sum

[LeetCode]Minimum Window Substring

[LeetCode]Multiply Strings

[LeetCode]N-Queens II

[LeetCode]Next Permutation

[LeetCode]Palindrome Number

[LeetCode]Palindrome Partitioning

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-23 06:33:33 当前IP: 3.145.61.170 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我