腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
Kettle
教程一:
Kettle
简介和
Kettle
的部署安装
2、
Kettle
简介
Kettle
是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 3、
kettle
的核心组件 4、
Kettle
的概念模型
Kettle
的执行分为两个层次:Job(作业)和Transformation(转换)。 二 安装
Kettle
1、
kettle
下载地址和教程链接: 官网各个版本下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration / B站2019
kettle
8.2最新教程:https://www.bilibili.com/video/BV1jE411B7J8 国内
kettle
论坛网:https://www.
kettle
.net.cn 4、打开
kettle
只需要运行spoon.bat,即可打开spoon图形工具: 5、
Kettle
目录文件介绍 三 常见的
kettle
报错 1、打开
kettle
后一闪而过就没了 可能有如下原因:
浩Coding
2021-01-29
87.9K
0
标签:
ide
运维
大数据
kettle
性能优化_
kettle
过滤记录
本章主要是介绍
Kettle
的性能优化及效率提升。 一、
Kettle
调优 1、 调整JVM大小进行性能优化 修改
Kettle
定时任务中的Kitchen或Pan或Spoon脚本: 修改脚本代码片段 set OPT=-Xmx512m -cp %CLASSPATH % -Djava.library.path=libswt\win32\ -DKETTLE_HOME=”%
KETTLE
_HOME%” -DKETTLE_REPOSITORY=”%
KETTLE
_REPOSITORY %” -DKETTLE_USER=”%
KETTLE
_USER%” -DKETTLE_PASSWORD=”%
KETTLE
_PASSWORD%” -DKETTLE_PLUGIN_PACKAGES=”%
KETTLE
_PLUGIN_PACKAGES%” -DKETTLE_LOG_SIZE_LIMIT=”%
KETTLE
_LOG_SIZE_LIMIT%” 参数参考: -Xmx1024m:设置JVM最大可用内存为
全栈程序员站长
2022-11-08
5.2K
0
标签:
数据库
sql
云数据库 SQL Server
大数据
Kettle
与Hadoop(一)
Kettle
简介
Kettle
是一款流行的ETL(Extract-Transform-Load,即数据抽取、转换、装载)工具,并可用来操作Hadoop上的数据。
Kettle
是用Java语言开发的。 后来Pentaho公司获得了
Kettle
源代码的版权,
Kettle
也随之更名为Pentaho Data Integration,简称PDI。 一、
Kettle
设计原则
Kettle
工具在设计之初就考虑到了一些设计原则,这些原则也借鉴了以前使用过的其它一些ETL工具积累下的经验和教训。
Kettle
里的图就是转换和作业。可视化编程一直是
Kettle
里的核心概念,它可以让用户快速构建复杂的ETL作业和降低维护工作量。
Kettle
中的设计开发工作几乎都可以通过简单的拖拽来完成。 参见“
Kettle
数据库连接中的集群与分片” 六、工具
Kettle
里有不同的工具,用于ETL的不同阶段。
用户1148526
2025-10-29
4.9K
0
标签:
数据库
大数据
sql
编程算法
数据结构
kettle
教程(1) 简单入门、
kettle
简单插入与更新。打开
kettle
本文要点:
Kettle
的建立数据库连接、使用
kettle
进行简单的全量对比插入更新:
kettle
会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。
Kettle
简介:
Kettle
是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。 (引用百度百科) 1、
Kettle
的下载与安装(在本文中使用的
kettle
版本为6.1.0.1-196)
kettle
的最新下载地址:http://community.pentaho.com/projects /data-integration/ 2、打开
kettle
。 到这里,一个简单的通过作业调度的
kettle
就算做完了。
全栈程序员站长
2022-08-25
8.6K
0
标签:
数据库
sql
大数据
java
https
kettle
学习笔记(二)——
kettle
基本使用
Carte.bat: 启动web服务,用于
Kettle
的远程运行或集群运行。 Encr.bat: 密码加密 转换和作业:
Kettle
的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。
HUC思梦
2020-09-03
7K
0
标签:
bat
kettle
shift
transformation
kettle
学习笔记(四)——
kettle
输入步骤
• 生成记录/自定义常量 • 获取系统信息 • 表输入 • 文本文件输入 • XML 文件输入 • Json输入 • 其他输入步骤
HUC思梦
2020-09-03
6.5K
0
标签:
编程算法
xml
kettle
学习笔记(五)——
kettle
输出步骤
数据库表: • 表输出 • 更新,删除,插入/更新 • 批量加载(mysql,oracle) • 数据同步 文件: • SQL 文件输出 • 文本文件输出 • XML 输出 • Excel Output/Excel Writer 其他(报表、应用)
HUC思梦
2020-09-03
5.3K
0
标签:
编程算法
数据库
sql
云数据库 SQL Server
utf8
安装
kettle
> set global time_zone='+8:00'; 方法二: 修改my.ini文件,在[mysqld]加入以下命令: default-time-zone='+8:00' 方法三: 修改
kettle
botkenni
2022-05-06
1.8K
0
标签:
数据库
云数据库 SQL Server
sql
kettle
调度监控平台(
kettle
-scheduler)开源
背景
Kettle
作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但
kettle
本身的调度监控功能却非常弱。 所以大家在实施
kettle
作业调度功能的时候,通常采用以下几种方式:使用spoon程序来启动Job,使用crontab或计划任务,自主开发java程序来调用
kettle
的类库。 项目介绍
Kettle
调度监控平台(以下简称KS)是一个自主开发的javaweb程序,专门用来调度和监控由
kettle
客户端创建的job和transformation。 #
Kettle
Properties #绝对路径,用于初始化
kettle
环境变量(.
kettle
/
kettle
.properties所在路径),指向
kettle
根目录(例如 D:\data-integration )
kettle
.home=D:\\data-integration #绝对路径
kettle
下plugins文件
kettle
.plugin=E:\\zhaxiaodong\\apache-tomcat
全栈程序员站长
2025-07-01
13K
0
标签:
tomcat
访问管理
linux
http
Kettle
与Hadoop(二)
Kettle
安装配置
五、配置
Kettle
运行环境内的一些因素会影响
Kettle
的运行方式。这些因素包括配置文件、与
Kettle
集成在一起的外部软件。我们把这些因素统称为
Kettle
的配置。 1. 配置文件和.
kettle
目录
Kettle
运行环境中有几个文件影响了
Kettle
的运行情况。 这些文件可以看成是
Kettle
配置文件,当
Kettle
做了环境移植或升级时,这些文件也要随之改变,包括: .spoonrc jdbc.properties
kettle
.properties
kettle
.pwd (3)
kettle
.properties
kettle
.properties文件是一个通用的保存在
Kettle
属性的文件。
kettle
.pwd文件位于
Kettle
根目录下的pwd目录下。
用户1148526
2020-06-01
8.6K
0
标签:
大数据
java
jar
xml
数据库
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档