首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
Kettle教程一:Kettle简介和Kettle的部署安装
2、Kettle简介 Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 3、kettle的核心组件 4、Kettle的概念模型 Kettle的执行分为两个层次:Job(作业)和Transformation(转换)。 二 安装Kettle 1、kettle下载地址和教程链接: 官网各个版本下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration / B站2019kettle8.2最新教程:https://www.bilibili.com/video/BV1jE411B7J8 国内kettle论坛网:https://www.kettle.net.cn 4、打开kettle只需要运行spoon.bat,即可打开spoon图形工具: 5、Kettle目录文件介绍 三 常见的kettle报错 1、打开kettle后一闪而过就没了 可能有如下原因:
浩Coding
2021-01-29
87.9K0
标签:
kettle 性能优化_kettle过滤记录
本章主要是介绍Kettle的性能优化及效率提升。 一、Kettle调优 1、 调整JVM大小进行性能优化 修改Kettle定时任务中的Kitchen或Pan或Spoon脚本: 修改脚本代码片段 set OPT=-Xmx512m -cp %CLASSPATH % -Djava.library.path=libswt\win32\ -DKETTLE_HOME=”%KETTLE_HOME%” -DKETTLE_REPOSITORY=”%KETTLE_REPOSITORY %” -DKETTLE_USER=”%KETTLE_USER%” -DKETTLE_PASSWORD=”%KETTLE_PASSWORD%” -DKETTLE_PLUGIN_PACKAGES=”% KETTLE_PLUGIN_PACKAGES%” -DKETTLE_LOG_SIZE_LIMIT=”%KETTLE_LOG_SIZE_LIMIT%” 参数参考: -Xmx1024m:设置JVM最大可用内存为
全栈程序员站长
2022-11-08
5.2K0
标签:
Kettle与Hadoop(一)Kettle简介
Kettle是一款流行的ETL(Extract-Transform-Load,即数据抽取、转换、装载)工具,并可用来操作Hadoop上的数据。Kettle是用Java语言开发的。 后来Pentaho公司获得了Kettle源代码的版权,Kettle也随之更名为Pentaho Data Integration,简称PDI。 一、Kettle设计原则 Kettle工具在设计之初就考虑到了一些设计原则,这些原则也借鉴了以前使用过的其它一些ETL工具积累下的经验和教训。 Kettle里的图就是转换和作业。可视化编程一直是Kettle里的核心概念,它可以让用户快速构建复杂的ETL作业和降低维护工作量。Kettle中的设计开发工作几乎都可以通过简单的拖拽来完成。 参见“Kettle数据库连接中的集群与分片” 六、工具 Kettle里有不同的工具,用于ETL的不同阶段。
用户1148526
2025-10-29
4.9K0
标签:
kettle教程(1) 简单入门、kettle简单插入与更新。打开kettle
本文要点:Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新:kettle会自动对比用户设置的对比字段,若目标表不存在该字段,则新插入该条记录。若存在,则更新。 Kettle简介:Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。 (引用百度百科) 1、Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)   kettle的最新下载地址:http://community.pentaho.com/projects /data-integration/ 2、打开kettle。 到这里,一个简单的通过作业调度的kettle就算做完了。
全栈程序员站长
2022-08-25
8.6K0
标签:
kettle学习笔记(二)——kettle基本使用
Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。 Encr.bat: 密码加密   转换和作业: Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。   
HUC思梦
2020-09-03
7K0
标签:
kettle学习笔记(四)——kettle输入步骤
    • 生成记录/自定义常量     • 获取系统信息     • 表输入     • 文本文件输入     • XML 文件输入     • Json输入     • 其他输入步骤
HUC思梦
2020-09-03
6.5K0
标签:
kettle学习笔记(五)——kettle输出步骤
  数据库表:     • 表输出     • 更新,删除,插入/更新     • 批量加载(mysql,oracle)     • 数据同步   文件:     • SQL 文件输出     • 文本文件输出     • XML 输出     • Excel Output/Excel Writer   其他(报表、应用)
HUC思梦
2020-09-03
5.3K0
标签:
安装kettle
> set global time_zone='+8:00'; 方法二: 修改my.ini文件,在[mysqld]加入以下命令: default-time-zone='+8:00' 方法三: 修改kettle
botkenni
2022-05-06
1.8K0
标签:
kettle调度监控平台(kettle-scheduler)开源
背景 Kettle作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。 所以大家在实施kettle作业调度功能的时候,通常采用以下几种方式:使用spoon程序来启动Job,使用crontab或计划任务,自主开发java程序来调用kettle的类库。 项目介绍 Kettle调度监控平台(以下简称KS)是一个自主开发的javaweb程序,专门用来调度和监控由kettle客户端创建的job和transformation。 # Kettle Properties #绝对路径,用于初始化kettle环境变量(.kettle/kettle.properties所在路径),指向kettle根目录(例如 D:\data-integration ) kettle.home=D:\\data-integration #绝对路径kettle下plugins文件 kettle.plugin=E:\\zhaxiaodong\\apache-tomcat
全栈程序员站长
2025-07-01
13K0
标签:
Kettle与Hadoop(二)Kettle安装配置
五、配置 Kettle运行环境内的一些因素会影响Kettle的运行方式。这些因素包括配置文件、与Kettle集成在一起的外部软件。我们把这些因素统称为Kettle的配置。 1. 配置文件和.kettle目录 Kettle运行环境中有几个文件影响了Kettle的运行情况。 这些文件可以看成是Kettle配置文件,当Kettle做了环境移植或升级时,这些文件也要随之改变,包括: .spoonrc jdbc.properties kettle.properties kettle.pwd (3)kettle.properties kettle.properties文件是一个通用的保存在Kettle属性的文件。 kettle.pwd文件位于Kettle根目录下的pwd目录下。
用户1148526
2020-06-01
8.6K0
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档