Skip to content

What we’re about

As data science becomes more common, the importance of data integration is being reaffirmed.
Even in the collection of open data, if it is distributed, integration requires tools rather than manual work.
The purpose of the user group is to share information between developers and users, and to make data integration easily available to everyone.
In Japan, there are multiple character codes.
It is also not easy to convert existing Gaiji (end-user-defined characters).
As APAC, we would like to focus on the CJKV issue as well.
Apache HOP is a forked version of Kettle 8.2.0.7, and Kettle is Pentaho Data Integration in Pentaho.
Apache HOP has many additional features compared to Kettle, such as configuration management and a pluggable runtime engine.
Let's keep adding useful features to make Apache Hop usable by everyone.
データサイエンスが一般的になるにつれ、データ統合の重要性が再認識されています。
オープンデータの収集だけを考えても、これだけ大量に分散していると、手作業ではなくツールが必要になります。
ユーザーグループの目的は、開発者とユーザーの間で情報を共有し、誰もが簡単にデータ・インテグレーションを利用できるようにすることです。
日本の場合、文字コードだけでも複数の複雑なものがあります。
また、既存の外字(エンドユーザーが定義した文字)の変換も簡単ではありません。
APACとしては、CJKVの問題にも注目していきたいと思います。
Apache HOPはKettle 8.2.0.7をフォークしたもので、KettleはPentahoのData Integrationです。
Apache HOPは、Kettleに比べて、構成管理やプラグインできるランタイムエンジンなど、多くの機能が追加されています。
これからも便利な機能を追加して、誰もが使えるApache Hopにしていきましょう。