数据笔记－桩白墨 plough

服务器单机部署 Flink 1.18.1

这个很简单，本来不打算记录的。但是今天需要在一台新机器上部署，忘记了关键步骤，还得去查官方文档。太麻烦。就在这里记一下步骤吧。 1 下载安装包 wget https://dlcdn.apache.org/flink/flink-1.18.1/flink-1.18.1-bin-scala_2.12.tgz --no-check-certificate 2 解压缩 tar -xvzf flink-1.

Flink
桩白墨
2024-05-07
479 热度
0评论

Flink 集成 KafkaSource

一个全新的 Flink Stream Api 项目，要从本地的 Kafka 中读取数据。本文给出 demo 代码。 0 前提说明截止 2024 年 4 月 25 日，Flink 1.19 版本没有提供 Kafka connector。所以，最多只能用 Flink 1.18 版本。 1 添加依赖在 pom.xml 中添加如下依赖： <dependency> <groupId&g

Flink
桩白墨
2024-04-25
566 热度
0评论

本地部署 Kafka

在本地部署一个用于测试的 Kafka，步骤如下。（以2.3.0版本为例）官方文档：https://kafka.apache.org/23/documentation.html#quickstart 部署启动下载安装包，wget https://archive.apache.org/dist/kafka/2.3.0/kafka_2.12-2.3.0.tgz 找一个目录，解压。tar -xvzf

Kafka
桩白墨
2024-04-25
410 热度
0评论

初次部署 Flink，WebUI 外网无法访问的问题

在服务器上部署了 Flink，启动集群。尝试访问 WebUI，浏览器却提示“xxx 拒绝了我们的连接请求。” 原因是，Flink 的 WebUI 默认不对外开放访问，需要修改配置文件。步骤如下： vi conf/flink-conf.yaml 打开配置文件找到 rest.bind-address，把值改为 0.0.0.0 重启 Flink 集群再次尝试访问，就可以进去了。

Flink
桩白墨
2024-04-24
371 热度
0评论

创建并运行一个 Flink Stream Api 的 HelloWorld 项目

工作需要，重拾 Flink，从最简单的 demo 开始上手。 1 创建项目假设需要从零开发一个 Stream Api 的项目，怎样搭建项目基础框架呢？使用 maven，执行以下命令： mvn archetype:generate \ -DarchetypeGroupId=org.apache.flink \ -DarchetypeArtifactId=flink-walkthrough-dat

Flink
桩白墨
2024-04-24
440 热度
0评论

Flink tutor 学习小结

这两天玩了几个 Flink 的 tutor，感觉蛮好的，篇幅短小，把大数据流式/batch处理的用法都讲到了。我简单总结一下，大家感兴趣可以去深入看看： 1. First Steps https://nightlies.apache.org/flink/flink-docs-release-1.14/docs/try-flink/local_installation/ 本地启动 Flink 集群，

Flink
桩白墨
2021-12-17
366 热度
0评论

Kafka 性能测试

Kafka
桩白墨
2020-10-23
76 热度
0评论

ClickHouse 数据表导出导入

ClickHouse
桩白墨
2020-07-11
102 热度
0评论

ClickHouse 分布式表数据去重

ClickHouse
桩白墨
2020-07-11
125 热度
0评论

FineBI 产品白皮书阅读笔记（待补充）

入职第一天，老大让我先阅读 FineBI 的文档，于是花了近两天的时间仔细阅读了产品白皮书，并用 FreeMind 记了重点。这个过程中又学到了不少新东西，了解到不少新名词。在这里做一个简单的笔记（大部分名词解释的内容摘录于维基百科／百度百科）。 1、FineBI BI，business intelligence，商业智能。它是数据仓库、OLAP 和数据挖掘等技术的综合运用，可以将现有的数据进行有

数据笔记
桩白墨
2016-06-27
86 热度
0评论