• Складчины
  • Программирование

[Stepik] Data Engineering Fast‑Track: Kafka → Airflow → Spark

Найти складчину
  • Дата начала 3 Окт 2025
Цена: 195 РУБ
Список участников складчины:
  • 1. ник скрыт
Показать больше
Записаться и Купить Записаться
Скачать курс
Скачать Скачать Скачать
Robot
Складчик
  • 3 Окт 2025
  • #1

[Stepik] Data Engineering Fast‑Track: Kafka → Airflow → Spark

Ссылка на картинку
Практический fast-track по data engineering: за 4–6 недель собираем рабочий конвейер Kafka → Spark → Lakehouse под управлением Airflow. Разберём batch и streaming, окна и watermark, схемы и контракты. Мини‑проекты, Docker Compose, шаблоны DAG и пайплайнов. Курс подойдёт инженерам, аналитикам и тем, кто хочет освоить современные пайплайны данных с уверенным Python.
Чему вы научитесь
  • Проектировать конвейер данных Kafka → Spark → Lakehouse под управлением Airflow.
  • Поднимать локальное окружение через Docker Compose и воспроизводимо деплоить пайплайны.
  • Делать batch и streaming в Spark, настраивать окна и watermark.
  • Читать/писать данные в Parquet и табличные форматы Delta/Iceberg, избегать «small files».
  • Настраивать DAG: расписания, retries, SLA, catchup, datasets.
  • Подключать источники/приёмники через Kafka Connect/Schema Registry, понимать EOS/idempotency.
  • Писать базовые тесты качества данных (freshness/completeness) и алерты по свежести.
  • Выполнять backfill и разруливать инциденты (сломалась схема, отставание потребителей).
Читать далее...
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть скрытый контент.
Поиск по тегу:
Теги
airflow kafka stepik конвейер данных
Похожие складчины
Скачать [Stepik] Apache Airflow для аналитиков данных [Дмитрий Новиков]
  • 22 Авг 2021
  • в разделе: Программирование
Скачать [stepik] Kafka на Java с нуля [Николай Степанов]
  • 20 Июн 2025
  • в разделе: Программирование
Скачать [Stepik] Асинхронные микросервисы с Apache Kafka на Python [Владимир Кириевский]
  • 31 Май 2025
  • Python
  • в разделе: Python
Скачать [Школа Больших Данных] KAFKA: Курс Администрирование кластера Kafka
  • 1 Мар 2024
  • в разделе: Программирование
Скачать [bigdata team] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka
  • 10 Май 2023
  • в разделе: Программирование

Войдите или зарегистрируйтесь!

Учетная запись позволит вам участвовать в складчинах и оставлять комментарии

Регистрация

Создайте аккаунт. Это просто!

Регистрация

Вход

Вы уже зарегистрированы? Войдите.

Войти
  • Складчины
  • Программирование
  • Russian (RU)
  • Обратная связь
  • Условия и правила
  • Политика конфиденциальности
  • Справка