Data Engineering | про инжиниринг данных и аналитику | Infomate

🏢 %company% Engineering

AirBnb Engineering
последний пост 1 week, 6 days назад

Scaling beyond one: How Airbnb evolved its data architecture for a multi-product world

Sitar-agent: Building a reliable dynamic configuration sidecar at scale

When history fails you, borrow from geography

Scaling Airbnb’s identity graph with a unified knowledge graph infrastructure

Viaduct 1.0 and the future of Airbnb’s data mesh

Monitoring reliably at scale

Skipper: Building Airbnb’s embedded workflow engine

Building a fault-tolerant metrics storage system at Airbnb

Privacy-first connections: Empowering social experiences at Airbnb

Building a high-volume metrics pipeline with OpenTelemetry and vmagent

My Journey to Airbnb — Jonathan Woodard

What COVID did to our forecasting models (and what we built to handle the next shock)

From vendors to vanguard: Airbnb’s hard-won lessons in observability ownership

Recommending Travel Destinations to Help Users Explore

It Wasn’t a Culture Problem: Upleveling Alert Development at Airbnb

Netflix Engineering

Netflix Engineering
последний пост 1 час назад

Toward More Controllable AI Video Editing: An Early Research Exploration at Netflix

How Netflix Simplified Batch Compute with Kueue

The Data Canary: How Netflix Validates Catalog Metadata

Predicting Risk in Content Launches: How Data-Driven Insights can Transform Launch Planning

VMAF v1: Good Is Not Good Enough

A Human-Augmenting Agentic Workflow for Causal Inference

Thinking Fast & Slow for a Personalized Notification System

Dynamic Repartitioning for Time Series Workloads

From Silos to Service Topology: Why Netflix Built a Real-Time Service Map

The Evolution of Cassandra Data Movement at Netflix

Data Projects: Managing Data Assets at Netflix Scale

Scaling ArchUnit with Nebula ArchRules

Democratizing Machine Learning at Netflix: Building the Model Lifecycle Graph

Pinterest Engineering
последний пост 1 month назад

Making User-Sequence Data More Cost-Efficient, Faster, and Easier to Use

An Engineer’s Guide to Better AI Skills: Implementing a Testing Process to Optimize Agent…

Enhancing Ad Relevance: Integrating Real-Time Context into Sequential Recommender Models

Optimizing ML Workload Network Efficiency (Part I): Feature Trimmer

From Clicks to Conversions: Architecting Shopping Conversion Candidate Generation at Pinterest

Smarter URL Normalization at Scale: How MIQPS Powers Content Deduplication at Pinterest

Finding zombies in our systems: A real-world story of CPU bottlenecks

Scaling Recommendation Systems with Request-Level Deduplication

Performance for Everyone

Evolution of Multi-Objective Optimization at Pinterest Home feed

Building an MCP Ecosystem at Pinterest

Unified Context-Intent Embeddings for Scalable Text-to-SQL

Unifying Ads Engagement Modeling Across Pinterest Surfaces

Bridging the Gap: Diagnosing Online–Offline Discrepancy in Pinterest’s L1 Conversion Models

Piqama: Pinterest Quota Management Ecosystem

Facebook
последний пост 3 weeks, 6 days назад

SilverTorch: Index as Model — A New Retrieval Paradigm for Recommendation Systems

Reel Friends: Building Social Discovery that Scales to Billions

Modernizing the Facebook Groups Search to Unlock the Power of Community Knowledge

Capacity Efficiency at Meta: How Unified AI Agents Optimize Performance at Hyperscale

How Meta Used AI to Map Tribal Knowledge in Large-Scale Data Pipelines

KernelEvolve: How Meta’s Ranking Engineer Agent Optimizes AI Infrastructure

Meta Adaptive Ranking Model: Bending the Inference Scaling Curve to Serve LLM-Scale Models for Ads

AI for American-Produced Cement and Concrete

Friend Bubbles: Enhancing Social Discovery on Facebook Reels

Ranking Engineer Agent (REA): The Autonomous AI Agent Accelerating Meta’s Ads Ranking Innovation

Patch Me If You Can: AI Codemods for Secure-by-Default Android Apps

RCCLX: Innovating GPU communications on AMD platforms

The Death of Traditional Testing: Agentic Development Broke a 50-Year-Old Field, JiTTesting Can Revive It

Adapting the Facebook Reels RecSys AI Model Based on User Feedback

DrP: Meta’s Root Cause Analysis Platform at Scale

Uber Engineering
последний пост None

Spotify Engineering

Spotify Engineering
последний пост None

Ripple Engineering

Ripple Engineering
последний пост None

Dmitry Anoshin recommends

Snowflake
последний пост None

Cloudera
последний пост None

Smart Data
последний пост 3 days, 6 hours назад

New Data Analytics Breakthroughs Give eCommerce Startups a Fighting Chance

How AI Helps Businesses Get More From Social Media

How Data Analytics Is Reshaping Patient Financing Decisions

How AI-Driven Workflows Are Changing the Way Companies Think About Data Risk

How to Use a Competitive Intelligence Dashboard to Turn Market Data Into Smarter Marketing Decisions

Reducing “Work About Work” with AI Task Managers

The Intersection of Big Data and AI in Project Management

Hidden AI, Real Risk: A Governance Roadmap For Mid-Market Organizations

Signal Or Noise? A Decision Tree For Evaluating Unusual Trading Activity

AI Agent Trends Shaping Data-Driven Businesses

How Data Analytics Helps Developers Deliver Better Tech Services

Can Data Analytics Help Investors Outperform Warren Buffett

Signals In The Noise: Using Media Monitoring To Manage Negative Publicity

The Best AI Recruitment Software Solution: Transforming Hiring with Smarter Tech

AI Video Surveillance for Safer Businesses

Knoldus
последний пост None

We Cloud Data
последний пост 6 days, 11 hours назад

How Financial Services Teams can use AI Agents

The Rise of AI Agents in Organizations

7 New AI Roles Organizations Are Hiring For in 2026

Designing a Custom AI Training Program for Legal and Compliance Teams

Understanding AI for Law and Legal Regulatory Affairs

RAG vs. CAG: Choosing the Right Data Strategy

The Essential AI Toolkit for 2026

How AI Is Changing K–12 Classrooms

Transforming Schools with Scalable AI

Reclaiming time in Education Classrooms & Reimaging Learning

Building the Future of Connectivity: AI in Telecommunications

Understanding AI in Banking and Finance

The Strategic Role of AI in Tourism and Entertainment

Semantic Communication Stack: Beyond Generative Copywriting in 2026

AI in Agriculture: Transforming Farming Through Data, Intelligence, and Practical Skills

Learn Data Engineering
последний пост None

SCRIBD
последний пост 3 months, 4 weeks назад

Dual-Embedding Trust Scoring

Screaming in the Cloud

Deploying a Cost-Effective, Scalable PhotoDNA System for CSAM Detection

Supercharging S3 Intelligent Tiering with Content Crush

Don’t hardcode IAM credentials in GitHub!

Building a Scalable Data Warehouse Backup System with AWS

Jesse Anderson
последний пост 7 months, 1 week назад

Gemini Batch API for Java

Data Quest
последний пост None

Infrastructure

AWS
последний пост 3 часа назад

Building and running custom code transformations without leaving your editor

Building pay-per-intelligence for AI agents: How Ampersend uses Amazon Bedrock AgentCore Payments

Why tombola chose Graviton-powered RG instances for Amazon Redshift

Detecting fraud patterns across Snowflake and AWS using SageMaker Data Agent

Embed the world: Multimodal AI for searchable aerial imagery at scale

Running ComfyUI workflows on Amazon SageMaker AI processing jobs

Automating IT support with AI: How Nexthink uses OpenSearch Service to power self-service issue resolution

Feature Flag Orchestration with AWS DevOps Agent and LaunchDarkly

Supercharge your cloud operations with the Kiro power for AWS DevOps Agent

Introducing Private Networking for Amazon MQ for RabbitMQ

Introducing Web Search on Amazon Bedrock AgentCore

Accelerate campaign workflow with insights from Adobe Marketing Agent for Amazon Quick

Monitor and debug generative AI inference with SageMaker detailed metrics and Insights dashboard on CloudWatch

Production-Ready Autonomous Incident Resolution with AWS DevOps Agent (now GA) and Datadog MCP Server

Amazon Bedrock AgentCore harness is now generally available: Go from idea to production-grade agent in minutes

AWS
последний пост 3 часа назад

PostgreSQL 18 on Amazon Aurora and Amazon RDS: Performance enhancements

PostgreSQL 18 on Amazon Aurora and Amazon RDS: Security, monitoring, and developer enhancements

Amazon SageMaker AI Async Inference now supports inline request payloads

Get back hours every day with autonomous agents in Amazon Quick

Context intelligence for your data and AI agents at scale

Deep dive into Amazon Aurora PostgreSQL lock analysis with CloudWatch Database Insights

New in Amazon Bedrock AgentCore: Build agents with broader knowledge and continuous learning

Safeguard your agentic AI applications with the Amazon Bedrock Guardrails InvokeGuardrailChecks API

Converting an RDS for SQL Server instance from license included to Bring Your Own Media (BYOM)

Introducing container caching in Amazon SageMaker AI for faster model scaling

Similarweb’s migration from HBase to Amazon DynamoDB

Improve query performance with EXPLAIN plans in Amazon Aurora DSQL

Parallelize speculative decoding with P-EAGLE on Amazon SageMaker AI

AI-assisted data development with Kiro and SageMaker Unified Studio

Modernize Amazon Redshift: RA3 to RG Migration best practices

Astronomer
последний пост None

DBT — Data Build Tool

DBT — Data Build Tool
последний пост None

FiveTran
последний пост None

DataBricks
последний пост None

Mix

/r/DataEngineering
последний пост 8 часов назад

pgEdge ColdFront: Open source, Postgres-native Iceberg tiering that eliminates the ETL pipeline to your data warehouse

Solo data engineer reporting to VP Tech

Vitess ETL

Advice on building agnostic data layer

First internship/job experience AWS or Databricks?

Where to store environment variables for databricks job?

How long to stay in first DE Role

Heads-up: dbt VSCode License is extremely hostile and disallows makijg competitive tools

Spark optimization and Spark UI

PyCanopy: a polars-native spatial query engine that beats duckdb, sedona, geopandas on most in-memory operations

Your experiences on different data platforms

Should I switch from Windows to Linux for Data Engineering? Which Distro is best

Apache Everywhere

Standard profiling libraries completely break on time series data (I learned it the hard way and came up with a solution)

We open-sourced Chukei: a self-hosted Snowflake cost proxy for read-heavy workloads

Towards Data Science
последний пост 9 часов назад

Encoding Categorical Data for Outlier Detection

How to Use Claude Code in Your Browser

When RAG Users Ask Vague Questions: Clarify Once, Learn the Default

Neural Networks, Explained for Beginners: Start Here If They’ve Confused You

Tool Calling, Explained: How AI Agents Decide What to Do Next

Reconstructing the Table of Contents a PDF Forgot to Ship, So RAG Can Scope by Section

What Are the Possibilities to Build Date Tables in Self-Service Environments?

7 Crucial Barriers Between Data Teams and Self-Healing Data Architecture

Making a PDF’s Images Searchable for RAG, Without Paying to Read Them All

Materialized Lake Views in Microsoft Fabric: When Your Medallion Fits in a SELECT Statement

Python 3.14 and its New JIT Compiler

Building a Custom GStreamer Plugin for NVIDIA DeepStream

I Tried to Schedule My ETL Pipeline. Here’s What I Didn’t Expect.

Parse Scanned PDFs for RAG with EasyOCR: Free OCR Gives You Words, Not a Document

GPU-Resident Top-K for Agentic RAG: I Built a CUDA Kernel So My Retrieval Step Would Stop Bouncing Off the GPU

Monte Carlo Data

Monte Carlo Data
последний пост 2 months, 3 weeks назад

The Ultimate Guide To Data Lineage

Data Warehouse vs Data Lake vs Data Lakehouse: Definitions, Similarities, and Differences

Data Warehouse vs Data Lake vs Data Lakehouse: Definitions, Similarities, and Differences

Data Quality Monitoring Explained – You’re Doing It Wrong

DE Telegram

DataEng
последний пост 1 week, 4 days назад

🔥 Три разных человека. Три разных проекта. Один и тот же подход.— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска— Аня

Приглашаем вас на совместный вебинар AXENIX и вендора BR Systems, посвященный XLTable — OLAP‑системе с широким функционалом для работы с данными ClickHouse и Trino и поддержкой протокола XMLA в Excel.Эксперты подробно расскажут об XLTable и его основных пр

PostgreSQL 16: Оптимизация запросов 🖥Вчера случайно заметил, что на Postgres Pro появилась новая книга PostgreSQL 16: Оптимизация запросов.Книга основана на курсе лекций про оптимизацию, который, к слову, также доступен бесплатно.Понравилось, что книга неб

Эффективно управлять сложностью можно через абстракции. Например, через практики внедрения дизайн-паттернов, DDD, выбор более высокоуровневых технологий.РасширяемостьТребования к работе приложений меняются, а значит и оно само должно меняться. Чтобы внесен

Designing Data-Intensive ApplicationsГлава 2. Defining Nonfunctional RequirementsВторая глава книги посвящена нефункциональным требованиям к разрабатываемым нами системам. Под нефункциональными требованиями автор подразумевает:- Производительность (Perform

Отказоустойчивость железа достигается через добавление избыточных компонентов, например, в системе может быть несколько жестких дисков, подключенных в режиме RAID-массива. В случае распределённых систем, запросы могут был равномерно распределены между неск

Ребят, всем привет!Я не забыл про книгу, скоро будет конспект по второй главе (был перерыв). А пока я пишу конспект, то предлагаю вам насладиться подкастом с автором книги Designing Data-Intensive Applications Martin Kleppmann у Gergely Orosz — Designing D

Mastering PostgreSQLSupabase и Manning Publications выпустили бесплатную книгу про PostgreSQL.107 страниц концентрированной информации про самые популярные темы этой замечательной базы данных. Например, я не знал про существование отдельного типа данных дл

Cloud vs Self-HostedВечная дилемма что выбрать: использовать облачные сервисы или всё развернуть на своих серверах. Это снова вопрос компромиссов. У каждого подхода есть свои плюсы и минусы. Можно комбинировать два подхода и не уходить в крайности. Наприме

Данные и законодательствоС развитием GDPR, CCPA, ,EU AI Act и прочих законодательных норм и правил по персональным данным появилась необходимость учитывать риск хранения и обработки этих данных. В какой-то момент хранимые на серверах данные превратились не

Аналитические базы выступают в роли общего хранилища, куда стекаются данные из различных подсистем. Это могут быть OLTP базы, а также внешние сервисы (данные из которых можно тянуть по API, например). Процесс насыщения данными обозначают аббревиатурой ETL

Designing Data-Intensive ApplicationsГлава 1. Trade-Offs in Data Systems ArchitectureВведениеПервая глава книги получилась объёмной как по количеству страниц так и по количеству информации. По сравнению с первым изданием появилось упоминание Single-Node Da

Второе издание "кабанчика"На днях увидел в сети анонс, что вышло новое издание легендарной книги Designing Data-Intensive Applications.Впервые я познакомился с этой книгой где-то весной или летом 2018 года. Помню как случайно нашел её в архивах какого-то р

🔥 Девушка без навыков разработки запустила AI-бота и вышла на первые продажи за месяцАня из комьюнити @its_capitan заметила: люди учат английский годами, но говорить не могут. И тогда она сделала Telegram-бота, который общается с тобой голосовыми на англий

Data Pipelines with Apache Airflow, 2-е изданиеРебята из Astronomer совершенно бесплатно раздают электронную книгу Data Pipelines with Apache Airflow®, Second Edition, by Manning. Это обновлённое издание с учётом новой 3-й ветки Airflow, в книге использует

Инжиниринг Данных

Инжиниринг Данных
последний пост 2 часа назад

Циклы позволяет агентам работать автономно. Я пока еще не использовал, но пора уже. Видео про циклы: https://youtu.be/F4a8aMLb678?si=poI883i6sIutHQsoИспользуете?

🔥 Разбор AWS-стека от и до (часть 4) — 2,5 часа живого кодингаВидео 👉 https://youtu.be/nWn_hDuL4jcПровели мощную сессию по AWS Glue, MWAA Airflow, dbt Core и Iceberg Lakehouse. Всё строилось с нуля через CloudFormation с AI-агентом (Claude в Cursor) — отли

Уважаемые коллеги, я понимаю, что сейчас не до постов про аналитику и ai-агентов, так как за окном лето, отдых и думскроллинг, но у меня есть важная тема, которую нам стоит обсудить!Так, ну и что там такого важного?Ну, вы задумывались, какие навыки и задач

Сейчас самый большой hype это дата центры и AI в космосе. Bloomberg выпустил небольшое видео https://youtu.be/cNI4N3-FcEI?si=JFuu3XZSf2eIbbfvВсе относятся к этой идеи очень скептически, но с другой стороны, все новые идеи проходят такой путь, поэтому утвер

Сегодня попробовал Omni. Подключил его к Snowflake и dbt. Напомнил Looker с LookML, но удобней, что он сразу умеет читать из dbt моделей и более удобно интегрируется с git. Короткое демо https://youtu.be/9GduXHYYGbU?si=FcmQdlnoj36xbhdN

Spark Connect для ИТ-команд: упрощаем разработку и работу с данными 😎 Многие компании уже используют Apache Spark для обработки и трансформации данных, но часто только в привычных сценариях.Spark остаётся инструментом исключительно для Spark‑разработчиков:

Обновил сайт Rock Your Data https://rockyourdata.cloud/, добавил сервисы по AI, и Space Analytics (IoT, Earth Observation), чтобы была лучше трансформация в https://playeronespace.com/ (сайт, и что делаем, тоже поменял). И конечно, поменял https://surfalyt

Недавно у одного душного менеджера возник вопрос — почему я иногда опаздываю на митинги, почему иногда камера выключена и т.п. Он рассказал, что у него низкий порог терпимости ко всяким махинациям (намекая на возможные посторонние дела).При этом компания у

Кто-то завайбкодил 3х мерный веб-сайт https://messenger.abeto.co/Технологии: WebGL и Three.js

Как там уже запустили курсы AI разработчик - от 0 до 1млн рублей за 3 месяца?

Snowflake начал активно контрибьютить в Apache Spark https://careers.snowflake.com/us/en/blogarticle/building-apache-spark-in-the-open-at-snowflake Статья рассказывает о подходе Snowflake к интеграции Apache Spark в свою экосистему. Вот ключевые моменты:•

🚀 Быстрый старт в AI-аналитику с DataLens16 июня в 12:00 (мск) — вебинар о том, как работает AI-аналитика в DataLens.Разберём всё по делу:🤖 Большое обновление Нейроаналитика — агентский режим под капотом📊 Новые сценарии: виджеты дашборда, рассылки, встройк

Вчера посмотрел про история Антропика и их основателей Inside Anthropic, the $965 Billion AI Juggernaut | The Circuit, узнал про их культуру и рост. Отличное видео, особенно если вы изучаете английский или не работали еще с Claude Code.

📚 Вышел очень крепкий хэндбук по A/B-тестам — его подготовили в команде платформы Trisigma от Авито Тех. Обычно такие материалы уходят либо в сухую теорию, либо в абстрактные примеры. Здесь наоборот все завязано на реальных продуктовых кейсах и практически

Dagster и цены мы тут обсуждали в прошлом. Походу еще дороже стал. Полностью поддерживаю, если у вас с бюджетом напряг не используйте Dagster. Airflow или AWS Step functions и AWS Batch (если надо совсем дешево и вы на AWS)

Left Join
последний пост 11 часов назад

Команда исследователей из ШАДа Яндекса ускорила работу графовых нейросетейПриближается ICML — престижная международная конференция по машинному обучению, которая в этом году пройдет 6–11 июля в Корее. Статус Spotlight присваивают работам, получившим самые

Экологически чистый ИИ, полезный для здоровья Подоспел ответ всем, кто ругает ИИ за вред природе, проблемы с безопасностью или раздувание финансового пузыря, который вот-вот лопнет. Это гаджет, который:🔵Работает без интернета — ваши данные всегда остаются

OpenAI считает убыткиИИ денег почти никому не приносит— пока прибыль считает только Nvidia, а остальные просто ждут, когда он начнет окупаться. Но, кажется, OpenAI ждет этого момента с особым нетерпением.🔜 В 2024 году чистый убыток компании составил 5 милл

В PostgreSQL 19 появятся подсказки для планировщика запросовС этими ИИ-драмами (слышали, кстати, что к Fable 5 закрыли доступ?) мы упустили большую новость из мира данных. Новая версия PostgreSQL все ближе — даты релиза пока нет, но доступна бета и список

Пятничный ребус от AmazonДля справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом. Есть догадки?Ответ: Kiro, bee, lion = Kiro be lying, намек на то, что словам ИИ-бота не всегда можно доверять. Мем выложил на одном из в

Вебинар: Нейроаналитик 2.0 и его новые функцииПомните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать. Когда? 16 июня в 12:00 по Москве.Что в программе?🔵Б

Claude Fable 5: флагманская модель, которая умеет избавляться от конкурентов и ворчать на пользователейAnthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos. Про релиз каждой новой модели говорят,

Trisigma раздает бесплатное руководство по A/B-тестамTrisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их резул

Яндекс обновил НейроаналитикаВ прошлом году Яндекс представил Нейроаналитика, ИИ-ассистента для анализа данных на дашбордах, который помогал выявить тренды и инсайты на графиках. Недавно он получил большое обновление, которое уже доступно всем пользователя

Линейный график как искусство Этот график в любом современном BI-инструменте можно сделать за несколько кликов Да что BI — его можно нарисовать без особых проблем даже в обычном Экселе.Но у автора он отнял 50 часов — больше стандартной рабочей недели. Он в

От мечты стать сварщиком в Сыктывкаре до ML-стажировки в Саудовской АравииТакой путь прошёл Степан Платинский, выпускник ШАДа Яндекса. Он рассказал журналу о технологиях 8БИТ, как у него это получилось, а мы выбрали из его интервью самые интересные моменты

Два брата отняли работу у ИИ……но не ту, которую стоит отнимать. Помните многочисленные истории про то, как очередной ИИ-агент удалил БД без возможности восстановления, а потом неискренне извинялся? Братья из США, видимо, тоже слышали, и решили, что и сам

Хогвартс против Хемингуэя Tableau Public — удивительное место. Там можно найти как довольно стандартные, пусть и хорошо сделанные, дашборды с метриками и графиками, так и целые исследования, упакованные в интерактивные инфографики.Например, одно из них пос

Почти на каждом нашем проекте, как только мы заходим в Metabase, видим одну и ту же картину: дубли запросов, мертвые дашборды, SQL, в котором уже никто не разбирается. Раньше я лез разгребать это руками и тратил по несколько дней на один аудит.В какой-то м

Сколько денег приносит ИИ?Amazon, Google, Microsoft и другие технокомпании вкладывают в ИИ огромные деньги: они выпускают все новые продукты на его основе и активно — иногда слишком — продвигают их среди клиентов и даже собственных сотрудников. Учитывая их

SQLite на практике

SQLite на практике
последний пост None

Datalytics
последний пост 4 days, 14 hours назад

Гарантируем вам трудоустройство в аналитике уже в 2026 году!Ребята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг! Симулейтив гарантируют ваше трудоустр

Почему AI-агенты ошибаются, даже если у них есть доступ ко всем данным? 🤖Многие компании уже экспериментируют с AI-агентами для поиска информации, аналитики и работы с корпоративными знаниями. Однако на практике доступ к данным еще не гарантирует качествен

Лучший аналитик — ленивый аналитикЕсли вы когда-нибудь пользовались Авито, то знаете, что в сервисе есть доставка. Она платная, зато удобная: можно купить вещь в городе на другом краю страны. Чтобы рассчитать цену на неё, нужно учесть много деталей: катего

AI-компании начали менять токены на доли в компанияхВ мае 2026 OpenAI предложила каждому стартапу текущего батча Y Combinator $2M в API-токенах за долю. И токены — не по себестоимости: маржинальная стоимость инференса в разы ниже розничной цены, по которой

Как вкатиться в аналитику, с зарплатой в 3 раза выше, чем у остальных 2026 году❓Если следовать обычному треку развития карьеры аналитика, рост зп будет медленным и постепенным. К тому же во время кризисов бизнес, хуже нанимает и чаще сокращает тех, кто не

⚡️Вышло новое исследование Self-Service-круг Громова 2026Оно показывает, как российские платформы помогают бизнес-пользователям работать автономно во всей архитектуре данных, а не только в BI.В отчет вошло 20+ российских решений: от BI, ETL и IBP-систем до

У вас проблемы с визуализацией графиков в Python? Моя новая книга по Seaborn уже вышла и доступна для покупки всего за 1199 руб!Друзья, я написал свою третью книгу, и она посвящена графической библиотеке Seaborn в Python (фотки в предыдущем посте)! Полгода

Данные давно перестали быть только инструментом аналитиков — сегодня они влияют на продукты, клиентский опыт, риски, эффективность и стратегические решения. 9 июля на Форуме Data Day эксперты и практики по работе с данными и ИИ из Сбера, Т-Банка, ГПБ, ВТБ,

Если давно хотели прокачаться в modern data stack — собрали три практических тренажёра, которые помогут пройти путь от аналитического хранилища до оркестрации пайплайнов и Lakehouse-архитектуры.📊 Симулятор Data Warehouse на базе dbtНаучитесь работать с dbt

Офер в Яндекс за выходные: 6–7 июняЕсли вы продуктовый, дата-аналитик или датасаентист с опытом на Python от 3 лет, участвуйте в Weekend Offer Analytics*. Как всё устроено:🔵 до 27 мая — регистрация;🔵 6 июня — две технические секции, вместо трёх в обычном н

⚡️ Стек собран — а оффера всё нет?Самый бесячий парадокс аналитика в 2026.Знаешь SQL на уровне оконок и CTE. Задачки с собесов Т-банка щёлкаешь за вечер. По технике — молодец.А на финальных этапах что-то идёт не так. И в какой-то момент уже не понимаешь —

⚡ А вы полагаетесь на случайность при делении на тест-контроль?В среднем рандом должен дать идеальный баланс по всем — даже ненаблюдаемым — признакам между тестовой и контрольной группой.Но конкретный АБ-тест — это конкретные тест и контроль. Поэтому случа

Как по всему GPT расползись гоблиныВ общем, у чатагпт есть разные настройки личности. Одна из таких личностей — это «Nerdy». По-нашему, ботан. Модель в этом режиме становится излишне занудной, но при этом такой а ля глубокой и игривой. Её ключевая фишка в

Отличная возможность ворваться в аналитику уже в 2026 годуРебята, если вы давно смотрите в сторону аналитики или хотите прокачаться как специалист, для вас есть классная новость: сейчас ваше время сделать первый шаг!Данных вокруг всё больше, бизнесу нужны

АНА’26: конференция о продуктовой аналитике, искусственном интеллекте и масштабировании цифровых продуктов22 мая в Москве в седьмой раз пройдет АНА — техническая конференция для специалистов, работающих с AI, ML-инженеров, а также продуктовых и data-команд

Труба данных
последний пост 2 months, 1 week назад

💎ЗАКРЫТОЕ КОММЬЮНИТИ В СФЕРЕ АРБИТРАЖА КРИПТОВАЛЮТВыплаты от $3.000 в месяц и более (в зависимости от оборота) Первая выплата — через 3 дня - Предоставляем обучение, личные кураторы - Набор без опыта — выгодные условия для наших трейдеров - Команда №1 на р

Channel created

Обычно по пятница выходит пятничный юмор, но сегодня - крайняя шутка.Этот канал прослужил мне верой и правдой почти 6.5 лет и за это время подарил мне очень разнообразный опыт, 5 тысяч рублей донатов, вакансии и проекты и больше 4 тысяч людей, которым инте

https://clickhouse.com/blog/clickhouse-kubernetes-operatorКликхаус выкатил K8S Operator. Это чтобы было изи раскатить клик в кубере.Да-да, давайте не будем базы данных держать в кубернетесе, только bare metal и весь остальной бубнеж.Большинству компаний бу

Если вы искали качественный туториал про то как использовать Claude Code лучше всего с лучшими настройками на данный момент, то вот, я прнс

https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту

Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив

https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr

Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL

MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by

https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни

Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени

enthusiastech
последний пост None

data будни
последний пост 2 months назад

мне кажется последние два интервью отлично смотрятся вместе и дополняют друг друга >_>и отдельно мысль, которая где-то проговаривалась в этих интервью: токены — новый вид бенефита для сотрудников. большие компании готовы вливать миллионы в токены для

🥷 DHH об agent-first подходеDHH — известный ии-скептик и сторонник написания кода вручную; в своём сетапе он не использует IDE с их подсказками и навигацией по коду — всё набивает ручками (и радуется)ещё DHH известен своими сильным мнением и радикальными в

🦄 руководитель Claude Code об AI в разработкепослушал интервью Бориса Чёрного в подкасте Ленни. Борис написал первую версию Claude Code и теперь руководит этим направлением в Anthropic.https://youtu.be/We7BZVKbCVwпо их данным сейчас уже 4% всех коммитов в

📁 про культуру ведения тикетовпродолжаю рассказывать про внутрянку нашей команды, привлекая ваше внимание к активным вакансиям >_>> важный дисклеймер: это не я, это всё наш техлид Кирилл (я тут только документирую и выношу)думаю, все видели тикеты

🦀 Clawdbot / Moltbot / OpenClaw там похоже намечается очередной качественный скачок аи-строения: австрийский программист написал автономного (?) ии-агента… и понеслосьформат горячих новостей не мой любимый жанр, но это залетело в моё инфополе с трёх разных

data будни pinned «📢 ищем дата-коллег к себе в Яндекс Финтех → дата инженеры https://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637 → дата-партнёры (они же системные аналитики двх) https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815 эт

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать и

📢 ищем дата-коллег к себе в Яндекс Финтех→ дата инженерыhttps://yandex.ru/jobs/vacancies/inzhener-dannih-v-finteh-36637→ дата-партнёры (они же системные аналитики двх)https://yandex.ru/jobs/vacancies/analitik-dwh-v-finteh-27815это прям в нашу команду, то е

✍️ о код-ревью у нас в команде в прод только через пулл-реквесты и каждый пулл-реквест должно посмотреть двое коллег. моя личная статистика за 2025 год показывает 430 проведённых код-ревью. сложились какие-то мысли по этому поводу, ниже пытаюсь собрать их

🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви

🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи

а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез

под капотом Яндекс.Такси

под капотом Яндекс.Такси
последний пост 7 months, 3 weeks назад

Как Yandex Go с помощью аналитической платформы Atlas превращает карты в источник инсайтов и быстрой аналитики, читайте в статье на Хабре

🎧 Podcasts

Data Engineering Podcast

Data Engineering Podcast
последний пост None

Data Brew by Databricks
последний пост None

«Ничего такого» by Dodo Enginnering
последний пост None

Запуск завтра Podcast

Запуск завтра Podcast
последний пост 4 days, 13 hours назад

Как работают носимые устройства и нужны ли они вам

Космические планы. Что еще нам может дать космос и зачем так часто туда летать

Как меняется кибербезопасность с ИИ

Как создаются современные чипы

Как живет российская гражданская авиация после санкций

Как отношения с машиной влияют на человека

Отношения с ИИ. Как устроены эмоциональные чат-боты

ИИ для каждого. Как (и зачем) децентрализовать искусственный интеллект

Как подключить мозг к компьютеру

Что генетика знает о вас? | Михаил Гельфанд

Как нейросети меняют правила общения

Что происходит с наймом в IT

Гугл-поиск испортился? Как искать в интернете

Биохакинг. Говорим о привычках в Кремниевой долине

Почему всем так нужны видеокарты от NVIDIA

Moscow Python Podcast

Moscow Python Podcast
последний пост 1 week назад

Новости мира Python за май 2026

Новости мира Python за апрель 2026

Новости мира Python за март 2026

JS vs Python: сравнение экосистем на реальном проекте

Новости мира Python за февраль 2026

Агентские системы от разработки до оценки

Новости мира Python за январь 2026

Как команды используют LLM: агенты, ревью и единый инструмент

Новости мира Python за декабрь 2025

Новости мира Python за 2025 год

Новости мира Python за ноябрь 2025

Новый фреймворк задач, безопасность и почему всё ещё нет Async

Релиз 3.14 и другие новости мира Python за октябрь 2025

Почему Python выбирают для масштабирования

Новости мира Python за сентябрь 2025

Podlodka Podcast

Podlodka Podcast
последний пост 13 часов назад

Podlodka #482 – Найм в эпоху AI

Podlodka #481 – Rust Deep Dive

Podlodka #480 – Как начать выступать на английском языке

Podlodka #479 – Capture the Flag

Podlodka #478 – Zed

Podlodka #477 – Ruby on Rails Deep Dive

Podlodka #476 – Релокация в Австралию

Podlodka #475 – Django

Podlodka #473 – Технологии продления жизни

Podlodka #472 – Каузальные модели

Podlodka Deep Dive #1 — C++

Podlodka #471 – Генерация случайных чисел

Podlodka #470 – Vim

Podlodka #469 – Flutter

Podlodka #468 – Маленькие языковые модели

Проветримся!
последний пост 2 weeks, 3 days назад

Матвей Кукуй: Archestra AI

Claude Mythos: кибербезопасность всё?

Екатерина Кухтенко: диагностика вирусных заболеваний

Говард Tёрман: Иисус и те, кому нечего терять

Андрей Себрант: экзоскелеты и роботы

Александ Ерин: Автоматизация продаж

Василий Королишин: спина айтишника

Дмитрий Волков: риски искусственного интеллетка

Максим Мусин: агенты пишут код

Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства

Вы находитесь здесь

Вы находитесь здесь
последний пост 2 months, 1 week назад

Смотрите подкаст «Запуск завтра» на YouTube и слушайте на аудиоплатформах

Comand Line Heroes by RedHat

Comand Line Heroes by RedHat
последний пост None

Python Bytes
последний пост 6 days, 18 hours назад

#484 All our tools

#483 Thanks Brian

#482 Mr. Beast's epidosde

#481 Ways to die

#480 Proud Parents

#479 Talking About Types

#478 Iodine tablets and potable water

#477 Lazy, Frozen, and 31% Lighter

#476 Common themes

#475 Haunted warehouses

#474 Astral to join OpenAI

#473 A clean room rewrite?

#473 A clean room rewrite?

#472 Monorepos

#471 The ORM pattern of 2026?

Software Engineering Daily

Software Engineering Daily
последний пост 4 days, 17 hours назад

Biome and the Future of JavaScript Tooling

Preparing for Q-Day

Developing Multiplayer Games in Godot

SED News: Apple’s AI Problem, The Real Business Model of AI, and Token Cost Reckoning

Web Native Game Development

The Hardware Bottleneck AI Can’t Fix

Autonomous Drone Delivery at Scale

The European Startup Scene

React Native at Scale

Formal Methods as Agent Guardrails

Open Source Sustainability

Vespa AI and Surpassing the Limits of Vector Search

SED News: Anthropic’s Mythos, Supply Chain Hacks, and the AI Spending Surge

SmartBear and Multi-Agent QA

The Ethics of Autonomous Weapons Systems

Habr Podcasts
последний пост None

Мысли и Методы
последний пост None

Трёп Себранта
последний пост 6 months, 2 weeks назад

По волнам моей памяти: от YACm-2016 до YACe-2025

Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании

⌨ Coding

Martin Fowler
последний пост 6 days, 14 hours назад

Building Reliable Agentic AI Systems

Fragments: June 16

Fragments: June 2

Fragments: May 27

The test suite as a regression sensor

The VibeSec Reckoning

Bliki: Vibe Coding

Three more static code analysis sensors

Maintainability sensors for coding agents

Fragments: May 14

Bliki: Interrogatory LLM

What is Code

Fragments: May 5

Bliki: Mythical Man Month

Fragments: April 29

Антон Жиянов
последний пост 6 months назад

Go-фича: Обновленный go fix

Утечки горутин в Go 1.24+

Go-фича: Защита секретов

Go-фича: Безопасная проверка ошибок

Курс: Знакомство с Go

Go-фича: Метрики горутин

Go-фича: Dialer с контекстом

Go-фича: Сравнение IP-подсетей

Go-фича: Хешеры

Go-фича: new(expr)