Data Engineering
про инжиниринг данных и аналитику
🏢 %company% Engineering
AirBnb Engineering
последний пост 1 month, 3 weeks назад
GraphQL Data Mocking at Scale with LLMs and @generateMock
GraphQL Data Mocking at Scale with LLMs and @generateMock GraphQL Data Mocking at Scale with LLMs and @generateMock

How Airbnb combines GraphQL infra, product context, and LLMs to generate and maintain convincing, type-safe mock data using a new directive.IntroductionProducing valid and realistic mock data for testing and prototyping with GraphQL has been a persistent challenge across the industry for years. Mock data is tedious to write and maintain, and attempts to improve the process, such as random value generation and field-level stubbing, fall short because they lack essential domain context to make test data realistic and meaningful. The time spent on this manual work ultimately takes away from what most engineers would like to focus on: building features.In this post, we’ll explore how we’ve reim…

1 month, 3 weeks назад @ medium.com
From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store
From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store From Static Rate Limiting to Adaptive Traffic Management in Airbnb’s Key-Value Store

How Airbnb hardened Mussel, our key-value store, with smarter traffic controls to stay fast and reliable during traffic spikes.By Shravan Gaonkar, Casey Getz, Wonhee ChoIntroductionEvery request lookup on Airbnb, from stays, experiences, and services search to customer support inquiries ultimately hits Mussel, our multi-tenant key-value store for derived data. Mussel operates as a proxy service, deployed as a fleet of stateless dispatchers — each a Kubernetes pod. On a typical day, this fleet handles millions of predictable point and range reads. During peak events, however, it must absorb several-fold higher volume, terabyte-scale bulk uploads, and sudden bursts from automated bots or DDoS…

2 months, 2 weeks назад @ medium.com
Building a Next-Generation Key-Value Store at Airbnb
Building a Next-Generation Key-Value Store at Airbnb Building a Next-Generation Key-Value Store at Airbnb

By Shravan Gaonkar, Chandramouli Rangarajan, Yanhan ZhangHow we completely rearchitected Mussel, our storage engine for derived data, and lessons learned from the migration from Mussel V1 to V2.Airbnb’s core key-value store, internally known as Mussel, bridges offline and online workloads, providing highly scalable bulk load capabilities combined with single-digit millisecond reads.Since first writing about Mussel in a 2022 blog post, we have completely deprecated the storage backend of the original system (what we now call Mussel v1) and have replaced it with a NewSQL backend which we are referring to as Mussel v2. Mussel v2 has been running successfully in production for a year, and we wa…

3 months назад @ medium.com
Viaduct, Five Years On: Modernizing the Data-Oriented Service Mesh
Viaduct, Five Years On: Modernizing the Data-Oriented Service Mesh Viaduct, Five Years On: Modernizing the Data-Oriented Service Mesh

A more powerful engine and a simpler API for our data-oriented meshIn November 2020 we published a post about Viaduct, our data-oriented service mesh. Today, we’re excited to announce Viaduct is available as open-source software (OSS) at https://github.com/airbnb/viaduct.Before we talk about OSS, here’s a quick update on Viaduct’s adoption and evolution at Airbnb over the last five years. Since 2020, traffic through Viaduct has grown by a factor of eight. The number of teams hosting code in Viaduct has doubled to 130+ (with hundreds of weekly active developers). The codebase hosted by Viaduct has tripled to over 1.5M lines (plus about the same in test code). We’ve achieved all this while ke…

3 months, 1 week назад @ medium.com
Taming Service-Oriented Architecture Using A Data-Oriented Service Mesh
Taming Service-Oriented Architecture Using A Data-Oriented Service Mesh Taming Service-Oriented Architecture Using A Data-Oriented Service Mesh

Introducing Viaduct, Airbnb’s data-oriented service meshBy: Raymie Stata, Arun Vijayvergiya, Adam MiskiewiczAt Hasura’s Enterprise GraphQL Conf on October 22, we presented Viaduct, what we’re calling a data-oriented service mesh that we believe will bring a step function improvement in the modularity of our microservices-based Service-Oriented Architecture (SOA). In this blog post, we describe the philosophy behind Viaduct and provide a rough sketch of how it works. Please watch the presentation for a more detailed look.Massive SOA Dependency GraphsFor a while, Service-Oriented Architectures have been moving towards ever larger numbers of small microservices. Modern applications can consist…

3 months, 1 week назад @ medium.com
Migrating Airbnb’s JVM Monorepo to Bazel
Migrating Airbnb’s JVM Monorepo to Bazel Migrating Airbnb’s JVM Monorepo to Bazel

At Airbnb, we recently completed migrating our largest repo, the JVM monorepo, to Bazel. This repo contains tens of millions of lines of Java, Kotlin, and Scala code that power the vast array of backend services and data pipelines behind airbnb.com.Migration in numbers (4.5 years of work):Build CSAT: 38% → 68%3–5x faster local build and test times2–3x faster IntelliJ syncs2–3x faster deploys to the development environmentIn this blog post, we’ll discuss the why, share some highlights on the how, and finish off with key learnings.Why Bazel?Before the migration, our JVM monorepo used Gradle as its build system. We decided to migrate to Bazel because it offered three key advantages: speed, rel…

4 months, 1 week назад @ medium.com
Seamless Istio Upgrades at Scale
Seamless Istio Upgrades at Scale Seamless Istio Upgrades at Scale

How Airbnb upgrades tens of thousands of pods on dozens of Kubernetes clusters to new Istio versionsAirbnb has been running Istio® at scale since 2019. We support workloads running on both Kubernetes and virtual machines (using Istio’s mesh expansion). Across these two environments, we run tens of thousands of pods, dozens of Kubernetes clusters, and thousands of VMs. These workloads send tens of millions of QPS at peak through Istio. Our IstioCon 2021 talk describes our journey onto Istio and our KubeCon 2021 talk goes into further detail on our architecture.Istio is a foundational piece of our architecture, which makes ongoing maintenance and upgrades a challenge. Despite that, we have up…

4 months, 2 weeks назад @ medium.com
Achieving High Availability with distributed database on Kubernetes at Airbnb
Achieving High Availability with distributed database on Kubernetes at Airbnb Achieving High Availability with distributed database on Kubernetes at Airbnb

IntroductionTraditionally, organizations have deployed databases on costly, high-end standalone servers using sharding for scaling as a strategy. As data demands grew, the limitations of this strategy became increasingly evident with increasingly longer and more complex maintenance projects.Increasingly distributed horizontally scalable databases are not uncommon and many of them are open source. However, running these databases reliably in the cloud with high availability, low latency and scalability, all at a reasonable cost is a problem many companies are trying to solve.We chose an innovative strategy of deploying a distributed database cluster across multiple Kubernetes clusters in a c…

4 months, 4 weeks назад @ medium.com
Understanding and Improving SwiftUI Performance
Understanding and Improving SwiftUI Performance Understanding and Improving SwiftUI Performance

New techniques we’re using at Airbnb to improve and maintain performance of SwiftUI features at scaleBy Cal Stephens, Miguel JimenezAirbnb first adopted SwiftUI in 2022, starting with individual components and later expanding to entire screens and features. We’ve seen major improvements to engineers’ productivity thanks to its declarative, flexible, and composable architecture. However, adopting SwiftUI has brought new challenges related to performance. For example, there are many common code patterns in SwiftUI that can be inefficient, and many small papercuts can add up to a large cumulative performance hit. To begin addressing some of these issues at scale, we’ve created new tooling for …

6 months назад @ medium.com
Load Testing with Impulse at Airbnb
Load Testing with Impulse at Airbnb Load Testing with Impulse at Airbnb

Comprehensive Load Testing with Load Generator, Dependency Mocker, Traffic Collector, and MoreAuthors: Chenhao Yang, Haoyue Wang, Xiaoya Wei, Zay Guan, Yaolin Chen and Fei YuanSystem-level load testing is crucial for reliability and efficiency. It identifies bottlenecks, evaluates capacity for peak traffic, establishes performance baselines, and detects errors. At a company of Airbnb’s size and complexity, we’ve learned that load testing needs to be robust, flexible, and decentralized. This requires the right set of tools to enable engineering teams to do self-service load tests that integrate seamlessly with CI.Impulse is one of our internal load-testing-as-a-service frameworks. It provide…

6 months, 2 weeks назад @ medium.com
Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support…
Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support… Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support…

Listening, Learning, and Helping at Scale: How Machine Learning Transforms Airbnb’s Voice Support ExperienceA look into how Airbnb uses speech recognition, intent detection, and language models to understand users and assist agents more effectively.By Yuanpei Cao, Heng Ji, Elaine Liu, Peng Wang, and Tiantian ZhangAt Airbnb, we aim to provide a smooth, intuitive, and helpful community support experience, whether it’s helping a guest navigate a booking change or helping a host with a listing issue. While our Help Center and customer support chatbot helps resolve many inquiries efficiently, some users prefer the immediacy of a voice conversation with a support representative. To make these int…

6 months, 4 weeks назад @ medium.com
How Airbnb Measures Listing Lifetime Value
How Airbnb Measures Listing Lifetime Value How Airbnb Measures Listing Lifetime Value

A deep dive on the framework that lets us identify the most valuable listings for our guests.By: Carlos Sanchez-Martinez, Sean O’Donnell, Lo-Hua Yuan, Yunshan ZhuAt Airbnb, we always strive to provide our community with the best experience. To do so, it’s important to understand what kinds of accommodation listings are valuable to our guests. We achieve this by calculating and using estimates of listing lifetime value. These estimates not only allow us to identify which types of listings resonate best with guests, but also help us develop resources and recommendations for hosts to increase the value driven by their listings.Most of the existing literature on lifetime value focuses on tradit…

9 months назад @ medium.com
Embedding-Based Retrieval for Airbnb Search
Embedding-Based Retrieval for Airbnb Search Embedding-Based Retrieval for Airbnb Search

Our journey in applying embedding-based retrieval techniques to build an accurate and scalable candidate retrieval system for Airbnb Homes searchAuthors: Mustafa (Moose) Abdool, Soumyadip Banerjee, Karen Ouyang, Do-Kyum Kim, Moutupsi Paul, Xiaowei Liu, Bin Xu, Tracy Yu, Hui Gao, Yangbo Zhu, Huiji Gao, Liwei He, Sanjeev KatariyaIntroductionSearch plays a crucial role in helping Airbnb guests find the perfect stay. The goal of Airbnb Search is to surface the most relevant listings for each user’s query — but with millions of available homes, that’s no easy task. It’s especially difficult when searches include large geographic areas (like California or France) or high-demand destinations (like…

9 months, 1 week назад @ medium.com
Accelerating Large-Scale Test Migration with LLMs
Accelerating Large-Scale Test Migration with LLMs Accelerating Large-Scale Test Migration with LLMs

by: Charles Covey-BrandtAirbnb recently completed our first large-scale, LLM-driven code migration, updating nearly 3.5K React component test files from Enzyme to use React Testing Library (RTL) instead. We’d originally estimated this would take 1.5 years of engineering time to do by hand, but — using a combination of frontier models and robust automation — we finished the entire migration in just 6 weeks.In this blog post, we’ll highlight the unique challenges we faced migrating from Enzyme to RTL, how LLMs excel at solving this particular type of challenge, and how we structured our migration tooling to run an LLM-driven migration at scale.BackgroundIn 2020, Airbnb adopted React Testing L…

9 months, 2 weeks назад @ medium.com
Netflix Engineering Netflix Engineering
последний пост 5 months, 1 week назад
Behind the Streams: Live at Netflix. Part 1
Behind the Streams: Live at Netflix. Part 1 Behind the Streams: Live at Netflix. Part 1

Behind the Streams: Three Years Of Live at Netflix. Part 1.By Sergey Fedorov, Chris Pham, Flavio Ribeiro, Chris Newton, and Wei WeiMany great ideas at Netflix begin with a question, and three years ago, we asked one of our boldest yet: if we were to entertain the world through Live — a format almost as old as television itself — how would we do it?What began with an engineering plan to pave the path towards our first Live comedy special, Chris Rock: Selective Outrage, has since led to hundreds of Live events ranging from the biggest comedy shows and NFL Christmas Games to record-breaking boxing fights and becoming the home of WWE.In our series Behind the Streams — where we take you through …

5 months, 1 week назад @ netflixtechblog.com
Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow
Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow Netflix Tudum Architecture: from CQRS with Kafka to CQRS with RAW Hollow

By Eugene Yemelyanau, Jake GriceIntroductionTudum.com is Netflix’s official fan destination, enabling fans to dive deeper into their favorite Netflix shows and movies. Tudum offers exclusive first-looks, behind-the-scenes content, talent interviews, live events, guides, and interactive experiences. “Tudum” is named after the sonic ID you hear when pressing play on a Netflix show or movie. Attracting over 20 million members each month, Tudum is designed to enrich the viewing experience by offering additional context and insights into the content available on Netflix.Initial architectureAt the end of 2021, when we envisioned Tudum’s implementation, we considered architectural patterns that wo…

5 months, 2 weeks назад @ netflixtechblog.com
Driving Content Delivery Efficiency Through Classifying Cache Misses
Driving Content Delivery Efficiency Through Classifying Cache Misses Driving Content Delivery Efficiency Through Classifying Cache Misses

By Vipul Marlecha, Lara Deek, Thiara OrtizThe mission of Open Connect, our dedicated content delivery network (CDN), is to deliver the best quality of experience (QoE) to our members. By localizing our Open Connect Appliances (OCAs), we bring Netflix content closer to the end user. This is achieved through close partnerships with internet service providers (ISPs) worldwide. Our ability to efficiently localize traffic, known as Content Delivery Efficiency, is a critical component of Open Connect’s service.In this post, we discuss one of the frameworks we use to evaluate our efficiency and identify sources of inefficiencies. Specifically, we classify the causes of traffic not being served fro…

5 months, 3 weeks назад @ netflixtechblog.com
AV1 @ Scale: Film Grain Synthesis, The Awakening
AV1 @ Scale: Film Grain Synthesis, The Awakening AV1 @ Scale: Film Grain Synthesis, The Awakening

Unleashing Film Grain Synthesis on Netflix and Enhancing Visuals for MillionsLi-Heng Chen, Andrey Norkin, Liwei Guo, Zhi Li, Agata Opalach and Anush MoorthyPicture this: you’re watching a classic film, and the subtle dance of film grain adds a layer of authenticity and nostalgia to every scene. This grain, formed from tiny particles during the film’s development, is more than just a visual effect. It plays a key role in storytelling by enhancing the film’s depth and contributing to its realism. However, film grain is as elusive as it is beautiful. Its random nature makes it notoriously difficult to compress. Traditional compression algorithms struggle to manage it, often forcing a choice be…

5 months, 3 weeks назад @ netflixtechblog.com
Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix
Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix Model Once, Represent Everywhere: UDA (Unified Data Architecture) at Netflix

By Alex Hutter, Alexandre Bertails, Claire Wang, Haoyuan He, Kishore Banala, Peter Royal, Shervin AfsharAs Netflix’s offerings grow — across films, series, games, live events, and ads — so does the complexity of the systems that support it. Core business concepts like ‘actor’ or ‘movie’ are modeled in many places: in our Enterprise GraphQL Gateway powering internal apps, in our asset management platform storing media assets, in our media computing platform that powers encoding pipelines, to name a few. Each system models these concepts differently and in isolation, with little coordination or shared understanding. While they often operate on the same concepts, these systems remain largely u…

6 months, 2 weeks назад @ netflixtechblog.com
FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning
FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning FM-Intent: Predicting User Session Intent with Hierarchical Multi-Task Learning

Authors: Sejoon Oh, Moumita Bhattacharya, Yesu Feng, Sudarshan Lamkhede, Ko-Jen Hsiao, and Justin BasilicoMotivationRecommender systems have become essential components of digital services across e-commerce, streaming media, and social networks [1, 2]. At Netflix, these systems drive significant product and business impact by connecting members with relevant content at the right time [3, 4]. While our recommendation foundation model (FM) has made substantial progress in understanding user preferences through large-scale learning from interaction histories (please refer to this article about FM @ Netflix), there is an opportunity to further enhance its capabilities. By extending FM to incorp…

7 months, 1 week назад @ netflixtechblog.com
Behind the Scenes: Building a Robust Ads Event Processing Pipeline
Behind the Scenes: Building a Robust Ads Event Processing Pipeline Behind the Scenes: Building a Robust Ads Event Processing Pipeline

Kinesh SatiyaIntroductionIn a digital advertising platform, a robust feedback system is essential for the lifecycle and success of an ad campaign. This system comprises of diverse sub-systems designed to monitor, measure, and optimize ad campaigns. At Netflix, we embarked on a journey to build a robust event processing platform that not only meets the current demands but also scales for future needs. This blog post delves into the architectural evolution and technical decisions that underpin our Ads event processing pipeline.Ad serving acts like the “brain” — making decisions, optimizing delivery and ensuring right Ad is shown to the right member at the right time. Meanwhile, ad events, aft…

7 months, 2 weeks назад @ netflixtechblog.com
Measuring Dialogue Intelligibility for Netflix Content
Measuring Dialogue Intelligibility for Netflix Content Measuring Dialogue Intelligibility for Netflix Content

Enhancing Member Experience Through Strategic CollaborationOzzie Sutherland, Iroro Orife, Chih-Wei Wu, Bhanu SrikanthAt Netflix, delivering the best possible experience for our members is at the heart of everything we do, and we know we can’t do it alone. That’s why we work closely with a diverse ecosystem of technology partners, combining their deep expertise with our creative and operational insights. Together, we explore new ideas, develop practical tools, and push technical boundaries in service of storytelling. This collaboration not only empowers the talented creatives working on our shows with better tools to bring their vision to life, but also helps us innovate in service of our me…

7 months, 3 weeks назад @ netflixtechblog.com
How Netflix Accurately Attributes eBPF Flow Logs
How Netflix Accurately Attributes eBPF Flow Logs How Netflix Accurately Attributes eBPF Flow Logs

By Cheng Xie, Bryan Shultz, and Christine XuIn a previous blog post, we described how Netflix uses eBPF to capture TCP flow logs at scale for enhanced network insights. In this post, we delve deeper into how Netflix solved a core problem: accurately attributing flow IP addresses to workload identities.A Brief RecapFlowExporter is a sidecar that runs alongside all Netflix workloads. It uses eBPF and TCP tracepoints to monitor TCP socket state changes. When a TCP socket closes, FlowExporter generates a flow log record that includes the IP addresses, ports, timestamps, and additional socket statistics. On average, 5 million records are produced per second.In cloud environments, IP addresses ar…

8 months, 2 weeks назад @ netflixtechblog.com
Globalizing Productions with Netflix’s Media Production Suite
Globalizing Productions with Netflix’s Media Production Suite Globalizing Productions with Netflix’s Media Production Suite

Jesse Korosi, Thijs van de Kamp, Mayra Vega, Laura Futuro, Anton MargolineThe journey from script to screen is full of challenges in the ever-evolving world of film and television. The industry has always innovated, and over the last decade, it started moving towards cloud-based workflows. However, unlocking cloud innovation and all its benefits on a global scale has proven to be difficult. The opportunity is clear: streamline complex media management logistics, eliminate tedious, non-creative task-based work and enable productions to focus on what matters most–creative storytelling. With these challenges in mind, Netflix has developed a suite of tools by filmmakers for filmmakers: the Medi…

8 months, 4 weeks назад @ netflixtechblog.com
Foundation Model for Personalized Recommendation
Foundation Model for Personalized Recommendation Foundation Model for Personalized Recommendation

By Ko-Jen Hsiao, Yesu Feng and Sudarshan LamkhedeMotivationNetflix’s personalized recommender system is a complex system, boasting a variety of specialized machine learned models each catering to distinct needs including “Continue Watching” and “Today’s Top Picks for You.” (Refer to our recent overview for more details). However, as we expanded our set of personalization algorithms to meet increasing business needs, maintenance of the recommender system became quite costly. Furthermore, it was difficult to transfer innovations from one model to another, given that most are independently trained despite using common data sources. This scenario underscored the need for a new recommender syste…

9 months назад @ netflixtechblog.com
HDR10+ Now Streaming on Netflix
HDR10+ Now Streaming on Netflix HDR10+ Now Streaming on Netflix

Roger Quero, Liwei Guo, Jeff Watts, Joseph McCormick, Agata Opalach, Anush MoorthyWe are excited to announce that we are now streaming HDR10+ content on our service for AV1-enabled devices, enhancing the viewing experience for certified HDR10+ devices, which previously only received HDR10 content. The dynamic metadata included in our HDR10+ content improves the quality and accuracy of the picture when viewed on these devices.Delighting Members with Even Better Picture QualityNearly a decade ago, we made a bold move to be a pioneering adopter of High Dynamic Range (HDR) technology. HDR enables images to have more details, vivid colors, and improved realism. We began producing our shows and m…

9 months назад @ netflixtechblog.com
Title Launch Observability at Netflix Scale
Title Launch Observability at Netflix Scale Title Launch Observability at Netflix Scale

Part 3: System Strategies and ArchitectureBy: Varun KhaitanWith special thanks to my stunning colleagues: Mallika Rao, Esmir Mesic, Hugo MarquesThis blog post is a continuation of Part 2, where we cleared the ambiguity around title launch observability at Netflix. In this installment, we will explore the strategies, tools, and methodologies that were employed to achieve comprehensive title observability at scale.Defining the observability endpointTo create a comprehensive solution, we decided to introduce observability endpoints first. Each microservice involved in our Personalization stack that integrated with our observability solution had to introduce a new “Title Health” endpoint. Our g…

9 months, 3 weeks назад @ netflixtechblog.com
Pinterest Engineering
последний пост 2 weeks назад
LLM-Powered Relevance Assessment for Pinterest Search
LLM-Powered Relevance Assessment for Pinterest Search LLM-Powered Relevance Assessment for Pinterest Search

Han Wang | Machine Learning Engineer; Alex Whitworth | Staff Data Scientist; Pak Ming Cheung | Sr. Staff Machine Learning Engineer; Zhenjie Zhang | Sr. Staff Machine Learning EngineerIntroductionSearch relevance measures how well search results align with a user’s search query. For personalized search systems, it’s important to ensure that displayed content is pertinent to the user’s information needs, rather than over-relying on the user’s past engagement. At Pinterest Search, we track whole-page relevance in online A/B experiments to evaluate new ranking models and ensure a high-quality user experience.Relevance measurement typically relies on human annotations, but is limited by the low …

2 weeks назад @ medium.com
How Pinterest Built a Real‑Time Radar for Violative Content using AI
How Pinterest Built a Real‑Time Radar for Violative Content using AI How Pinterest Built a Real‑Time Radar for Violative Content using AI

Faisal Farooq | Sr. Director Trust Engineering; Aravindh Manickavasagam | Staff Technical Program Manager; Attila Dobi | Sr. Staff Data ScientistPeople come to Pinterest to find ideas they feel good about. To keep that experience safe, we need to know not just what gets reported, but what people actually saw. That’s what we call prevalence: the percentage of all views, on a given day, that went to content that violates a policy. Prevalence complements reporting by covering its blind spots, helping us spot under‑reported harms, track trends, and tell whether interventions work.Why Prevalence MattersHistorically, our Trust & Safety teams leveraged multiple indicators to understand the extent …

2 weeks, 2 days назад @ medium.com
Improving Quality of Recommended Content through Pinner Surveys
Improving Quality of Recommended Content through Pinner Surveys Improving Quality of Recommended Content through Pinner Surveys

Rudraksh Kapil | Machine Learning Engineer I; Michal Giemza | Senior Machine Learning Engineer; Devan Srinivasan | Machine Learning Engineering Intern; Leif Sigerson | Senior Data Scientist; Stephanie Chen | Staff Quantitative Product Researcher; Wendy Matheny | Senior Lead Public Policy Manager; Jianjin Dong | Engineering Manager II; Qinglong Zeng | Senior Engineering ManagerIntroductory SummaryIn 2023 Pinterest became the Founding Signatory of the Inspired Internet Pledge — publicly stating our vision to adhere to three principles: (1) tuning for wellbeing, (2) listening to and acting on what we hear from users, and (3) sharing what we learn about making the internet a safer and healthier…

2 weeks, 5 days назад @ medium.com
On the (re)-prioritization of open-source AI
On the (re)-prioritization of open-source AI On the (re)-prioritization of open-source AI

Dmitry Kislyuk | Director, Machine Learning; Ryan Galgon | Director, Product Management; Chuck Rosenberg | Vice President, Engineering; Matt Madrigal | Chief Technology OfficerForeword from Bill Ready, CEOThe AI landscape is undergoing a fundamental shift, and it’s not the one you think. The competitive frontier isn’t only about building the largest proprietary models. There are two other major trends emerging that haven’t had enough discussion:Open-source models have made tremendous strides, especially on cost relative to performance.Compact, fit-for-purpose models can meaningfully out-perform general purpose LLMs on specific tasks and do so at dramatically lower cost.Our Chief Technology …

2 weeks, 6 days назад @ medium.com
Autonomous Observability at Pinterest (Part 1 of 2)
Autonomous Observability at Pinterest (Part 1 of 2) Autonomous Observability at Pinterest (Part 1 of 2)

Marcel Mateos Salles | Software Engineer Intern; Jorge Chavez | Sr. Software Engineer; Khashayar Kamran | Software Engineer II; Andres Almeida | Software Engineer; Peter Kim | Manager II ; Ajay Jha | Sr. Manager, ObservabilityAt Pinterest, inspiration isn’t just for our users — it shapes how we build and care for our platform. Until recently, our own observability (o11y) tools told a fragmented story: logs over here, traces over there, and metrics somewhere else. We’ve always excelled at collecting signals: time-series metrics, traces, logs, and change related events. But without the seamless context and unity now promised by open standards like OpenTelemetry (OTel), we were missing out on …

3 weeks назад @ medium.com
Slashing CI Wait Times: How Pinterest Cut Android Testing Build Times by 36%+
Slashing CI Wait Times: How Pinterest Cut Android Testing Build Times by 36%+ Slashing CI Wait Times: How Pinterest Cut Android Testing Build Times by 36%+

George Kandalaft | Software Engineer II, Test Tools; Alice Yang | Staff Software Engineer, Test ToolsTL;DRProblem StatementOur Android end-to-end testing builds in CI were slow and flaky because the test shards were unbalanced and the entire build had to wait for the single slowest shard on a third-party testing platform.SolutionWe built a runtime-aware sharding mechanism that uses historical test duration and stability data to pack tests greedily in an in-house testing platform with EC2-hosted emulators, ensuring all shards have a similar total runtime.ImpactThe end-to-end build time was reduced by 9 minutes (a 36% improvement), decreased the slowest shard’s runtime by 55%, and compressed …

1 month, 2 weeks назад @ medium.com
A Decade of AI Platform at Pinterest
A Decade of AI Platform at Pinterest A Decade of AI Platform at Pinterest

Lessons on building platforms, driving adoption, and evolving foundationsDavid Liu • Senior Director of Engineering, ML PlatformAI at Pinterest has been a proving ground for building platforms. Over the past decade, we went from ad-hoc machine learning stacks cobbled together by individual teams to a unified AI Platform that powers every major surface, spanning from recommendation and ranking models to emerging foundation and generative models.The rapid pace of ML and AI brought new capabilities, but also new limits. What appeared to be purely technical choices often turned out to hinge on organizational structures and timing. This retrospective looks back at lessons we learned that we hope…

1 month, 2 weeks назад @ medium.com
Identify User Journeys at Pinterest
Identify User Journeys at Pinterest Identify User Journeys at Pinterest

Lin Zhu | Sr. Staff Machine Learning EngineerJaewon Yang | Principal Machine Learning EngineerRavi Kiran Holur Vijay | Director, Machine Learning EngineeringPinterest has always been a go-to destination for inspiration, a place where users explore everything from daily meal ideas to major life events like planning a wedding or renovating a home. Our core mission is to be an inspiration-to-realization platform. To fulfill this, we recognized a critical challenge: we needed to move beyond understanding immediate interests and comprehend the underlying, long-term goals of our users. Therefore, we introduce user journeys as the foundation for recommendations.We define a journey as the intersect…

2 months назад @ medium.com
Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2)
Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2) Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 2 of 2)

Soam Acharya: Principal Engineer · Rainie Li: Manager, Data Processing Infrastructure · William Tom: Senior Staff Software Engineer · Ang Zhang: Director, Big Data PlatformAs Pinterest’s data processing needs grow and as our current Hadoop-based platform (Monarch) ages, the Big Data Platform (BDP) team within Pinterest Data Engineering started considering alternatives for our next generation massive scale data processing platform. In part one we shared the overall design of Moka, our new next gen data processing platform, and detailed its application focused components. In part two of our series, we spotlight the infrastructure focused aspects of our platform: how we deploy Moka using AWS E…

3 months, 2 weeks назад @ medium.com
Developer Experience at Pinterest: The Journey to PinConsole
Developer Experience at Pinterest: The Journey to PinConsole Developer Experience at Pinterest: The Journey to PinConsole

Authors: Ashlin Jones, Engineering Manager; Haniel Martino, Software Engineer; Su Rong, Software Engineer; Viktoria Czaran, Software EngineerAt Pinterest, our mission is to bring everyone the inspiration to create a life they love. This ambitious goal is powered by a complex technological ecosystem managed by thousands of engineers who develop and maintain services to support over 550 million monthly active users¹.As Pinterest evolved to a platform serving hundreds of millions of users, we faced a critical question: How do we maintain engineering velocity while managing increasing technological complexity? The answer led us to reimagine our developer experience through an Internal Developer…

4 months назад @ medium.com
Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes
Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Samson Hu, Shashank Tavildar, Eric Kalkanger, Hunter GatewoodWhile migrating Pinterest’s search infrastructure — which powers core experiences for millions of users monthly — to Kubernetes, we faced a challenge in the new environment: one in every million search requests took 100x longer than usual.This post chronicles our investigation, uncovering an elusive interaction between our memory-intensive search system and a seemingly innocent monitoring process. The journey involves profiling search systems, debugging performance issues, Linux kernel features, and memory management.Migrating Manas to KubernetesAt Pinterest, search is a critical component of our recommendation system. When users …

5 months, 1 week назад @ medium.com
Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)
Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2) Next Gen Data Processing at Massive Scale At Pinterest With Moka (Part 1 of 2)

Soam Acharya: Principal Engineer · Rainie Li: Manager, Data Processing Infrastructure · William Tom: Senior Staff Software Engineer · Ang Zhang: Director, Big Data PlatformAs Pinterest’s data processing needs grow and as our current Hadoop-based platform (Monarch) ages, the Big Data Platform (BDP) team within Pinterest Data Engineering started considering alternatives for our next generation massive scale data processing platform. In this blog post series, we share details of our subsequent journey, the architecture of our next gen data processing platform, and some insights we gained along the way. In part one, we provide rationale for our new technical direction prior to outlining the ove…

5 months, 2 weeks назад @ medium.com
Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines
Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines Scaling Pinterest ML Infrastructure with Ray: From Training to End-to-End ML Pipelines

Andrew Yu Staff Software Engineer / Jiahuan Liu Staff Software Engineer / Qingxian Lai Staff Software Engineer / Kritarth Anand Staff Software Engineer1. Introduction: Expanding Ray Beyond Training & InferenceAt Pinterest, ML engineers continuously strive to optimize feature development, sampling strategies, and label experimentation. However, the traditional ML infrastructure was constrained by slow data pipelines, costly feature iterations, and inefficient compute usage.While Ray has already transformed our training/batch inference workflows, we saw an opportunity to extend its capabilities to the entire ML infrastructure stack. This blog details how we expanded Ray’s role beyond training…

6 months назад @ medium.com
Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads
Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads Unlocking Efficient Ad Retrieval: Offline Approximate Nearest Neighbors in Pinterest Ads

Authors (non-ordered): Qishan(Shanna) Zhu, Chen HuAcknowledgements: Longyu Zhao, Jacob Gao, Quannan Li, Dinesh GovindarajIntroductionIn the evolving landscape of advertising, the demand for real-time personalization and dynamic ad delivery has made Online Approximate Nearest Neighbors (ANN) a mainstream method for ad retrieval. Pinterest primarily employs online ANN to swiftly adapt to users’ behavior changes (depending on their age, location and privacy settings), thereby enhancing ad responsiveness and relevance.However, offline ANN is also a valuable option, particularly when large-scale data processing, efficient resource utilization, and cost-effective operations are critical. By preco…

6 months, 2 weeks назад @ medium.com
Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations
Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations Next-Level Personalization: How 16k+ Lifelong User Actions Supercharge Pinterest’s Recommendations

Xue Xia | Machine Learning Engineer, Home Feed Ranking; Saurabh Vishwas Joshi | Principal Engineer, ML Platform; Kousik Rajesh | Machine Learning Engineer, Applied Science; Kangnan Li | Machine Learning Engineer, Core ML Infrastructure; Yangyi Lu | Machine Learning Engineer, Home Feed Ranking; Nikil Pancha | (formerly) Machine Learning Engineer, Applied Science; Dhruvil Deven Badani | Engineering Manager, Home Feed Ranking; Jiajing Xu | Engineering Manager, Applied Science; Pong Eksombatchai | Principal Machine Learning Engineer, Applied ScienceBackgroundThe Pinterest home feed is crucial for Pinner engagement and discovery. Pins on the home feed are personalized using a two-stage process: …

6 months, 3 weeks назад @ medium.com
Facebook
последний пост 5 days, 16 hours назад
DrP: Meta’s Root Cause Analysis Platform at Scale
DrP: Meta’s Root Cause Analysis Platform at Scale

Incident investigation can be a daunting task in today’s digital landscape, where large-scale systems comprise numerous interconnected components and dependencies DrP is a root cause analysis (RCA) platform, designed by Meta, to programmatically automate the investigation process, significantly reducing the mean time to resolve (MTTR) for incidents and alleviating on-call toil Today, DrP is used [...]

Read More...

The post DrP: Meta’s Root Cause Analysis Platform at Scale appeared first on Engineering at Meta.

5 days, 16 hours назад @ engineering.fb.com
How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks
How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks

Meta’s secure-by-default frameworks wrap potentially unsafe OS and third-party functions, making security the default while preserving developer speed and usability. These frameworks are designed to closely mirror existing APIs, rely on public and stable interfaces, and maximize developer adoption by minimizing friction and complexity. Generative AI and automation accelerate the adoption of secure frameworks at [...]

Read More...

The post How AI Is Transforming the Adoption of Secure-by-Default Mobile Frameworks appeared first on Engineering at Meta.

1 week, 2 days назад @ engineering.fb.com
Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization
Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization

We’re introducing Zoomer, Meta’s comprehensive, automated debugging and optimization platform for AI. Zoomer works across all of our training and inference workloads at Meta and provides deep performance insights that enable energy savings, workflow acceleration, and efficiency gains in our AI infrastructure. Zoomer has delivered training time reductions, and significant QPS improvements, making it the [...]

Read More...

The post Zoomer: Powering AI Performance at Meta’s Scale Through Intelligent Debugging and Optimization appeared first on Engineering at Meta.

1 month назад @ engineering.fb.com
Open Source Is Good for the Environment
Open Source Is Good for the Environment

Most people have heard of open-source software. But have you heard about open hardware? And did you know open source can have a positive impact on the environment? On this episode of the Meta Tech Podcast, Pascal Hartig sits down with Dharmesh and Lisa to talk about all things open hardware, and Meta’s biggest announcements [...]

Read More...

The post Open Source Is Good for the Environment appeared first on Engineering at Meta.

1 month, 1 week назад @ engineering.fb.com
Meta’s Generative Ads Model (GEM): The Central Brain Accelerating Ads Recommendation AI Innovation
Meta’s Generative Ads Model (GEM): The Central Brain Accelerating Ads Recommendation AI Innovation

We’re sharing details about Meta’s Generative Ads Recommendation Model (GEM), a new foundation model that delivers increased ad performance and advertiser ROI by enhancing other ads recommendation models’ ability to serve relevant ads. GEM’s novel architecture allows it to scale with an increasing number of parameters while consistently generating more precise predictions efficiently. GEM propagates [...]

Read More...

The post Meta’s Generative Ads Model (GEM): The Central Brain Accelerating Ads Recommendation AI Innovation appeared first on Engineering at Meta.

1 month, 2 weeks назад @ engineering.fb.com
Scaling LLM Inference: Innovations in Tensor Parallelism, Context Parallelism, and Expert Parallelism
Scaling LLM Inference: Innovations in Tensor Parallelism, Context Parallelism, and Expert Parallelism

At Meta, we are constantly pushing the boundaries of LLM inference systems to power applications such as the Meta AI App. We’re sharing how we developed and implemented advanced parallelism techniques to optimize key performance metrics related to resource efficiency, throughput, and latency. The rapid evolution of large language models (LLMs) has ushered in a [...]

Read More...

The post Scaling LLM Inference: Innovations in Tensor Parallelism, Context Parallelism, and Expert Parallelism appeared first on Engineering at Meta.

2 months, 1 week назад @ engineering.fb.com
How Meta Is Leveraging AI To Improve the Quality of Scope 3 Emission Estimates for IT Hardware
How Meta Is Leveraging AI To Improve the Quality of Scope 3 Emission Estimates for IT Hardware

As we focus on our goal of achieving net zero emissions in 2030, we also aim to create a common taxonomy for the entire industry to measure carbon emissions. We’re sharing details on a new methodology we presented at the 2025 OCP regional EMEA summit that leverages AI to improve our understanding of our IT [...]

Read More...

The post How Meta Is Leveraging AI To Improve the Quality of Scope 3 Emission Estimates for IT Hardware appeared first on Engineering at Meta.

2 months, 1 week назад @ engineering.fb.com
OCP Summit 2025: The Open Future of Networking Hardware for AI
OCP Summit 2025: The Open Future of Networking Hardware for AI

At Open Compute Project Summit (OCP) 2025, we’re sharing details about the direction of next-generation network fabrics for our AI training clusters. We’ve expanded our network hardware portfolio and are contributing new disaggregated network platforms to OCP. We look forward to continued collaboration with OCP to open designs for racks, servers, storage boxes, and motherboards [...]

Read More...

The post OCP Summit 2025: The Open Future of Networking Hardware for AI appeared first on Engineering at Meta.

2 months, 1 week назад @ engineering.fb.com
LLMs Are the Key to Mutation Testing and Better Compliance
LLMs Are the Key to Mutation Testing and Better Compliance

Following our keynote presentations at FSE 2025 and Eurostar 2025, we’re delving further into the development of Meta’s Automated Compliance Hardening (ACH) tool, an LLM-based tool for software testing that is automating aspects of compliance adherence at Meta, while accelerating developer and product velocity. By leveraging LLMs we’ve been able to overcome the barriers that [...]

Read More...

The post LLMs Are the Key to Mutation Testing and Better Compliance appeared first on Engineering at Meta.

2 months, 3 weeks назад @ engineering.fb.com
AssetGen: Generating 3D Worlds With AI
AssetGen: Generating 3D Worlds With AI

Imagine being able to use AI to create 3D virtual worlds using prompts as easily as you can generate images. The intersection of AI and VR was one of the biggest topics at Meta Connect this year. In his keynote, Mark Zuckerberg shared his vision of a future where anyone can create virtual worlds using [...]

Read More...

The post AssetGen: Generating 3D Worlds With AI appeared first on Engineering at Meta.

2 months, 3 weeks назад @ engineering.fb.com
Meta’s Infrastructure Evolution and the Advent of AI
Meta’s Infrastructure Evolution and the Advent of AI

Over the past 21 years, Meta has grown exponentially from a small social network connecting a few thousand people in a handful of universities in the U.S. into several apps and novel hardware products that serve over 3.4 billion people throughout the world. Our infrastructure has evolved significantly over the years, growing from a [...]

Read More...

The post Meta’s Infrastructure Evolution and the Advent of AI appeared first on Engineering at Meta.

2 months, 3 weeks назад @ engineering.fb.com
Networking at the Heart of AI — @Scale: Networking 2025 Recap
Networking at the Heart of AI — @Scale: Networking 2025 Recap

AI is everywhere and, as network engineers, we are right in the thick of it: building the network infrastructure for AI. This year, at our largest @Scale:Networking ever, engineers from Meta, ByteDance, Google, Microsoft, Oracle, AMD, Broadcom, Cisco, and NVIDIA came together to share our latest experiences in architecting, designing, operating, and debugging our AI [...]

Read More...

The post Networking at the Heart of AI — @Scale: Networking 2025 Recap appeared first on Engineering at Meta.

2 months, 4 weeks назад @ engineering.fb.com
A New Ranking Framework for Better Notification Quality on Instagram
A New Ranking Framework for Better Notification Quality on Instagram

We’re sharing how Meta is applying machine learning (ML) and diversity algorithms to improve notification quality and user experience. We’ve introduced a diversity-aware notification ranking framework to reduce uniformity and deliver a more varied and engaging mix of notifications. This new framework reduces the volume of notifications and drives higher engagement rates through more diverse [...]

Read More...

The post A New Ranking Framework for Better Notification Quality on Instagram appeared first on Engineering at Meta.

3 months, 3 weeks назад @ engineering.fb.com
Federation Platform and Privacy Waves: How Meta distributes compliance-related tasks at scale
Federation Platform and Privacy Waves: How Meta distributes compliance-related tasks at scale

We’re exploring Meta’s Federation Platform, a scalable set of tools for managing compliance-related tasks, along with Privacy Waves, our method for batching these tasks and ensuring accountability. Together, the Federation Platform and Privacy Waves create a structured, effective, and sustainable approach to operationalizing privacy work, enabling Meta to safeguard user data for the billions of [...]

Read More...

The post Federation Platform and Privacy Waves: How Meta distributes compliance-related tasks at scale appeared first on Engineering at Meta.

4 months, 2 weeks назад @ engineering.fb.com
Diff Risk Score: AI-driven risk-aware software development
Diff Risk Score: AI-driven risk-aware software development

The state of the research Diff Risk Score (DRS) is a AI-powered technology built at Meta that predicts the likelihood of a code change causing a production incident, also known as a SEV. Built on a fine-tuned Llama LLM, DRS evaluates code changes and metadata to produce a risk score and highlight potentially risky code [...]

Read More...

The post Diff Risk Score: AI-driven risk-aware software development appeared first on Engineering at Meta.

4 months, 2 weeks назад @ engineering.fb.com
Uber Engineering
последний пост None
Spotify Engineering Spotify Engineering
последний пост 7 months, 2 weeks назад
Incident Report: Spotify Outage on April 16, 2025
Incident Report: Spotify Outage on April 16, 2025

On April 16, Spotify experienced an outage that affected users [...]

The post Incident Report: Spotify Outage on April 16, 2025 appeared first on Spotify Engineering.

7 months, 2 weeks назад @ engineering.atspotify.com
Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business
Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business

Did you know that we sell Spotify’s developer productivity tools [...]

The post Celebrating Five Years of Backstage: From Open Source Project to Enterprise Software Business appeared first on Spotify Engineering.

8 months назад @ engineering.atspotify.com
A Behind-the-Scenes Look at How We Release the Spotify App (Part 1)
A Behind-the-Scenes Look at How We Release the Spotify App (Part 1)

Developing and releasing mobile apps at scale is a big [...]

The post A Behind-the-Scenes Look at How We Release the Spotify App (Part 1) appeared first on Spotify Engineering.

8 months, 1 week назад @ engineering.atspotify.com
An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam
An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam

TL;DR There’s a brand new engineering certification in town: Certified [...]

The post An Insider’s Tips for Taking the Certified Backstage Associate (CBA) Exam appeared first on Spotify Engineering.

9 months назад @ engineering.atspotify.com
Ripple Engineering Ripple Engineering
последний пост None
Dmitry Anoshin recommends
Snowflake
последний пост None
Cloudera Cloudera
последний пост None
Smart Data
последний пост 3 weeks назад
How Predictive Analytics Is Redefining Risk Management Across Industries
How Predictive Analytics Is Redefining Risk Management Across Industries

The crystal ball of business: How predictive analytics is becoming essential for modern risk management.

3 weeks назад @ smartdatacollective.com
Data Analytics and the New Era of Gold Trading
Data Analytics and the New Era of Gold Trading

Data tools are giving gold traders clearer signals, sharper insights, and stronger protection.

3 weeks назад @ smartdatacollective.com
Advanced Degrees Still Matter in an AI-Driven Job Market
Advanced Degrees Still Matter in an AI-Driven Job Market

Advanced degrees give professionals the judgment, resilience, and career mobility needed to thrive as AI reshapes the workforce.

4 weeks назад @ smartdatacollective.com
How Composable Analytics Unlocks Modular Agility for Data Teams
How Composable Analytics Unlocks Modular Agility for Data Teams

Lego blocks for data: How a composable approach lets you build, change, and scale analytics with ease.

1 month назад @ smartdatacollective.com
Using Data Analytics to Choose the Best Poly Mailer Bags
Using Data Analytics to Choose the Best Poly Mailer Bags

Learn how small business owners can use data analytics to compare suppliers and find the most durable, cost-effective poly bags.

1 month, 2 weeks назад @ smartdatacollective.com
How Data Analytics Is Transforming eCommerce Payments
How Data Analytics Is Transforming eCommerce Payments

Data analytics is giving e-commerce companies smarter, faster, and more secure payment systems that improve both profits and trust.

1 month, 3 weeks назад @ smartdatacollective.com
How AI Is Revolutionizing Lyric Video Creation
How AI Is Revolutionizing Lyric Video Creation

Discover how AI tools are helping artists create lyric videos faster, easier, and with more creative freedom than ever before.

2 months назад @ smartdatacollective.com
5 Reasons AI-Driven Business Need Dedicated Servers
5 Reasons AI-Driven Business Need Dedicated Servers

As AI adoption accelerates, companies must rethink their computing strategy to handle rising data and power demands effectively.

2 months, 2 weeks назад @ smartdatacollective.com
How Data Analytics Is Tracking Trends in the Pharmacy Industry
How Data Analytics Is Tracking Trends in the Pharmacy Industry

Data analytics is reshaping the pharmacy industry by driving smarter decisions, tracking market shifts, and improving patient outcomes.

2 months, 3 weeks назад @ smartdatacollective.com
Using Generative AI Call Center Solutions to Improve Agent Productivity
Using Generative AI Call Center Solutions to Improve Agent Productivity

Call centers are rapidly evolving with generative AI driving faster service, smarter interactions, and stronger customer relationships.

2 months, 3 weeks назад @ smartdatacollective.com
Data Analytics for Smarter Vehicle Expense Management
Data Analytics for Smarter Vehicle Expense Management

Learn how data analytics can help drivers cut costs, track expenses, and make better decisions for long-term vehicle savings.

3 months назад @ smartdatacollective.com
How Finance & BI Teams Choose Accounting Software
How Finance & BI Teams Choose Accounting Software

Explore how companies invest in BI tools, why adoption rates remain modest, and what defines a true Data Leader in today’s market.

3 months, 1 week назад @ smartdatacollective.com
Why the AI Race Is Being Decided at the Dataset Level
Why the AI Race Is Being Decided at the Dataset Level

The race for AI supremacy isn't won with better algorithms, but with better data. Explore why the quality, scale, and diversity of datasets are the true differentiators.

3 months, 1 week назад @ smartdatacollective.com
Data Analytics Driving the Modern E-commerce Warehouse
Data Analytics Driving the Modern E-commerce Warehouse

Discover how data analytics reshapes e-commerce warehouses, improving decision-making, boosting returns, and supporting rapid growth.

3 months, 1 week назад @ smartdatacollective.com
Benefits of AI in Nursing Education Amid Medicaid Cuts
Benefits of AI in Nursing Education Amid Medicaid Cuts

Catalyst for Business explores how AI is reshaping nursing education as providers face staff shortages and tighter budgets.

3 months, 3 weeks назад @ smartdatacollective.com
Knoldus
последний пост None
We Cloud Data We Cloud Data
последний пост 1 week, 1 day назад
Why AI Training for Employees Is Now a Business Imperative
Why AI Training for Employees Is Now a Business Imperative

Organizations across industries are accelerating AI adoption, yet outcomes often fall short of expectations. According to McKinsey, while more than 55% of organizations have adopted AI in at least one business function, only a fraction report meaningful financial impact. One of the most cited reasons is the lack of AI-ready talent within existing teams. Without […]

The post Why AI Training for Employees Is Now a Business Imperative appeared first on WeCloudData.

1 week, 1 day назад @ weclouddata.com
AWS vs Azure vs GCP: Big 3 Cloud Providers (2025)
AWS vs Azure vs GCP: Big 3 Cloud Providers (2025)

What is AWS Azure and GCP? Which cloud platform is best for your career? Here’s the simplest guide you’ll find. Cloud computing has become the backbone of modern tech. Whether you pursue data engineering, AI engineering, DevOps, cloud security, or software development, you will likely work with one—or even all—of the big three cloud providers: […]

The post AWS vs Azure vs GCP: Big 3 Cloud Providers (2025) appeared first on WeCloudData.

2 weeks, 1 day назад @ weclouddata.com
Introduction to AWS (Amazon Web Services)
Introduction to AWS (Amazon Web Services)

If you’ve been exploring cloud computing, data engineering, DevOps, or AI infrastructure, you’ve probably come across Amazon Web Services (AWS), the world’s most widely used cloud platform. But what is AWS and why is it used by millions of organizations? And more importantly, how can beginners start learning it in 2025? This guide breaks down […]

The post Introduction to AWS (Amazon Web Services) appeared first on WeCloudData.

2 weeks, 5 days назад @ weclouddata.com
SQL vs Excel
SQL vs Excel

When it comes to data analysis, reporting, and business decision-making, SQL vs Excel is one of the most common comparisons learners face. Both tools are powerful, widely used, and foundational for analytics — but they serve different purposes and shine in different scenarios. If you’re trying to decide What should I learn first, Excel or […]

The post SQL vs Excel appeared first on WeCloudData.

3 weeks, 1 day назад @ weclouddata.com
Diving Into AI and Automation
Diving Into AI and Automation

AI automation is rapidly reshaping the global workforce, business operations, and the way organizations build efficiency at scale. As generative artificial intelligence matures, companies are now moving beyond experimentation and into a phase where AI and automation work together to power smarter, faster, and more autonomous systems. From marketing to finance to data engineering, workflows […]

The post Diving Into AI and Automation appeared first on WeCloudData.

4 weeks назад @ weclouddata.com
Getting a Kubernetes Certification? Your Practical Guide to CKA & Beyond
Getting a Kubernetes Certification? Your Practical Guide to CKA & Beyond

Kubernetes has become the backbone of modern cloud infrastructure. Whether you’re working in DevOps, Cloud Engineering, SRE, Platform Engineering, or MLOps, Kubernetes skills are no longer optional—they’re a career accelerant. Yet many professionals still ask: This guide breaks down everything you need to know about Kubernetes certifications in 2025 and how WeCloudData’s hands-on training fits […]

The post Getting a Kubernetes Certification? Your Practical Guide to CKA & Beyond appeared first on WeCloudData.

1 month назад @ weclouddata.com
Learn Version Control and GitHub Basics
Learn Version Control and GitHub Basics

In the modern tech landscape, collaboration, traceability, and version history are non-negotiable especially for developers, data analysts, and machine learning engineers. That’s where Git and version control come in. If you’ve ever wondered “What is Git and GitHub in simple terms?” or “What is the main use of Git?”, this guide breaks it down clearly […]

The post Learn Version Control and GitHub Basics appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Power BI vs Tableau Guide
Power BI vs Tableau Guide

In today’s data-driven world, visualization tools like Power BI and Tableau are transforming how businesses interpret, share, and act on data insights. But for aspiring data professionals, one big question remains — Which is best, Power BI or Tableau? Whether you’re planning your first BI certification or looking to upskill, choosing between these two leading […]

The post Power BI vs Tableau Guide appeared first on WeCloudData.

1 month, 1 week назад @ weclouddata.com
Docker vs Kubernetes: What Should You Learn First
Docker vs Kubernetes: What Should You Learn First

In 2025, AI models don’t just need to be built, they need to be delivered. That’s where Docker and Kubernetes come in. For data professionals entering the world of MLOps, understanding how to deploy and scale machine learning models is just as critical as knowing how to train them. But if you’re new to this […]

The post Docker vs Kubernetes: What Should You Learn First appeared first on WeCloudData.

1 month, 2 weeks назад @ weclouddata.com
Learn Power BI: Roadmap to Data Visualization Success
Learn Power BI: Roadmap to Data Visualization Success

In 2025, data isn’t just a competitive advantage — it’s the foundation of every decision. The ability to transform raw information into actionable insights is what separates top-performing professionals from the rest. And when it comes to mastering this skill, few tools are as powerful and beginner-friendly as Power BI. If you’re looking to learn […]

The post Learn Power BI: Roadmap to Data Visualization Success appeared first on WeCloudData.

1 month, 2 weeks назад @ weclouddata.com
Emerging AI Workforce Trends
Emerging AI Workforce Trends

Artificial intelligence (AI) is no longer a future-facing concept, it is the defining force reshaping how we work, lead, and create value. As enterprises accelerate digital transformation, the conversation has shifted from “Will AI replace jobs?” to “How can organizations build an AI-ready workforce? Emerging AI Workforce trends” According to a 2025 McKinsey report, more […]

The post Emerging AI Workforce Trends appeared first on WeCloudData.

1 month, 3 weeks назад @ weclouddata.com
Data to Decisions: Building an AI-Ready Workforce
Data to Decisions: Building an AI-Ready Workforce

Artificial intelligence (AI) isn’t just changing how we work, it’s redefining what work means. Across industries, organizations are realizing that success in 2025 and beyond depends on one key question: Is the workforce ready for AI? According to a 2024 McKinsey Global Survey, 65% of organizations report adopting some form of generative AI, and nearly […]

The post Data to Decisions: Building an AI-Ready Workforce appeared first on WeCloudData.

1 month, 3 weeks назад @ weclouddata.com
What Is Generative AI for Business?
What Is Generative AI for Business?

In 2025, every forward-thinking organization is asking the same question: “How is Generative AI used in business & how can we use it effectively?” From marketing and analytics to software development and cybersecurity, Generative AI (Gen AI for business) is reshaping industries at a pace we’ve never seen before. For business leaders, understanding this technology […]

The post What Is Generative AI for Business? appeared first on WeCloudData.

2 months назад @ weclouddata.com
Top 7 Cloud Engineering Skills You Need
Top 7 Cloud Engineering Skills You Need

The demand for skilled cloud engineers has exploded over the past few years — and 2025 is shaping up to be an even bigger year. As organizations adopt multi-cloud strategies, embrace AI, and scale their infrastructure globally, mastering the right cloud engineering skills is what sets top talent apart. Whether you’re a beginner exploring cloud […]

The post Top 7 Cloud Engineering Skills You Need appeared first on WeCloudData.

2 months назад @ weclouddata.com
How AI Is Transforming Cybersecurity in 2025: Skills, Tools & Career Opportunities
How AI Is Transforming Cybersecurity in 2025: Skills, Tools & Career Opportunities

Cybersecurity has always been a critical pillar of the digital world, but in 2025, the stakes are higher than ever. As organizations face increasingly sophisticated cyberattacks, Artificial Intelligence in cybersecurity is becoming a powerful ally in defending digital infrastructure. From detecting anomalies in real time to automating incident responses, AI cybersecurity is reshaping how we […]

The post How AI Is Transforming Cybersecurity in 2025: Skills, Tools & Career Opportunities appeared first on WeCloudData.

2 months, 1 week назад @ weclouddata.com
Learn Data Engineering
последний пост None
SCRIBD
последний пост 3 months назад
Building a Scalable Data Warehouse Backup System with AWS
Building a Scalable Data Warehouse Backup System with AWS Building a Scalable Data Warehouse Backup System with AWS

We designed and implemented a scalable, cost-optimized backup system for S3 data warehouses that runs automatically on a monthly schedule. The system handles petabytes of data across multiple databases and uses a hybrid approach: AWS Lambda for small workloads and ECS Fargate for larger ones.

At its core, the pipeline performs incremental backups — copying only new or changed parquet files while always preserving delta logs — dramatically reducing costs and runtime compared to full backups. Data is validated through S3 Inventory manifests, processed in parallel, and stored in Glacier for long-term retention.

To avoid data loss and reduce storage costs, we also implemented a safe deletion wo…

3 months назад @ tech.scribd.com
Terraform module to manage Oxbow Lambda and its components
Terraform module to manage Oxbow Lambda and its components

Oxbow is a project to take an existing storage location which contains Apache Parquet files into a Delta Lake table.

It is intended to run both as an AWS Lambda or as a command line application.

We are excited to introduce terraform-oxbow, an open-source Terraform module that simplifies the deployment and management of AWS Lambda and its supporting components. Whether you’re working with AWS Glue, Kinesis Data Firehose, SQS, or DynamoDB, this module provides a streamlined approach to infrastructure as code (IaC) in AWS.

✨ Why terraform-oxbow?

Managing event-driven architectures in AWS can be complex, requiring careful orchestration of multiple services. Terraform-oxbow abstracts much of thi…

9 months, 2 weeks назад @ tech.scribd.com
Data Quest
последний пост None
Infrastructure
AWS
последний пост 16 часов назад
Simplified management of Amazon MSK with natural language using Kiro CLI and Amazon MSK MCP Server
Simplified management of Amazon MSK with natural language using Kiro CLI and Amazon MSK MCP Server

In this post, we demonstrate how Kiro CLI and the MSK MCP server can streamline your Kafka management. Through practical examples and demonstrations, we show you how to use these tools to perform common administrative tasks efficiently while maintaining robust security and reliability.

16 часов назад @ aws.amazon.com
Programmatically creating an IDP solution with Amazon Bedrock Data Automation
Programmatically creating an IDP solution with Amazon Bedrock Data Automation

In this post, we explore how to programmatically create an IDP solution that uses Strands SDK, Amazon Bedrock AgentCore, Amazon Bedrock Knowledge Base, and Bedrock Data Automation (BDA). This solution is provided through a Jupyter notebook that enables users to upload multi-modal business documents and extract insights using BDA as a parser to retrieve relevant chunks and augment a prompt to a foundational model (FM).

16 часов назад @ aws.amazon.com
AI agent-driven browser automation for enterprise workflow management
AI agent-driven browser automation for enterprise workflow management

Enterprise organizations increasingly rely on web-based applications for critical business processes, yet many workflows remain manually intensive, creating operational inefficiencies and compliance risks. Despite significant technology investments, knowledge workers routinely navigate between eight to twelve different web applications during standard workflows, constantly switching contexts and manually transferring information between systems. Data entry and validation tasks […]

17 часов назад @ aws.amazon.com
Agentic QA automation using Amazon Bedrock AgentCore Browser and Amazon Nova Act
Agentic QA automation using Amazon Bedrock AgentCore Browser and Amazon Nova Act

In this post, we explore how agentic QA automation addresses these challenges and walk through a practical example using Amazon Bedrock AgentCore Browser and Amazon Nova Act to automate testing for a sample retail application.

17 часов назад @ aws.amazon.com
Optimizing LLM inference on Amazon SageMaker AI with BentoML’s LLM- Optimizer
Optimizing LLM inference on Amazon SageMaker AI with BentoML’s LLM- Optimizer

In this post, we demonstrate how to optimize large language model (LLM) inference on Amazon SageMaker AI using BentoML's LLM-Optimizer to systematically identify the best serving configurations for your workload.

17 часов назад @ aws.amazon.com
Exploring the zero operator access design of Mantle
Exploring the zero operator access design of Mantle

In this post, we explore how Mantle, Amazon's next-generation inference engine for Amazon Bedrock, implements a zero operator access (ZOA) design that eliminates any technical means for AWS operators to access customer data.

1 day, 12 hours назад @ aws.amazon.com
AWS AI League: Model customization and agentic showdown
AWS AI League: Model customization and agentic showdown

In this post, we explore the new AWS AI League challenges and how they are transforming how organizations approach AI development. The grand finale at AWS re:Invent 2025 was an exciting showcase of their ingenuity and skills.

1 day, 16 hours назад @ aws.amazon.com
Accelerate Enterprise AI Development using Weights & Biases and Amazon Bedrock AgentCore
Accelerate Enterprise AI Development using Weights & Biases and Amazon Bedrock AgentCore

In this post, we demonstrate how to use Foundation Models (FMs) from Amazon Bedrock and the newly launched Amazon Bedrock AgentCore alongside W&B Weave to help build, evaluate, and monitor enterprise AI solutions. We cover the complete development lifecycle from tracking individual FM calls to monitoring complex agent workflows in production.

1 day, 16 hours назад @ aws.amazon.com
How dLocal automated compliance reviews using Amazon Quick Automate
How dLocal automated compliance reviews using Amazon Quick Automate

In this post, we share how dLocal worked closely with the AWS team to help shape the product roadmap, reinforce its role as an industry innovator, and set new benchmarks for operational excellence in the global fintech landscape.

1 day, 16 hours назад @ aws.amazon.com
Advancing ADHD diagnosis: How Qbtech built a mobile AI assessment Model Using Amazon SageMaker AI
Advancing ADHD diagnosis: How Qbtech built a mobile AI assessment Model Using Amazon SageMaker AI

In this post, we explore how Qbtech streamlined their machine learning (ML) workflow using Amazon SageMaker AI, a fully managed service to build, train and deploy ML models, and AWS Glue, a serverless service that makes data integration simpler, faster, and more cost effective. This new solution reduced their feature engineering time from weeks to hours, while maintaining the high clinical standards required by healthcare providers.

1 day, 17 hours назад @ aws.amazon.com
Accelerating your marketing ideation with generative AI – Part 1: From idea to generation with the Amazon Nova foundation models
Accelerating your marketing ideation with generative AI – Part 1: From idea to generation with the Amazon Nova foundation models

In this post, the first of a series of three, we focus on how you can use Amazon Nova to streamline, simplify, and accelerate marketing campaign creation through generative AI. We show how Bancolombia, one of Colombia’s largest banks, is experimenting with the Amazon Nova models to generate visuals for their marketing campaigns.

1 day, 17 hours назад @ aws.amazon.com
Introducing Visa Intelligent Commerce on AWS: Enabling agentic commerce with Amazon Bedrock AgentCore
Introducing Visa Intelligent Commerce on AWS: Enabling agentic commerce with Amazon Bedrock AgentCore

In this post, we explore how AWS and Visa are partnering to enable agentic commerce through Visa Intelligent Commerce using Amazon Bedrock AgentCore. We demonstrate how autonomous AI agents can transform fragmented shopping and travel experiences into seamless, end-to-end workflows—from discovery and comparison to secure payment authorization—all driven by natural language.

1 day, 17 hours назад @ aws.amazon.com
Amazon ElastiCache re:Invent 2025 recap
Amazon ElastiCache re:Invent 2025 recap

re:Invent is a great opportunity for customers and builders who use AWS to share what they have built and why, architectural patterns, and best practices in the form of breakout sessions and workshops. In case you missed some of these sessions, or you wanted to get caught up on why customers like Expedia, Scopely, Adobe, and Amazon.com are building on ElastiCache, you can read this helpful summary of some of the ElastiCache highlights from re:Invent 2025.

2 days, 11 hours назад @ aws.amazon.com
Move Beyond Chain-of-Thought with Chain-of-Draft on Amazon Bedrock
Move Beyond Chain-of-Thought with Chain-of-Draft on Amazon Bedrock

This post explores Chain-of-Draft (CoD), an innovative prompting technique introduced in a Zoom AI Research paper Chain of Draft: Thinking Faster by Writing Less, that revolutionizes how models approach reasoning tasks. While Chain-of-Thought (CoT) prompting has been the go-to method for enhancing model reasoning, CoD offers a more efficient alternative that mirrors human problem-solving patterns—using concise, high-signal thinking steps rather than verbose explanations.

2 days, 15 hours назад @ aws.amazon.com
Deploy Mistral AI’s Voxtral on Amazon SageMaker AI
Deploy Mistral AI’s Voxtral on Amazon SageMaker AI

In this post, we demonstrate hosting Voxtral models on Amazon SageMaker AI endpoints using vLLM and the Bring Your Own Container (BYOC) approach. vLLM is a high-performance library for serving large language models (LLMs) that features paged attention for improved memory management and tensor parallelism for distributing models across multiple GPUs.

2 days, 15 hours назад @ aws.amazon.com
AWS
последний пост 16 часов назад
Enhance document analytics with Strands AI Agents for the GenAI IDP Accelerator
Enhance document analytics with Strands AI Agents for the GenAI IDP Accelerator

To address the need for businesses to quickly analyze information and unlock actionable insights, we are announcing Analytics Agent, a new feature that is seamlessly integrated into the GenAI IDP Accelerator. With this feature, users can perform advanced searches and complex analyses using natural language queries without SQL or data analysis expertise. In this post, we discuss how non-technical users can use this tool to analyze and understand the documents they have processed at scale with natural language.

2 days, 15 hours назад @ aws.amazon.com
Build a multimodal generative AI assistant for root cause diagnosis in predictive maintenance using Amazon Bedrock
Build a multimodal generative AI assistant for root cause diagnosis in predictive maintenance using Amazon Bedrock

In this post, we demonstrate how to implement a predictive maintenance solution using Foundation Models (FMs) on Amazon Bedrock, with a case study of Amazon's manufacturing equipment within their fulfillment centers. The solution is highly adaptable and can be customized for other industries, including oil and gas, logistics, manufacturing, and healthcare.

2 days, 16 hours назад @ aws.amazon.com
Unifying governance and metadata across Amazon SageMaker Unified Studio and Atlan
Unifying governance and metadata across Amazon SageMaker Unified Studio and Atlan

In this post, we show you how to unify governance and metadata across Amazon SageMaker Unified Studio and Atlan through a comprehensive bidirectional integration. You’ll learn how to deploy the necessary AWS infrastructure, configure secure connections, and set up automated synchronization to maintain consistent metadata across both platforms.

2 days, 16 hours назад @ aws.amazon.com
Introducing SOCI indexing for Amazon SageMaker Studio: Faster container startup times for AI/ML workloads
Introducing SOCI indexing for Amazon SageMaker Studio: Faster container startup times for AI/ML workloads

Today, we are excited to introduce a new feature for SageMaker Studio: SOCI (Seekable Open Container Initiative) indexing. SOCI supports lazy loading of container images, where only the necessary parts of an image are downloaded initially rather than the entire container.

5 days, 15 hours назад @ aws.amazon.com
Modernize Apache Spark workflows using Spark Connect on Amazon EMR on Amazon EC2
Modernize Apache Spark workflows using Spark Connect on Amazon EMR on Amazon EC2

In this post, we demonstrate how to implement Apache Spark Connect on Amazon EMR on Amazon Elastic Compute Cloud (Amazon EC2) to build decoupled data processing applications. We show how to set up and configure Spark Connect securely, so you can develop and test Spark applications locally while executing them on remote Amazon EMR clusters.

6 days, 12 hours назад @ aws.amazon.com
How Taxbit achieved cost savings and faster processing times using Amazon S3 Tables
How Taxbit achieved cost savings and faster processing times using Amazon S3 Tables

In this post, we discuss how Taxbit partnered with Amazon Web Services (AWS) to streamline their crypto tax analytics solution using Amazon S3 Tables, achieving 82% cost savings and five times faster processing times.

6 days, 12 hours назад @ aws.amazon.com
Create and update Apache Iceberg tables with partitions in the AWS Glue Data Catalog using the AWS SDK and AWS CloudFormation
Create and update Apache Iceberg tables with partitions in the AWS Glue Data Catalog using the AWS SDK and AWS CloudFormation

In this post, we show how to create and update Iceberg tables with partitions in the Data Catalog using the AWS SDK and AWS CloudFormation.

6 days, 12 hours назад @ aws.amazon.com
Optimizing correlated subqueries in Amazon Aurora PostgreSQL
Optimizing correlated subqueries in Amazon Aurora PostgreSQL

Correlated subqueries can cause performance challenges in Amazon Aurora PostgreSQL which can cause applications to experience reduced performance as data volumes grow. In this post, we explore the advanced optimization configurations available in Aurora PostgreSQL that can transform these performance challenges into efficient operations without requiring you to modify a single line of SQL code.

6 days, 13 hours назад @ aws.amazon.com
Build and deploy scalable AI agents with NVIDIA NeMo, Amazon Bedrock AgentCore, and Strands Agents
Build and deploy scalable AI agents with NVIDIA NeMo, Amazon Bedrock AgentCore, and Strands Agents

This post demonstrates how to use the powerful combination of Strands Agents, Amazon Bedrock AgentCore, and NVIDIA NeMo Agent Toolkit to build, evaluate, optimize, and deploy AI agents on Amazon Web Services (AWS) from initial development through production deployment.

6 days, 16 hours назад @ aws.amazon.com
Bi-directional streaming for real-time agent interactions now available in Amazon Bedrock AgentCore Runtime
Bi-directional streaming for real-time agent interactions now available in Amazon Bedrock AgentCore Runtime

In this post, you will learn about bi-directional streaming on AgentCore Runtime and the prerequisites to create a WebSocket implementation. You will also learn how to use Strands Agents to implement a bi-directional streaming solution for voice agents.

6 days, 17 hours назад @ aws.amazon.com
How Kaltura Accelerates CI/CD Using AWS CodeBuild-hosted Runners
How Kaltura Accelerates CI/CD Using AWS CodeBuild-hosted Runners

Kaltura, a leading AI video expirience cloud and corporate communications technology provider, transformed CI/CD infrastructure by migrating to AWS CodeBuild-hosted runners for GitHub Actions. This migration reduced DevOps operational overhead by 90%, accelerated build queue times by 66%, and cut infrastructure costs by 60%. Most importantly, the migration achieved these results while supporting Kaltura’s scale: […]

6 days, 19 hours назад @ aws.amazon.com
Power data ingestion into Splunk using Amazon Data Firehose
Power data ingestion into Splunk using Amazon Data Firehose

With Kinesis Data Firehose, customers can use a fully managed, reliable, and scalable data streaming solution to Splunk. In this post, we tell you a bit more about the Kinesis Data Firehose and Splunk integration. We also show you how to ingest large amounts of data into Splunk using Kinesis Data Firehose.

1 week назад @ aws.amazon.com
Best practices for querying Apache Iceberg data with Amazon Redshift
Best practices for querying Apache Iceberg data with Amazon Redshift

In this post, we discuss the best practices that you can follow while querying Apache Iceberg data with Amazon Redshift

1 week назад @ aws.amazon.com
Tracking and managing assets used in AI development with Amazon SageMaker AI
Tracking and managing assets used in AI development with Amazon SageMaker AI

In this post, we'll explore the new capabilities and core concepts that help organizations track and manage models development and deployment lifecycles. We will show you how the features are configured to train models with automatic end-to-end lineage, from dataset upload and versioning to model fine-tuning, evaluation, and seamless endpoint deployment.

1 week назад @ aws.amazon.com
IPv6 addressing with Amazon Redshift
IPv6 addressing with Amazon Redshift

As we witness the gradual transition from IPv4 to IPv6, AWS continues to expand its support for dual-stack networking across its service portfolio. In this post, we show how you can migrate your Amazon Redshift Serverless workgroup from IPv4-only to dual-stack mode, so you can make your data warehouse future ready.

1 week назад @ aws.amazon.com
Astronomer Astronomer
последний пост None
DBT — Data Build Tool DBT — Data Build Tool
последний пост None
FiveTran FiveTran
последний пост None
DataBricks
последний пост None
Mix
/r/DataEngineering
последний пост 3 часа назад
Am I crazy or is kafka overkill for most use cases?
Am I crazy or is kafka overkill for most use cases?

Serious question because I feel like I'm onto something. We're processing maybe 10k events per day. Someone on my team wants to set up a full kafka cluster with multiple servers, the whole thing. This is going to take months to set up and we'll need someone dedicated just to keep it running. Our needs are pretty simple. Receive data from a few services, clean it up, store in our database, send some to an api. That's it. Couldn't we just use something simpler? Why does everyone immediately jump to kafka like it's the only option? submitted by /u/Vodka-_-Vodka [link] [comments]

3 часа назад @ reddit.com
Advice on data pipeline
Advice on data pipeline Advice on data pipeline

Hi folks, here is my situation: My company has few system (CRM, ERP, SharePoint) and we want to build up a dashboard (no need real time atm) but we can not directly access databases, the only way to get data is via API polling. So I have sketch this pipeline but I'm quite new and not sure this work good, anyone can give me some advice? thank very much! -- I'm plan to using few lambda worker to polling apis from systems, our dataset is not too large and complex so I wanna my lambda worker do extract, transform, load on it. After transform data, worker will store data inside S3 bucket then after that using some service (maybe AWS Athena) to stream it to Power BI. -- https://preview.redd.it/oo…

6 часов назад @ reddit.com
Large MNC vs Scale up
Large MNC vs Scale up

Hello all, I’m a software engineer in the data space with about 1 year experience. I’ve been working with a large US mnc and while I am learning a decent amount , the office location is far from optimal. I’ve asked about relocation before which isn’t happening any time soon. I have been offered a position at a ~$100M ARR company at my preferred office location , which is a way smaller company than my current one. Is there still a risk of job security etc at a company that size ? There’s still often layoffs at my current company, despite the size difference. I’d also be willing to hear of people who jumped from large MNCs to scale ups , and if they learned a lot more in the scale up. Thanks …

10 часов назад @ reddit.com
Is it appropriate to store imagery in parquet?
Is it appropriate to store imagery in parquet?

Goal: Im currently trying to build a pipeline to ingest live imagery and metadata queued in Apache Pulsar and push to Iceberg via Flink. Issues: I’m having second thoughts as I’m working with terabytes of images an hour and I’m struggling to buffer the data for Parquet file creation, and am seeing extreme latency for uploads to Iceberg and slow Flink checkpoint times. Question: Is it inappropriate to store MBs of images per row in parquets and Iceberg instead of straight S3? Having the data in one place sounded nice at the time. submitted by /u/BitterFrostbite [link] [comments]

11 часов назад @ reddit.com
Need career Guidance
Need career Guidance

Hello everyone, I am currently working as staff software engineer in one of the top MNC with 9 YOE. I always have been working with data all thru my career (all DE tools you can think off Spark Hive Python SQL etc ). In my previous company I helped teams build APIs using python. Working for FAANG has always been a dream for me, to get that exposure and I like working in fast-paced projects. My current project is very slow paced and the work culture is becoming so toxic. I really spent a lot of time learning new things outside of my 9-5 to stay relevant in the current era like building AI applications (RAG, MCP servers, etc ). Implemented the same in my current role, making other engineers l…

11 часов назад @ reddit.com
ETL Developer?
ETL Developer?

Hello everyone, I recently pivoted into an ETL Developer II role at a Fortune 500 company, but it’s not what I expected. I came from a heavier Data Engineering background using Python, Spark, and Airflow, but this role is almost entirely basic SQL queries and GUI-based ETL tools. There is zero actual development work, and I’m worried my skills are going to stagnate. I’m debating whether I should jump ship during the Jan/Feb hiring cycle or gut it out for a full year. My main concern is my tenure history I have a few relatively short stints and I don't want to look like a job hopper. My Experience: Internships: Two 2-month stints. Data Engineer (F500): 1 year, 2 months. Gap: 6 months (layoff…

13 часов назад @ reddit.com
Career Transition to DE from RPA
Career Transition to DE from RPA

Hey Guys, I am planning to seek a career a transition from RPA to DE. Do you think I am making sense at this point of time or would you give me some better suggestions? FYI, I have 8+ years of work exp. submitted by /u/EfficientArt6695 [link] [comments]

16 часов назад @ reddit.com
Best practices for running multiple dbt projects in the same Airflow instance?
Best practices for running multiple dbt projects in the same Airflow instance?

Hi everyone, I’m currently working with two separate dbt projects, each with its own set of Airflow DAGs. Right now they’re logically independent, but I’m planning to deploy them into the same Airflow instance. I know this is technically supported, but my main concern is separation and maintainability, not just “will it run”. I’d love to hear from people who’ve done this in production: How do you structure repos and folders (Airflow + dbt)? Do you prefer one DAG per dbt project or something else? How do you handle profiles.yml, schemas, and permissions? Any gotchas around dependencies, dbt versions, or resource contention? Thanks in advance — appreciate any real-world advice 🙏 submitted by …

16 часов назад @ reddit.com
New Job working with Airflow questions
New Job working with Airflow questions

Hello! I'm starting a new job next week working as the only software engineer in a group of data engineers. They primarily work with airflow and want my first task to be to examine their DAGs etc to work on making them efficient. They're going to team me up with an SE from another department to help me through the process, but what are some things I could look for day 1 to try and impress my new bosses? submitted by /u/Kcrizzle87 [link] [comments]

17 часов назад @ reddit.com
Rust for data engineering?
Rust for data engineering?

Hi, I am curious about data engineering. Any DE using Rust as their second or third language? Did you enjoy it? Worth learning for someone after learning the fundamental skills for data engineering? If there are any blogs, I am up to read. So please share your experience. submitted by /u/otto_0805 [link] [comments]

18 часов назад @ reddit.com
Do you run into structural or data-quality issues in data files before pipelines break?
Do you run into structural or data-quality issues in data files before pipelines break?

I’m trying to understand something from people who work with real data pipelines. I’ve been experimenting with a small side tool that checks raw data files for structural and basic data-quality issues like data that looks valid but can cause issues downstream. I’m very aware that: Many of devs probably use schema validation, custom scripts etc. My current version is rough and incomplete But I’m curious from a learning perspective: Before pipelines break or dashboards look wrong, what kinds of issues do you actually run into most often? I’d genuinely appreciate any feedback, especially if you think this kind of tool is unnecessary or already solved better elsewhere. I’m here to learn what re…

19 часов назад @ reddit.com
problem with essential batch process and windows task scheduler
problem with essential batch process and windows task scheduler

We have a big customer for whom we are doing various data driven services. For one example we are very dependant on running a nightly batch process involving a bit of transactional type of data (10~20k datasets) that get transfered between systems over a tunnel. The batch process is basically a C# ConsoleApplication that gets scheduled by windows task scheduler. We are working on the customers environment so we don't have much of a choice here. There were multiple times where the process simply did not run for no apparent reason. What I would like to do is to use the task schedulers function of "retrying" the task in case of a failure for multiple times. The issues are most often resolved b…

1 day назад @ reddit.com
Sanity check on large-scale pre-ingestion data prep (OpenSearch, ~2TB+)
Sanity check on large-scale pre-ingestion data prep (OpenSearch, ~2TB+)

I’m working on a large-scale pre-ingestion data prep problem and I’m fairly sure my current thinking has blind spots. I’d rather get told exactly why this is wrong than waste days proving it the hard way. Context AWS OpenSearch This is offline data preparation, not an OpenSearch join All datasets share a common key: commonID Data is sharded as JSONL (data_0.jsonl, data_1.jsonl, etc.) Datasets approx Dataset A: ~2 TB (~1B docs) Dataset B: ~150 GB (~228M docs) Dataset C: ~150 GB (~108M docs) Dataset D: ~20 GB (~65M docs) Dataset E: ~10 GB (~12M docs) Each dataset exists independently today, but logically they all map to the same commonID. Goal Before ingesting into OpenSearch, I want to group…

1 day, 3 hours назад @ reddit.com
Data Quality on Spark — A Practical Series (Great Expectations, Soda, DQX, Deequ, Pandera)
Data Quality on Spark — A Practical Series (Great Expectations, Soda, DQX, Deequ, Pandera)

I'm planning to work on Data Quality improvement project at work so decided to start with current tools evaluation. So decided to write a blog series along the way. Part 1 — Great Expectations Part 2 — Soda Part 3 — DQX Part 4 — Deequ Part 5 — Pandera submitted by /u/ivan_kurchenko [link] [comments]

1 day, 4 hours назад @ reddit.com
Made a tool for myself that might help you: RabbitJson,Three-Step Shortcut to Perfect JSON Data Extraction & Formatting
Made a tool for myself that might help you: RabbitJson,Three-Step Shortcut to Perfect JSON Data Extraction & Formatting Made a tool for myself that might help you: RabbitJson,Three-Step Shortcut to Perfect JSON Data Extraction & Formatting

As a dev, I work with JSON constantly, and extracting/formatting specific data was getting tedious. So, I built RabbitJson for my own workflow. It’s a simple, focused tool that does one thing well: transforms JSON into the text format you need. Just point it at an array, use a template string, and you’re done. No bloat, just a straightforward way to clean up data for logging, reports, or quick checks. I found it super handy for my daily tasks and thought others might, too. It’s free to use. Hope it saves you a few minutes! Try it here: https://rabbitjson.cc/ Feedback is welcome! https://preview.redd.it/vrbhnkq5339g1.png?width=1827&format=png&auto=webp&s=42bec91f4335d63ed41ec6a2c15e0e4f6e6c8…

1 day, 5 hours назад @ reddit.com
Towards Data Science
последний пост 14 часов назад
The Machine Learning “Advent Calendar” Day 24: Transformers for Text in Excel
The Machine Learning “Advent Calendar” Day 24: Transformers for Text in Excel

An intuitive, step-by-step look at how Transformers use self-attention to turn static word embeddings into contextual representations, illustrated with simple examples and an Excel-friendly walkthrough.

The post The Machine Learning “Advent Calendar” Day 24: Transformers for Text in Excel appeared first on Towards Data Science.

14 часов назад @ towardsdatascience.com
Is Your Model Time-Blind? The Case for Cyclical Feature Encoding
Is Your Model Time-Blind? The Case for Cyclical Feature Encoding

How cyclical encoding improves machine learning prediction

The post Is Your Model Time-Blind? The Case for Cyclical Feature Encoding appeared first on Towards Data Science.

19 часов назад @ towardsdatascience.com
4 Techniques to Optimize AI Coding Efficiency
4 Techniques to Optimize AI Coding Efficiency

Learn how to code more effectively using AI

The post 4 Techniques to Optimize AI Coding Efficiency appeared first on Towards Data Science.

20 часов назад @ towardsdatascience.com
Bonferroni vs. Benjamini-Hochberg: Choosing Your P-Value Correction
Bonferroni vs. Benjamini-Hochberg: Choosing Your P-Value Correction

Multiple hypothesis testing, P-values, and Monte Carlo

The post Bonferroni vs. Benjamini-Hochberg: Choosing Your P-Value Correction appeared first on Towards Data Science.

22 часа назад @ towardsdatascience.com
The Machine Learning “Advent Calendar” Day 23: CNN in Excel
The Machine Learning “Advent Calendar” Day 23: CNN in Excel

A step-by-step 1D CNN for text, built in Excel, where every filter, weight, and decision is fully visible.

The post The Machine Learning “Advent Calendar” Day 23: CNN in Excel appeared first on Towards Data Science.

1 day, 8 hours назад @ towardsdatascience.com
How Agents Plan Tasks with To-Do Lists
How Agents Plan Tasks with To-Do Lists

Understanding the process behind agentic planning and task management in LangChain

The post How Agents Plan Tasks with To-Do Lists appeared first on Towards Data Science.

1 day, 19 hours назад @ towardsdatascience.com
Stop Retraining Blindly: Use PSI to Build a Smarter Monitoring Pipeline
Stop Retraining Blindly: Use PSI to Build a Smarter Monitoring Pipeline

A data scientist's guide to population stability index (PSI)

The post Stop Retraining Blindly: Use PSI to Build a Smarter Monitoring Pipeline appeared first on Towards Data Science.

1 day, 20 hours назад @ towardsdatascience.com
Synergy in Clicks: Harsanyi Dividends for E-Commerce
Synergy in Clicks: Harsanyi Dividends for E-Commerce

A brief overview of the math behind the Harsanyi Dividend and a real-world application in Streamlit

The post Synergy in Clicks: Harsanyi Dividends for E-Commerce appeared first on Towards Data Science.

1 day, 22 hours назад @ towardsdatascience.com
The Machine Learning “Advent Calendar” Day 22: Embeddings in Excel
The Machine Learning “Advent Calendar” Day 22: Embeddings in Excel

Understanding text embeddings through simple models and Excel

The post The Machine Learning “Advent Calendar” Day 22: Embeddings in Excel appeared first on Towards Data Science.

2 days, 11 hours назад @ towardsdatascience.com
The Machine Learning “Advent Calendar” Day 21: Gradient Boosted Decision Tree Regressor in Excel
The Machine Learning “Advent Calendar” Day 21: Gradient Boosted Decision Tree Regressor in Excel

Gradient descent in function space with decision trees

The post The Machine Learning “Advent Calendar” Day 21: Gradient Boosted Decision Tree Regressor in Excel appeared first on Towards Data Science.

2 days, 11 hours назад @ towardsdatascience.com
The Machine Learning “Advent Calendar” Day 20: Gradient Boosted Linear Regression in Excel
The Machine Learning “Advent Calendar” Day 20: Gradient Boosted Linear Regression in Excel

From Random Ensembles to Optimization: Gradient Boosting Explained

The post The Machine Learning “Advent Calendar” Day 20: Gradient Boosted Linear Regression in Excel appeared first on Towards Data Science.

2 days, 11 hours назад @ towardsdatascience.com
ChatLLM Presents a Streamlined Solution to Addressing the Real Bottleneck in AI
ChatLLM Presents a Streamlined Solution to Addressing the Real Bottleneck in AI

For the last couple of years, a lot of the conversation around AI has revolved around a single, deceptively simple question: Which model is the best? But the next question was always, the best for what? The best for reasoning? Writing? Coding? Or maybe it’s the best for images, audio, or video? That framing made […]

The post ChatLLM Presents a Streamlined Solution to Addressing the Real Bottleneck in AI appeared first on Towards Data Science.

2 days, 15 hours назад @ towardsdatascience.com
The Geometry of Laziness: What Angles Reveal About AI Hallucinations
The Geometry of Laziness: What Angles Reveal About AI Hallucinations

A story about failing forward, spheres you can’t visualize, and why sometimes the math knows things before we do

The post The Geometry of Laziness: What Angles Reveal About AI Hallucinations appeared first on Towards Data Science.

2 days, 18 hours назад @ towardsdatascience.com
Understanding Vibe Proving
Understanding Vibe Proving

How to make LLMs reason with verifiable, step-by-step logic (Part 1)

The post Understanding Vibe Proving appeared first on Towards Data Science.

2 days, 20 hours назад @ towardsdatascience.com
What Happens When You Build an LLM Using Only 1s and 0s
What Happens When You Build an LLM Using Only 1s and 0s

An LLM that's 41× more efficient and 9× faster than today's standard models

The post What Happens When You Build an LLM Using Only 1s and 0s appeared first on Towards Data Science.

2 days, 22 hours назад @ towardsdatascience.com
Monte Carlo Data Monte Carlo Data
последний пост 5 months, 1 week назад
The Data Engineer’s Guide To Root Cause Analysis for Data Quality Issues
The Data Engineer’s Guide To Root Cause Analysis for Data Quality Issues

Introducing a five-step engineering root cause analysis approach used by some of the best data engineering and data science teams for data quality issues.

5 months, 1 week назад @ montecarlodata.com
The Ultimate Guide To Data Lineage
The Ultimate Guide To Data Lineage

Data lineage is a must-have feature of the modern data stack, yet we're struggling to derive value from it. Here's why and how we can fix this.

5 months, 3 weeks назад @ montecarlodata.com
Data Quality Monitoring Explained – You’re Doing It Wrong
Data Quality Monitoring Explained – You’re Doing It Wrong

Data quality monitoring is one of the traditional methods of managing data quality—but is it enough? Find out what's missing, and how to do it better.

6 months назад @ montecarlodata.com
5 Simple Steps For Snowflake Cost Optimization Without Getting Too Crazy
5 Simple Steps For Snowflake Cost Optimization Without Getting Too Crazy

Snowflake cost optimization efforts need to be right sized. Read how to get the most savings without investing too much time and sweat.

6 months, 3 weeks назад @ montecarlodata.com
Is Modern Data Warehouse Architecture Broken?
Is Modern Data Warehouse Architecture Broken?

The modern data warehouse architecture creates problems across many layers. Consider instead an immutable data warehouse for scale and usability.

7 months назад @ montecarlodata.com
12 Data Quality Metrics That ACTUALLY Matter
12 Data Quality Metrics That ACTUALLY Matter

How to improve your Data Quality Metrics and why it matters for your business.

7 months, 1 week назад @ montecarlodata.com
Best Data Observability Tools (with RFP Template)
Best Data Observability Tools (with RFP Template)

Monte Carlo is rated #1, but we recognize there are alternatives. Here's how the experts evaluate data observability tools.

7 months, 2 weeks назад @ montecarlodata.com
Best Data Observability Tools (with RFP Template)
Best Data Observability Tools (with RFP Template)

Monte Carlo is rated #1, but we recognize there are alternatives. Here's how the experts evaluate data observability tools.

7 months, 2 weeks назад @ wordpress-1393905-5297234.cloudwaysapps.com
Data Vault Architecture: Everything You Need to Know Before You Build
Data Vault Architecture: Everything You Need to Know Before You Build

How Pie Insurance improves data quality across their data vault architecture.

7 months, 3 weeks назад @ montecarlodata.com
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025

The data estate is evolving, and data quality management needs to evolve right along with it. Here are three common approaches and where the field is heading in the AI era.

8 months назад @ montecarlodata.com
Data Observability: How to Build Your Own Data Anomaly Detectors Using SQL
Data Observability: How to Build Your Own Data Anomaly Detectors Using SQL

How to use metadata to understand the root cause of data anomalies and take your data quality testing to the next level.

8 months, 1 week назад @ montecarlodata.com
How to Conduct Data Incident Management for Data Teams
How to Conduct Data Incident Management for Data Teams

Conduct data incident management with 4 simple steps to identify, root cause, and fix data quality issues at scale.

8 months, 1 week назад @ montecarlodata.com
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025
The Past, Present, and Future of Data Quality Management: Testing, Monitoring, and Data Observability in 2025

The data estate is evolving, and data quality management needs to evolve right along with it. Here are three common approaches and where the field is heading in the AI era.

8 months, 2 weeks назад @ wordpress-1393905-5297234.cloudwaysapps.com
5 Generative AI Use Cases Companies Should Know About in 2025
5 Generative AI Use Cases Companies Should Know About in 2025

Learn 5 popular generative AI use cases the data teams at OpenAI, Whatnot, and other companies are generative AI to drive value today.

8 months, 3 weeks назад @ montecarlodata.com
5 Generative AI Use Cases Companies Should Know About in 2025
5 Generative AI Use Cases Companies Should Know About in 2025

Learn 5 popular generative AI use cases the data teams at OpenAI, Whatnot, and other companies are generative AI to drive value today.

8 months, 3 weeks назад @ wordpress-1393905-5297234.cloudwaysapps.com
DE Telegram
DataEng DataEng
последний пост 1 week, 3 days назад
Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)
Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition) Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)

Обновленный мини-курс по Apache Kafka от небезызвестного Тима Бёргланда: Apache Kafka 101 (2025 Edition)

1 week, 3 days назад @ t.me
Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.
Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.

Orchestrate LLMs and Agents with Apache Airflow®Новая книга от Astronomer про управление агентами через airflow-ai-sdk и Human In The Loop, который появился в Airflow 3.

1 month, 1 week назад @ t.me
Доклады с Airflow Summit 2025Подъехали доклады с прошедшей не так давно конференции Airflow Summit 2025, много вкусного, будет что посмотреть по вечерам:— Airflow at OpenAI— Benchmarking the Performance of Dynamically Generated DAGs— Airflow That Remembers
Доклады с Airflow Summit 2025Подъехали доклады с прошедшей не так давно конференции Airflow Summit 2025, много вкусного, будет что посмотреть по вечерам:— Airflow at OpenAI— Benchmarking the Performance of Dynamically Generated DAGs— Airflow That Remembers

Доклады с Airflow Summit 2025Подъехали доклады с прошедшей не так давно конференции Airflow Summit 2025, много вкусного, будет что посмотреть по вечерам:— Airflow at OpenAI— Benchmarking the Performance of Dynamically Generated DAGs— Airflow That Remembers: The Dag Versioning Era is here!— DAGLint: Elevating Airflow DAG Quality Through Automated Linting— Allegro's Airflow Journey: From On-Prem to Cloud Orchestration at Scale— Deadline Alerts in Airflow 3.1— Beyond Logs: Unlocking Airflow 3.0 Observability with OpenTelemetry Traces— Introducing Apache Airflow® 3 – The Next Evolution in Orchestration— Security made us do it: Airflow’s new Task Execution Architecture— Unlocking Event-Driven Sc…

1 month, 1 week назад @ t.me
Очередной подгон от Astronomer про лучшие практики построения ETL/ELT пайплайнов на базе Apache Airflow 3 — Best practices for ETL and ELT pipelines with Apache Airflow 3Небольшая электронная книга на 50 страниц, удобно использовать как справочник.
Очередной подгон от Astronomer про лучшие практики построения ETL/ELT пайплайнов на базе Apache Airflow 3 — Best practices for ETL and ELT pipelines with Apache Airflow 3Небольшая электронная книга на 50 страниц, удобно использовать как справочник.

Очередной подгон от Astronomer про лучшие практики построения ETL/ELT пайплайнов на базе Apache Airflow 3 — Best practices for ETL and ELT pipelines with Apache Airflow 3Небольшая электронная книга на 50 страниц, удобно использовать как справочник.

1 month, 2 weeks назад @ t.me
XLTable - OLAP Cервер для нового стека данныхРаботайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.📈Ключевые возможности XLTable: • Ан
XLTable - OLAP Cервер для нового стека данныхРаботайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.Предоставьте пользователям возможность самостоятельно работать с данными, с помощью  знакомого инструмента.📈Ключевые возможности XLTable: • Ан XLTable - OLAP Cервер для нового стека данныхРаботайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.📈Ключевые возможности XLTable: • Ан

XLTable - OLAP Cервер для нового стека данныхРаботайте с ClickHouse, BigQuery, Snowflake из сводной таблицы Excel.Предоставьте пользователям возможность самостоятельно работать с данными, с помощью знакомого инструмента.📈Ключевые возможности XLTable: • Аналог MS OLAP (SSAS) для больших данных • Интеграция с MS Excel по протоколу XMLA • Поддержка ClickHouse, BigQuery, Snowflake • Скоро: YDB, Greenplum • Множество групп мер, иерархий и измерений в одном кубе • Гибкие настройки кэширования • Развёртывание внутри вашей инфраструктуры или в облаке🔒Безопасность: • Интеграция с LDAP • Разграничение доступа на уровне мер, измерений и их членов⚙️Производительность:• Безлимитное количество мер и изме…

1 month, 2 weeks назад @ t.me
Apache Airflow 3.1.1Вышел новый релиз Apache Airflow 3.1.1 очередным паком багфиксов — Airflow 3.1.1 (2025-10-27). Пофиксали очередную утечку памяти с remote logging connection cache. Что-то 3-я версия Эйрфлоу богата на ошибки с утечками памяти. Бегу обнов
Apache Airflow 3.1.1Вышел новый релиз Apache Airflow 3.1.1 очередным паком багфиксов — Airflow 3.1.1 (2025-10-27). Пофиксали очередную утечку памяти с remote logging connection cache. Что-то 3-я версия Эйрфлоу богата на ошибки с утечками памяти. Бегу обнов Apache Airflow 3.1.1Вышел новый релиз Apache Airflow 3.1.1 очередным паком багфиксов — Airflow 3.1.1 (2025-10-27). Пофиксали очередную утечку памяти с remote logging connection cache. Что-то 3-я версия Эйрфлоу богата на ошибки с утечками памяти. Бегу обнов

Apache Airflow 3.1.1Вышел новый релиз Apache Airflow 3.1.1 очередным паком багфиксов — Airflow 3.1.1 (2025-10-27). Пофиксали очередную утечку памяти с remote logging connection cache. Что-то 3-я версия Эйрфлоу богата на ошибки с утечками памяти. Бегу обновлять свой инстанс.

1 month, 4 weeks назад @ t.me
Построение пайплайнов dlt в Apache Airflowdlt это python библиотека для загрузки данных из разных источников. Она из коробки поддерживает работу с REST API, SQL, облачными хранилища и т.д. В сети появился бесплатный курс как подружить dlt и Apache Airflow
Построение пайплайнов dlt в Apache Airflowdlt это python библиотека для загрузки данных из разных источников. Она из коробки поддерживает работу с REST API, SQL, облачными хранилища и т.д. В сети появился бесплатный курс как подружить dlt и Apache Airflow

Построение пайплайнов dlt в Apache Airflowdlt это python библиотека для загрузки данных из разных источников. Она из коробки поддерживает работу с REST API, SQL, облачными хранилища и т.д. В сети появился бесплатный курс как подружить dlt и Apache Airflow — Deploy dlt pipelines. Сейчас доступны материалы про Apache Airflow, но на подходе информация и про Prefect, Dagster, Kestra, Orchestra и Modal. Я неоднократно слышал про dlt, но ни разу не доводилось использовать. Сейчас у меня есть пара проектов, где необходимо забирать данные из Airtable. Планирую ознакомиться с курсом и попробовать переделать свой пайплайн.

1 month, 4 weeks назад @ t.me
Ребята из Qdrant запустили бесплатный семидневный курс про свою векторную базу данных: Qdrant EssentialsМеня в последнее время интересует тема векторного поиска и векторных БД, и Qdrant как раз неплохой кандидат на изучение и реализацию какого-нибудь проек
Ребята из Qdrant запустили бесплатный семидневный курс про свою векторную базу данных: Qdrant EssentialsМеня в последнее время интересует тема векторного поиска и векторных БД, и Qdrant как раз неплохой кандидат на изучение и реализацию какого-нибудь проек

Ребята из Qdrant запустили бесплатный семидневный курс про свою векторную базу данных: Qdrant EssentialsМеня в последнее время интересует тема векторного поиска и векторных БД, и Qdrant как раз неплохой кандидат на изучение и реализацию какого-нибудь проекта (спойлер: домашнего векторного поисковика). Курс прям как по заказу!

2 months назад @ t.me
The Annual Airflow SurveyЕсли вы пользуетесь Apache Airflow, то давайте поможем сообществу собрать больше информации об использовании Airflow. До 20 ноября необходимо заполнить опросник на сайте взамен вы получите возможность пройти сертификацию по Airflow
The Annual Airflow SurveyЕсли вы пользуетесь Apache Airflow, то давайте поможем сообществу собрать больше информации об использовании Airflow. До 20 ноября необходимо заполнить опросник на сайте взамен вы получите возможность пройти сертификацию по Airflow

The Annual Airflow SurveyЕсли вы пользуетесь Apache Airflow, то давайте поможем сообществу собрать больше информации об использовании Airflow. До 20 ноября необходимо заполнить опросник на сайте взамен вы получите возможность пройти сертификацию по Airflow от Astronomer бесплатно (я сдавал их экзамен и он хороший). Опросник небольшой, замёт не более 10 минут вашего времени.

2 months назад @ t.me
Airflow AI SDKНашел интересный реп от Astronomer с набором тасков для работы с большими языковыми моделями — airflow-ai-sdk.Пакет предлагает набор декораторов:— LLM tasks with @task.llm: Define tasks that call language models to process text— Agent tasks w
Airflow AI SDKНашел интересный реп от Astronomer с набором тасков для работы с большими языковыми моделями — airflow-ai-sdk.Пакет предлагает набор декораторов:— LLM tasks with @task.llm: Define tasks that call language models to process text— Agent tasks w

Airflow AI SDKНашел интересный реп от Astronomer с набором тасков для работы с большими языковыми моделями — airflow-ai-sdk.Пакет предлагает набор декораторов:— LLM tasks with @task.llm: Define tasks that call language models to process text— Agent tasks with @task.agent: Orchestrate multi-step AI reasoning with custom tools—Branching with @task.llm_branch: Change DAG control flow based on LLM output— Embedding tasks with @task.embed: Create vector embeddings from textПоддерживает работу с OpenAI, Anthropic, Gemini и другими через пакет pydantic-ai. С новым механизмом Human-in-the-Loop в Airflow 3.1 стало ещё удобнее контролировать процесс с помощью человека. Имхо, Airflow неплохо вписывает…

2 months, 1 week назад @ t.me
MCP сервер для Apache AirflowНашел репозиторий с готовым MCP сервером для Apache Airflow — mcp-server-apache-airflowMCP или Model Context Protocol - это протокол, позволяющий большим языковым моделям взаимодействовать со сторонними сервисами, дергая их за
MCP сервер для Apache AirflowНашел репозиторий с готовым MCP сервером для Apache Airflow — mcp-server-apache-airflowMCP или Model Context Protocol - это протокол, позволяющий большим языковым моделям взаимодействовать со сторонними сервисами, дергая их за

MCP сервер для Apache AirflowНашел репозиторий с готовым MCP сервером для Apache Airflow — mcp-server-apache-airflowMCP или Model Context Protocol - это протокол, позволяющий большим языковым моделям взаимодействовать со сторонними сервисами, дергая их за "ручки". Например, используя этот MCP сервер для Airflow можно через ИИ-агента манипулировать дагами и не только.

2 months, 1 week назад @ t.me
Jetbrains DataGrip бесплатно для некоммерческих целейТеперь JetBrains DataGrip можно использовать бесплатно в некоммерческих целях. Я уже давно пользуюсь продуктами JetBrains, мой фаворит безусловно PyCharm. Работая в компании Playirx, я регулярно использо
Jetbrains DataGrip бесплатно для некоммерческих целейТеперь JetBrains DataGrip можно использовать бесплатно в некоммерческих целях. Я уже давно пользуюсь продуктами JetBrains, мой фаворит безусловно PyCharm. Работая в компании Playirx, я регулярно использо

Jetbrains DataGrip бесплатно для некоммерческих целейТеперь JetBrains DataGrip можно использовать бесплатно в некоммерческих целях. Я уже давно пользуюсь продуктами JetBrains, мой фаворит безусловно PyCharm. Работая в компании Playirx, я регулярно использовал DataGrip и считаю его лучшей оболочкой для работы с базами данных. DataGrip пополнил линейку бесплатных продуктов (для некоммерческих целей) наряду с CLion, RustRover, WebStorm и RubyMine. Вполне возможно, что скоро мы увидим и Rider и GoLand в этом списке 🤞

2 months, 1 week назад @ t.me
Data Engineering Design Patterns 🔥В сети бесплатно раздают электронную копию книги Data Engineering Design Patterns. Я её ещё не читал. На книжных сайтах у неё неплохой рейтинг. Если вдруг искали что почитать по теме, то думаю стоит приглядеться. Ну а чтоб
Data Engineering Design Patterns 🔥В сети бесплатно раздают электронную копию книги Data Engineering Design Patterns. Я её ещё не читал. На книжных сайтах у неё неплохой рейтинг. Если вдруг искали что почитать по теме, то думаю стоит приглядеться. Ну а чтоб

Data Engineering Design Patterns 🔥В сети бесплатно раздают электронную копию книги Data Engineering Design Patterns. Я её ещё не читал. На книжных сайтах у неё неплохой рейтинг. Если вдруг искали что почитать по теме, то думаю стоит приглядеться. Ну а чтобы вам не нужно было заполнять форму, я сразу прикрепил pdf с книгой к сообщению.

2 months, 1 week назад @ t.me
Как я чищу метаданные Apache Airflow 3.xВ блоге Apache Airflow есть скрипт для периодической чистки метаданных в БД Apache Airflow. Но начиная с Airflow 3.0 невозможно обращаться к БД напрямую (через модели SQLAlchemy), в связи с этим скрипт не работает. Д
Как я чищу метаданные Apache Airflow 3.xВ блоге Apache Airflow есть скрипт для периодической чистки метаданных в БД Apache Airflow. Но начиная с Airflow 3.0 невозможно обращаться к БД напрямую (через модели SQLAlchemy), в связи с этим скрипт не работает. Д

Как я чищу метаданные Apache Airflow 3.xВ блоге Apache Airflow есть скрипт для периодической чистки метаданных в БД Apache Airflow. Но начиная с Airflow 3.0 невозможно обращаться к БД напрямую (через модели SQLAlchemy), в связи с этим скрипт не работает. Даже вызов shell команды airflow db clean через BashOperator выдаст ошибку по типу: Could not parse SQLAlchemy URL from string 'airflow-db-not-allowed:///': source="airflow.task.hooks.airflow.providers.standard.hooks.subprocess.SubprocessHook"RuntimeError: Direct database access via the ORM is not allowed in Airflow 3.0Как решить? Я нашел выход запуска через старый добрый Cron:0 0 * * * /home/airflow/.airflow/bin/airflow db clean --clean-be…

2 months, 1 week назад @ t.me
Apache Airflow 3 в Amazon CloudНа Amazon стала доступна 3-я версия Apache Airflow: Introducing Apache Airflow 3 on Amazon MWAA: New features and capabilitiesНо я бы пока не спешил бежать и обновляться, т.к. релиз спорный, а тем более вышла уже версия 3.1 (
Apache Airflow 3 в Amazon CloudНа Amazon стала доступна 3-я версия Apache Airflow: Introducing Apache Airflow 3 on Amazon MWAA: New features and capabilitiesНо я бы пока не спешил бежать и обновляться, т.к. релиз спорный, а тем более вышла уже версия 3.1 (

Apache Airflow 3 в Amazon CloudНа Amazon стала доступна 3-я версия Apache Airflow: Introducing Apache Airflow 3 on Amazon MWAA: New features and capabilitiesНо я бы пока не спешил бежать и обновляться, т.к. релиз спорный, а тем более вышла уже версия 3.1 (её ещё нет в Амазоне), в которой часть проблем как с движком так и с интерфейсом была исправлена. Постепенно всё же готовиться к переходу стоит начать. В этом поможет руководство по переходу со 2 на 3 от Amazon: Best practices for migrating from Apache Airflow 2.x to Apache Airflow 3.x on Amazon MWAAИз неприятного. В тройке запретили прямой доступ к базе из рабочих нод (рабочих лошадок), т.е. как раньше использовать модели SQLAlchemy для ч…

2 months, 1 week назад @ t.me
Инжиниринг Данных Инжиниринг Данных
последний пост 4 days, 14 hours назад
Лекция в MIT про Computer Science в год моего рождения.https://youtu.be/-J_xL4IGhJA?si=OAnPFlJg9qK8lYHQComputer Science is not about Science or Computers.
Лекция в MIT про Computer Science в год моего рождения.https://youtu.be/-J_xL4IGhJA?si=OAnPFlJg9qK8lYHQComputer Science is not about Science or Computers.

Лекция в MIT про Computer Science в год моего рождения.https://youtu.be/-J_xL4IGhJA?si=OAnPFlJg9qK8lYHQComputer Science is not about Science or Computers.

4 days, 14 hours назад @ t.me
Интересный кейс был недавно.Сейчас работа без AI code assistant чувствуется так, как будто нужно пешком, иногда на велосипеде, проехать 100 км вместо того, чтобы взять машину. Без AI уже очень сложно быть на 100% эффективным.Конечно, ключевой вопрос — это
Интересный кейс был недавно.Сейчас работа без AI code assistant чувствуется так, как будто нужно пешком, иногда на велосипеде, проехать 100 км вместо того, чтобы взять машину. Без AI уже очень сложно быть на 100% эффективным.Конечно, ключевой вопрос — это Интересный кейс был недавно.Сейчас работа без AI code assistant чувствуется так, как будто нужно пешком, иногда на велосипеде, проехать 100 км вместо того, чтобы взять машину. Без AI уже очень сложно быть на 100% эффективным.Конечно, ключевой вопрос — это

Интересный кейс был недавно.Сейчас работа без AI code assistant чувствуется так, как будто нужно пешком, иногда на велосипеде, проехать 100 км вместо того, чтобы взять машину. Без AI уже очень сложно быть на 100% эффективным.Конечно, ключевой вопрос — это фундаментальные знания. Например, я могу не знать ничего в мобильной разработке, но с AI смогу создать мобильное приложение. Качество будет так себе, ведь у меня нет опыта в этом деле и AI нафантазирует за меня, сделает MVP, который вряд ли попадёт в продакшн. И самое главное — знаний у меня в мобильной разработке не прибавится.А вот если я эксперт в какой-то области и просто хочу аутсорсить простые запросы и задачки junior (AI), и могу чё…

5 days, 8 hours назад @ t.me
Новый CLI клиент https://willmcgugan.github.io/toad-released/Demo выглядит классно. Создатель сделал упор на markdown и user experience
Новый CLI клиент https://willmcgugan.github.io/toad-released/Demo выглядит классно. Создатель сделал упор на markdown и user experience

Новый CLI клиент https://willmcgugan.github.io/toad-released/Demo выглядит классно. Создатель сделал упор на markdown и user experience

6 days, 14 hours назад @ t.me
Знаете, где сейчас косанлтинг компании зарабатывают в Северной Америке?Нет, это не AI. Про AI я уже только опубликовал историю. На традиционных миграциях. Но они не совсем традиционные. Вот, кто-то навайбкодил:COBOL to Databricks ConverterSAS to Databricks
Знаете, где сейчас косанлтинг компании зарабатывают в Северной Америке?Нет, это не AI. Про AI я уже только опубликовал историю. На традиционных миграциях. Но они не совсем традиционные. Вот, кто-то навайбкодил:COBOL to Databricks ConverterSAS to Databricks

Знаете, где сейчас косанлтинг компании зарабатывают в Северной Америке?Нет, это не AI. Про AI я уже только опубликовал историю. На традиционных миграциях. Но они не совсем традиционные. Вот, кто-то навайбкодил:COBOL to Databricks ConverterSAS to Databricks ConverterК сожалению, AI в этих вопросах не сильно помогает(л). Не знаю как сейчас. Может быть когда-нибудь будет миграция 1C на Databricks? Кстати, один раз общался с разработчиком 1С из Майами, так что получится еще наоборот из Databricks на 1C. У меня всегда была мечта - сделать аналитическую платформу в экосистеме 1С👀

6 days, 20 hours назад @ t.me
Представьте себе коммуналку, в которой живут только аналитики. Как вы думаете, о чём там будут говорить?Если подумали исключительно про цифры, то зря 🙂 Потому что мы в Авито собрали в Телеграме комьюнити «Коммуналка аналитиков», чтобы посмотреть, что будет
Представьте себе коммуналку, в которой живут только аналитики. Как вы думаете, о чём там будут говорить?Если подумали исключительно про цифры, то зря 🙂 Потому что мы в Авито собрали в Телеграме комьюнити «Коммуналка аналитиков», чтобы посмотреть, что будет

Представьте себе коммуналку, в которой живут только аналитики. Как вы думаете, о чём там будут говорить?Если подумали исключительно про цифры, то зря 🙂 Потому что мы в Авито собрали в Телеграме комьюнити «Коммуналка аналитиков», чтобы посмотреть, что будет.Получилось очень даже интересно. Оказалось, аналитики с удовольствием пишут обо всём вокруг профессии:✍️ Рассказывают о рабочих буднях✍️ Хвастаются успехами и вспоминают фейлы✍️ Постят мемы✍️ Запускают опросы и собирают бинго✍️ Шутят✍️ Делятся лайфхаками✍️ Создают серьёзные посты про аналитику✍️ И-и-и обсуждают другие штуки, которые сложно классифицироватьПодписывайтесь на канал и читайте недушную аналитику 😉

1 week назад @ t.me
А у вас не внедряют AI? Вот вам совет для карьерного буста:В прошлом квартале я внедрил Microsoft Copilot для 4 000 сотрудников. 30 долларов за место в месяц. 1,4 миллиона долларов в год.Я назвал это "цифровой трансформацией". Совету директоров понравилась
А у вас не внедряют AI? Вот вам совет для карьерного буста:В прошлом квартале я внедрил Microsoft Copilot для 4 000 сотрудников. 30 долларов за место в месяц. 1,4 миллиона долларов в год.Я назвал это "цифровой трансформацией". Совету директоров понравилась

А у вас не внедряют AI? Вот вам совет для карьерного буста:В прошлом квартале я внедрил Microsoft Copilot для 4 000 сотрудников. 30 долларов за место в месяц. 1,4 миллиона долларов в год.Я назвал это "цифровой трансформацией". Совету директоров понравилась эта фраза. Они одобрили это за одиннадцать минут. Никто не спросил, что это на самом деле будет делать. Включая меня.Я всем говорил, что это "увеличит продуктивность в 10 раз". Это не реальное число. Но звучит как реальное.HR спросил, как мы будем измерять этот 10-кратный рост. Я сказал, что мы "задействуем аналитические панели". Они перестали спрашивать.Три месяца спустя я проверил отчёты об использовании. 47 человек открыли его. 12 испо…

1 week назад @ t.me
Хотите узнать кошмар современного high-performance сотрудника? Windows ноутбук без админского доступа, без возможности скачать программы, AI чат, AI IDE. И компьютер ложится спать каждый 15 минут без активности. Даже, чтобы скачать Python или Git нужен зап
Хотите узнать кошмар современного high-performance сотрудника? Windows ноутбук без админского доступа, без возможности скачать программы, AI чат, AI IDE. И компьютер ложится спать каждый 15 минут без активности. Даже, чтобы скачать Python или Git нужен зап

Хотите узнать кошмар современного high-performance сотрудника? Windows ноутбук без админского доступа, без возможности скачать программы, AI чат, AI IDE. И компьютер ложится спать каждый 15 минут без активности. Даже, чтобы скачать Python или Git нужен запрос в help desk, согласование безопасностью и ожидание несколько дней.Получается уже не high-performance. А ведь раньше все как-то обходились без всего этого.

1 week, 1 day назад @ t.me
Google Antigravity — это новая, бесплатная IDE. Это прямой конкурент других AI IDE, таких как Cursor.https://antigravity.googleGo тестировать⛷
Google Antigravity — это новая, бесплатная IDE. Это прямой конкурент других AI IDE, таких как Cursor.https://antigravity.googleGo тестировать⛷

Google Antigravity — это новая, бесплатная IDE. Это прямой конкурент других AI IDE, таких как Cursor.https://antigravity.googleGo тестировать⛷

1 week, 3 days назад @ t.me
Данные — сырьё для гипотез. А без гипотез не получится успешный продукт.В VK аналитики помогают продуктам говорить на языке пользователей. Узнайте, как принципы помогают VK превращать гипотезы в фичи и чем гордятся команды. Переходите по ссылке — вдохновля
Данные — сырьё для гипотез. А без гипотез не получится успешный продукт.В VK аналитики помогают продуктам говорить на языке пользователей. Узнайте, как принципы помогают VK превращать гипотезы в фичи и чем гордятся команды. Переходите по ссылке — вдохновля

Данные — сырьё для гипотез. А без гипотез не получится успешный продукт.В VK аналитики помогают продуктам говорить на языке пользователей. Узнайте, как принципы помогают VK превращать гипотезы в фичи и чем гордятся команды. Переходите по ссылке — вдохновляйтесь и присоединяйтесь.

1 week, 4 days назад @ t.me
Недавно изучал архитектуру AI-приложений у Microsoft при подготовке к AI-900 экзамену. Там выделяют 4 слоя: данные, модели, вычисления и оркестрация.Все любят говорить про модели. GPT, fine-tuning, prompt engineering. Но никто не говорит про слой данных.А
Недавно изучал архитектуру AI-приложений у Microsoft при подготовке к AI-900 экзамену. Там выделяют 4 слоя: данные, модели, вычисления и оркестрация.Все любят говорить про модели. GPT, fine-tuning, prompt engineering. Но никто не говорит про слой данных.А

Недавно изучал архитектуру AI-приложений у Microsoft при подготовке к AI-900 экзамену. Там выделяют 4 слоя: данные, модели, вычисления и оркестрация.Все любят говорить про модели. GPT, fine-tuning, prompt engineering. Но никто не говорит про слой данных.А ведь слой данных - это основа, без него ваша крутая модель просто не работает.Что включает слой данных:- Структурированные данные (SQL, PostgreSQL)- Неструктурированные данные (документы, изображения)- Потоковые данные в реальном времениУ Microsoft для этого есть Cosmos DB, Azure Data Lake. Все как сервис (PaaS), чтобы не возиться с инфраструктурой.Дальше идет слой моделей - тут обучение, fine-tuning, версионирование. Можно взять готовую м…

1 week, 4 days назад @ t.me
Первый раз увидел вакансию Analytics Engineer. Обычно всегда Data Engineer. Ключевое тут - это dbt. Но как видно в компании еще есть Trino, Iceberg. В целом для отечественного рынка очень хороший стек! Обычно разделение идет на дата инженера и дата аналит
Первый раз увидел вакансию Analytics Engineer. Обычно всегда Data Engineer. Ключевое тут - это dbt. Но как видно в компании еще есть Trino, Iceberg. В целом для отечественного рынка очень хороший стек!  Обычно разделение идет на дата инженера и дата аналит Первый раз увидел вакансию Analytics Engineer. Обычно всегда Data Engineer. Ключевое тут - это dbt. Но как видно в компании еще есть Trino, Iceberg. В целом для отечественного рынка очень хороший стек! Обычно разделение идет на дата инженера и дата аналит

Первый раз увидел вакансию Analytics Engineer. Обычно всегда Data Engineer. Ключевое тут - это dbt. Но как видно в компании еще есть Trino, Iceberg. В целом для отечественного рынка очень хороший стек! Обычно разделение идет на дата инженера и дата аналитика. Что уже давно не отражает суть. Сейчас все вакансии инженерные (vibe coding?). Просто дата инженер еще может создавать инфраструктуру для аналитического решения, а аналитик инженер строить витрины. Главный скилл для аналитик инженера - это понимание бизнеса и общение с бизнес заказчиками. То есть вам надо построить дашборд и вам не нужно ждать пока дата инженеры соберут витрину, они могут сами сделать витрину и job для ее обновления. Р…

1 week, 5 days назад @ t.me
MWS Cloud запустил сервис GPU on-premises.Что это такое? Компания будет устанавливать серверы с GPU необходимые для обучения и инференса искусственного интеллекта в периметре предприятий.Посмотрел, как это работает: • Специалисты помогают компании определи
MWS Cloud запустил сервис GPU on-premises.Что это такое? Компания будет устанавливать серверы с GPU необходимые для обучения и инференса искусственного интеллекта в периметре предприятий.Посмотрел, как это работает: • Специалисты помогают компании определи

MWS Cloud запустил сервис GPU on-premises.Что это такое? Компания будет устанавливать серверы с GPU необходимые для обучения и инференса искусственного интеллекта в периметре предприятий.Посмотрел, как это работает: • Специалисты помогают компании определить нужную ей конфигурацию серверов с GPU - можно взять готовую: доступно 7 видов карт и более 20 готовых конфигураций, можно собрать индивидуально под себя • Серверы разворачивают на площадке компании или дата-центре MWS Cloud. Кстати, их можно и купить, и арендовать • Установка и поддержка на всех этапах - на MWS CloudПолезная история для компаний, которым требуется развертывание вычислительных мощностей с графическими усилителями в закры…

1 week, 6 days назад @ t.me
Знаете кому AI не помогает?Всем кто раньше топил за low/no code. Ведь там все завязано у вендора на кликанье мышкой в приятном интерфейсе. Особенно разные BI инструменты или ETL инструменты. Сейчас можно быстрей сделать dashboard в Streamlit или Plotly, че
Знаете кому AI не помогает?Всем кто раньше топил за low/no code. Ведь там все завязано у вендора на кликанье мышкой в приятном интерфейсе. Особенно разные BI инструменты или ETL инструменты. Сейчас можно быстрей сделать dashboard в Streamlit или Plotly, че

Знаете кому AI не помогает?Всем кто раньше топил за low/no code. Ведь там все завязано у вендора на кликанье мышкой в приятном интерфейсе. Особенно разные BI инструменты или ETL инструменты. Сейчас можно быстрей сделать dashboard в Streamlit или Plotly, чем такой же в Tableau или Sigma BI. Я не имею ввиду произведение искусства в Tableau. Я про обычные полезные дашбордики с bar/line charts или быстрые ad-hoc визуализации.Даже в Looker нет удобной интеграции и нужно либо копировать руками LookML или в VSCode менять код без возможности валидации. У меня есть пример одного инструмента, кто отлично смог встроить AI в свой процесс - это Matillion ETL. Это такой low-code инструмент, у которого вс…

1 week, 6 days назад @ t.me
Как у вас дела с Kubernetes? Kubernetes (K8s) — это система для автоматического управления контейнерами с приложениями. Представь её как "дирижёра оркестра" для твоих программ.С ним можно построить любое решение - сам продукт, сервис или аналитическое реше
Как у вас дела с Kubernetes? Kubernetes (K8s) — это система для автоматического управления контейнерами с приложениями. Представь её как "дирижёра оркестра" для твоих программ.С ним можно построить любое решение - сам продукт, сервис или аналитическое реше Как у вас дела с Kubernetes? Kubernetes (K8s) — это система для автоматического управления контейнерами с приложениями. Представь её как "дирижёра оркестра" для твоих программ.С ним можно построить любое решение - сам продукт, сервис или аналитическое реше

Как у вас дела с Kubernetes? Kubernetes (K8s) — это система для автоматического управления контейнерами с приложениями. Представь её как "дирижёра оркестра" для твоих программ.С ним можно построить любое решение - сам продукт, сервис или аналитическое решение в облаке или on-premise.Очевидно использовать managed версию в AWS/Azure/GCP легче, чем разворачивать все с нуля на своем железе.Для DevOps k8s это один из главных скилов. Эксперты без работы не останутся, особенно если нет альтернативы в виде публичного облака.Claude мне выдал альтернативы:Легковесные альтернативы- Docker Swarm - встроенная оркестрация Docker, проще в настройке и использовании- K3s - облегченная версия Kubernetes от R…

2 weeks назад @ t.me
Из всего многообразия новых AI штук, моя любимая это MCP для тестирования данных и поиска ошибок.
Из всего многообразия новых AI штук, моя любимая это MCP для тестирования данных и поиска ошибок. Из всего многообразия новых AI штук, моя любимая это MCP для тестирования данных и поиска ошибок.

Из всего многообразия новых AI штук, моя любимая это MCP для тестирования данных и поиска ошибок.

2 weeks, 1 day назад @ t.me
Left Join Left Join
последний пост 2 days назад
Уже подвели итоги года с ChatGPT?Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer
Уже подвели итоги года с ChatGPT?Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer Уже подвели итоги года с ChatGPT?Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer

Уже подвели итоги года с ChatGPT?Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer ☝🏻Чтобы увидеть свои итоги, просто заходите на chatgpt.com, и он сам предложит их посмотреть.А если отправить ему эмодзи 🎁, то он даже сгенерирует поздравительное видео и выдаст подарок. Виртуальный, конечно, но возможно, более душевный, чем то, что положат коллеги под елочку на «Тайного Санту». А что у вас в итогах? Делитесь в комментариях.

2 days назад @ t.me
Под капотом управляемой базы данных в MWS Cloud PlatformBuilding the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-ба
Под капотом управляемой базы данных в MWS Cloud PlatformBuilding the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-ба Под капотом управляемой базы данных в MWS Cloud PlatformBuilding the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-ба

Под капотом управляемой базы данных в MWS Cloud PlatformBuilding the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-базы данных: архитектура, работа агентов, механизмы реконсиляции и требования к безопасности. А также покажет, что именно должен учитывать инженер при разработке и поддержке managed-решений, чтобы они оставались надёжными и безопасными.📅 Эфир — 25 декабря, 14:00 (МСК)🎁 Среди участников — розыгрыш мерча MWS за лучший вопрос👉 Регистрация по ссылке

3 days, 1 hour назад @ t.me
Давно у нас пятничных мемов не было. Возвращаем традицию? 👀
Давно у нас пятничных мемов не было. Возвращаем традицию? 👀 Давно у нас пятничных мемов не было. Возвращаем традицию? 👀

Давно у нас пятничных мемов не было. Возвращаем традицию? 👀

5 days, 22 hours назад @ t.me
GitHub меняет ценовую политикуСначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на
GitHub меняет ценовую политикуСначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на

GitHub меняет ценовую политикуСначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на его серверах (надо платить за каждую минуты работы), или собственные, которые пользователь хостит у себя (за них пока не надо платить, но это скоро изменится). 🔵С 1 января 2026 года стоимость использования раннеров, которые хостятся GitHub’ом, снизится до 39% в зависимости от типа машины, на которой они запускаются.🔵С 1 марта 2026 года будет введена плата $0,002/мин за использование self-hosted раннеров в приватных репозиториях. Взыматься …

1 week, 1 day назад @ t.me
Строим витрину данных с Claude через MCPMCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как
Строим витрину данных с Claude через MCPMCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как Строим витрину данных с Claude через MCPMCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как

Строим витрину данных с Claude через MCPMCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как начать с ними работу. В новой статье переходим к практике и показываем, как с помощью Claude создать витрину данных на реальном проекте и с реальными данными. Весь процесс показан по шагам — от старта работы до конечного результата.Маленький спойлер: не обошлось без сложностей и ошибок, но в итоге даже с учетом правок ИИ справился с задачей в разы быстрее, чем человек.🔜 Читать!

1 week, 2 days назад @ t.me
Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.Да, действительно, и, если вам нужно мониторить изменения в неболь
Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.Да, действительно, и, если вам нужно мониторить изменения в неболь

Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.Да, действительно, и, если вам нужно мониторить изменения в небольшой, не слишком часто обновляющейся таблице, то это отличный вариант. Но дело в том, что все уведомления NOTIFY падают в одну очередь, и если таких уведомлений много, то они затормозят работу всей БД.Кроме того, их размер ограничен 8000 байтов, чего может быть недостаточно. А еще, если сервис-получатель был по какой-то причине не доступен и сообщение не дошло, повторное через NOTIFY не отправляется — то есть данные просто потеряются. В обще…

1 week, 5 days назад @ t.me
Интернет опять против ИИ-рекламы?Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную
Интернет опять против ИИ-рекламы?Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную

Интернет опять против ИИ-рекламы?Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную с помощью ИИ.Герои ролика попадали во всевозможные ужасные ситуации — кто-то упал на льду, а кто-то с крыши, у кого-то кот снес елку и так далее. Все эти душераздирающие события разворачивались под задорную песенку, смысл которой сводился к тому, что праздники — ужасное, стрессовое время и лучше их пересидеть в уютном Макдаке. 💬 Мы говорим о видео в прошедшем времени, потому что с Youtube-канала компании его уже убрали после ужасного фидбе…

2 weeks, 1 day назад @ t.me
Какие работы на самом деле отнял ИИ? Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет. В выборку попали 180 млн вакансий из разных сфер с 2023 п
Какие работы на самом деле отнял ИИ? Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет. В выборку попали 180 млн вакансий из разных сфер с 2023 п

Какие работы на самом деле отнял ИИ? Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет. В выборку попали 180 млн вакансий из разных сфер с 2023 по 2025 годы. Автор изучил, как изменилось общее число вакансий (упало на 8%, между прочим), а затем посмотрел на динамику по отдельным должностям и индустриям.🔵Очевидно, что лучше всего дела у ML-инженеров — у них число открытых вакансий c 2024 по 2025 выросло на 39%. 🔵Хуже всего дела у дизайнеров, копирайтеров и фотографов — число вакансий для них упало на 27-32%. Но только для специалистов, а для креативных директоров и продюсеров предло…

2 weeks, 2 days назад @ t.me
TigerBeetle на практике, или чем хороши узкоспециализрованные тулыВы когда-нибудь работали с TigerBeetle?Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая
TigerBeetle на практике, или чем хороши узкоспециализрованные тулыВы когда-нибудь работали с TigerBeetle?Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая

TigerBeetle на практике, или чем хороши узкоспециализрованные тулыВы когда-нибудь работали с TigerBeetle?Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая специализация накладывает ограничения на то, в каких проектах можно использовать TigerBeetle и как вообще с ней работать.В частности, TigerBeetle заставляет оперировать такими бухгалтерскими понятиями, как дебит, кредит, счета, переводы, и при этом дебит строго не может превышать кредит. И это не просто рекомендация, это на уровне архитектуры БД прописано.Как это работает на деле?Вот хороший пример — разработка сервиса по продаже билетов и…

2 weeks, 6 days назад @ t.me
No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими рукамиДаже если вы понятия не имеете, как это делается.MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объе
No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими рукамиДаже если вы понятия не имеете, как это делается.MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объе

No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими рукамиДаже если вы понятия не имеете, как это делается.MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объединять их в мультиагентные системы. И все это без знаний программирования. Взаимодействовать с ними можно через мессенджер, чат или API.🔵Собственно «сборка» проводится в визуальном конструкторе, в котором есть инструменты для подготовки данных, дообучения моделей и мониторинга качества работы.🔵Платформа поддерживает работу не только с текстом, но и с изображениями и аудио, так что на ней можно будет создать, например, ИИ-агента с голосовым…

2 weeks, 6 days назад @ t.me
Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и
Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и

Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и геймдев не исключение. Переход к Direct-to-Consumer — это признак зрелости индустрии, когда люди осознают, что у них два пути. Они могут либо взять управление процессами в свои руки, либо подстраиваться под чужие правила. 🔜 Подробнее про эту стратегию и ее плюсы читайте здесь.

3 weeks, 1 day назад @ t.me
Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и
Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и

Что такое стратегия Direct-to-Consumer...и почему не развивать ее — значит проиграть?Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и геймдев не исключение. Переход к Direct-to-Consumer — это признак зрелости индустрии, когда люди осознают, что у них два пути. Они могут либо взять управление процессами в свои руки, либо подстраиваться под чужие правила. 🔜 Подробнее про эту стратегию и ее плюсы читайте здесь.

3 weeks, 2 days назад @ t.me
Что внутри ИИ-стартапа?А внутри у него Claude или ChatGPT в 70% случаев.ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. К
Что внутри ИИ-стартапа?А внутри у него Claude или ChatGPT в 70% случаев.ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. К

Что внутри ИИ-стартапа?А внутри у него Claude или ChatGPT в 70% случаев.ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. Кроме флагманов OpenAI, появилось и множество компаний поменьше. Они предлагают интегрировать ИИ в рабочие процессы, использовать его для создания контента, написания кода, ведения и упорядочивания заметок, учебы — в общем, для всего подряд.Довольно часто в описаниях этих ИИ-продуктов можно встретить что-то про «файн-тюнинг», «проприетарные LLM» и другие интересные термины. Они как бы намекают, что компания предлагает какие-то свои собствен…

3 weeks, 3 days назад @ t.me
⏬ Привет, это Yandex for AnalyticsПредлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️🔵 Задача 1. Вспоминаем теорию вероятностей🔵 Задача 2. Теорема Байеса🔵 Задача 3. Базовая база теории игр🔵 Задача 4.
⏬ Привет, это Yandex for AnalyticsПредлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️🔵 Задача 1. Вспоминаем теорию вероятностей🔵 Задача 2. Теорема Байеса🔵 Задача 3. Базовая база теории игр🔵 Задача 4. ⏬ Привет, это Yandex for AnalyticsПредлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️🔵 Задача 1. Вспоминаем теорию вероятностей🔵 Задача 2. Теорема Байеса🔵 Задача 3. Базовая база теории игр🔵 Задача 4.

⏬ Привет, это Yandex for AnalyticsПредлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️🔵 Задача 1. Вспоминаем теорию вероятностей🔵 Задача 2. Теорема Байеса🔵 Задача 3. Базовая база теории игр🔵 Задача 4. Тренируем SQL🔵 Задача 5. Честная математическая статистика🔵 Задача 6. Что-то на бизнесовом💠 Скоро вернёмся с новыми задачами. А пока делитесь своими решениями в комментариях!Подписывайтесь: 💬 @Yandex4Analytics

3 weeks, 5 days назад @ t.me
Новое техношоу о фейлах на дата-платформахВсе упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск. «Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каж
Новое техношоу о фейлах на дата-платформахВсе упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск. «Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каж Новое техношоу о фейлах на дата-платформахВсе упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск. «Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каж

Новое техношоу о фейлах на дата-платформахВсе упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск. «Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каждому, кто работает с данными. В центре каждого эпизода — один герой и одна яркая история фейла, развернутое обсуждение архитектуры и процессов, а также немного самоиронии.Анонсы и ссылки на прямые эфиры появятся в телеграм-боте проекта. Подписывайтесь, чтобы узнавать о премьерах первыми

3 weeks, 6 days назад @ t.me
SQLite на практике SQLite на практике
последний пост 7 months, 1 week назад
fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенште
fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенште

fuzzy: Нечеткое сравнение строк в SQLiteРасширение nalgeon/fuzzy помогает сравнивать строки на похожесть и транслитерировать текст.Одни функции считают расстояние между строками (чем оно больше, тем сильнее отличаются строки):-- Расстояние Дамерау-Левенштейнаselect fuzzy_damlev('awesome', 'aewsme');-- 2-- Расстояние Хэммингаselect fuzzy_hamming('awesome', 'aewsome');-- 2-- Расстояние Джаро-Винклераselect fuzzy_jarowin('awesome', 'aewsme');-- 0.907142857142857Другие функции рассчитывают фонетический код строки (помогает определять слова, которые похоже звучат):-- Caverphoneselect fuzzy_caver('awesome');-- AWSM111111select fuzzy_caver('owesome');-- AWSM111111-- Refined soundexselect fuzzy_rso…

7 months, 1 week назад @ t.me
fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fi
fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fi

fileio: Работа с файлами в SQLiteРасширение nalgeon/fileio добавляет в SQLite возможность читать и писать файлы прямо из SQL.fileio_write записывает данные в файл:select fileio_write('hello.txt', 'hello world');fileio_read читает содержимое файла:select fileio_read('hello.txt');-- hello worldfileio_scan читает файл построчно, не загружая целиком в память:select rowid, value from fileio_scan('lines.txt');-- 1,one-- 2,two-- 3,threeКроме того, есть fileio_append (дописывает данные в файл) и функции для работы с каталогами — fileio_mkdir (создает каталог) и fileio_ls (читает содержимое каталога).Как установить расширение

7 months, 2 weeks назад @ t.me
define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined fu
define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined fu

define: Пользовательские функции в SQLiteКак известно, в SQLite нет хранимых процедур.Предполагается, что вместо них программист реализует нужные функции в своем коде (например, на Python) и зарегистрирует их в SQLite (так называемые application-defined functions).Но можно добавлять новые функции и прямо из SQL, если установить расширение nalgeon/define:-- Суммирует числа от 1 до nselect define('sumn', ':n * (:n + 1) / 2');select sumn(5);-- 15Еще пример:-- Генерит случайное число от 1 до ndefine('randint', ':a + abs(random()) % (:b - :a + 1)');select randint(10, 99);-- 67Расширение также включает функцию eval — можно динамически выполнять SQL из строки:-- Создаем и заполняем таблицуselect e…

7 months, 2 weeks назад @ t.me
crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования д
crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования д

crypto: Хеши, кодирование и декодирование в SQLiteОткрываю новую серию заметок. В каждом посте буду рассказывать об одном полезном расширении SQLite.Начнем с nalgeon/crypto. Оно предоставляет функции для расчета хешей, а также кодирования и декодирования данных.Хеши:select crypto_blake3('abc');select crypto_md5('abc');select crypto_sha1('abc');select crypto_sha256('abc'));-- и другиеКодирование/декодирование:Base32:select crypto_encode('hello', 'base32');-- NBSWY3DPselect crypto_decode('NBSWY3DP', 'base32');-- helloBase64:select crypto_encode('hello', 'base64');select crypto_decode('aGVsbG8=', 'base64');Hex:select crypto_encode('hello', 'hex');select crypto_decode('68656c6c6f', 'hex');Еще п…

7 months, 3 weeks назад @ t.me
Datalytics Datalytics
последний пост 2 часа назад
⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас
⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас ⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас

⚡️Пошаговый план: как получить оффер на аналитика в 2026 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян - эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других. Это очень полезное событие для тех кто только зашел в аналитику и для тех, кто хочет в нее зайти в ближайшее время. Особенно если вы не понимаете, какие навыки действительно важны или боитесь, что без опыта вас не возьмут на работу. Кстати тут разберут и возрастной аспект: как стать аналитиком в 30/40/50 лет и т.д.На вебинаре будет:🟠Разберем полный роадмап: что учить, в каком порядке, до какого уро…

2 часа назад @ t.me
Аналитика данных с нуля: протестируй профессию за 3 дня - мини-курс в прямом эфиреНа этом бесплатном мини‑курсе вы освоите базу для старта в аналитике, а также поймете, насколько походит вам эта профессия.За три вечера пройдёте путь от «ничего не знаю» до
Аналитика данных с нуля: протестируй профессию за 3 дня - мини-курс в прямом эфиреНа этом бесплатном мини‑курсе вы освоите базу для старта в аналитике, а также поймете, насколько походит вам эта профессия.За три вечера пройдёте путь от «ничего не знаю» до Аналитика данных с нуля: протестируй профессию за 3 дня - мини-курс в прямом эфиреНа этом бесплатном мини‑курсе вы освоите базу для старта в аналитике, а также поймете, насколько походит вам эта профессия.За три вечера пройдёте путь от «ничего не знаю» до

Аналитика данных с нуля: протестируй профессию за 3 дня - мини-курс в прямом эфиреНа этом бесплатном мини‑курсе вы освоите базу для старта в аналитике, а также поймете, насколько походит вам эта профессия.За три вечера пройдёте путь от «ничего не знаю» до первого реального аналитического кейса: поработаете с таблицами, SQL и Python, выполните практические задания и соберёте понятный отчёт по данным. Все три дня с вами в прямом эфире будет Денис Иванов, Senior Product Analyst с опытом более 5 лет в Тинькофф и других крупных компаниях, который запускал аналитические системы с нуляЧто будет на трёхдневном мини-курсе:🟠9 декабр: разберётесь, чем занимается аналитик и какие метрики помогают бизне…

2 weeks, 5 days назад @ t.me
🟢 Ищем системного аналитика, зарплата 250-300к по результатам собеседования!HR крупной IT-компании поделилась: «Мы уже полгода ищем сильного системного аналитика. Резюме приходят, но все «Ctrl+C | Ctrl+V» – UML, BPMN, работа с требованиями. А нужен челове
🟢 Ищем системного аналитика, зарплата 250-300к по результатам собеседования!HR крупной IT-компании поделилась: «Мы уже полгода ищем сильного системного аналитика. Резюме приходят, но все «Ctrl+C | Ctrl+V» – UML, BPMN, работа с требованиями. А нужен челове

🟢 Ищем системного аналитика, зарплата 250-300к по результатам собеседования!HR крупной IT-компании поделилась: «Мы уже полгода ищем сильного системного аналитика. Резюме приходят, но все «Ctrl+C | Ctrl+V» – UML, BPMN, работа с требованиями. А нужен человек, который понимает, как спроектировать интеграцию между 15 микросервисами так, чтобы система не рухнула. И ведь приходят не новички» Чувствуете, да? Рынок ищет одних специалистов, а резюме подают совсем другие. Пока аналитики изучают диаграммы Use Case, компании отчаянно ищут тех, кто разбирается в современной архитектуре. И готовы платить за это 200-300к.Но таких системных аналитиков единицы, и за ними сейчас охотятся так, как когда-то бе…

3 weeks назад @ t.me
А ты знаешь, что Газпромбанк.Тех раз в год собирает всех бизнес-аналитиков на своей площадке для обмена опытом? 🚀Записывай в календарь - 08 декабря в 17:30 пройдет Business Analysis Day. Тема этого года — ИИ-помощники для бизнес-аналитика 🤖В программе:✔️ П
А ты знаешь, что Газпромбанк.Тех раз в год собирает всех бизнес-аналитиков на своей площадке для обмена опытом? 🚀Записывай в календарь - 08 декабря в 17:30 пройдет Business Analysis Day. Тема этого года — ИИ-помощники для бизнес-аналитика 🤖В программе:✔️ П

А ты знаешь, что Газпромбанк.Тех раз в год собирает всех бизнес-аналитиков на своей площадке для обмена опытом? 🚀Записывай в календарь - 08 декабря в 17:30 пройдет Business Analysis Day. Тема этого года — ИИ-помощники для бизнес-аналитика 🤖В программе:✔️ Панельная дискуссия «ИИ помощники для бизнес-аналитика: что уже работает» с экспертами Банка России, Сбербанка и Газпромбанк.Тех✔️ Disrupt-подходы: от «работы по шаблону» к адаптивной документации✔️ Живое Демо: как ИИ в Газпромбанк.Тех работает с качественными требованиями и формирует архитектуру самостоятельно✔️ Будущее профессии: как GenAI меняет рынок трудаГде и когда 🎤Москва, офис Газпромбанка: ул. Коровий Вал, 5, БЦ «Оазис»8 декабря в …

3 weeks, 1 day назад @ t.me
Бизнесу данные нужны как воздух 📊Без анализа данных сейчас не обходится ни одна крупная компания — будь то банк, ритейл или медицина. Поэтому аналитиков ищут повсюду.Есть рекомендация, курс «Аналитика данных с МФТИ» за 10 месяцев делает из вас универсально
Бизнесу данные нужны как воздух 📊Без анализа данных сейчас не обходится ни одна крупная компания — будь то банк, ритейл или медицина. Поэтому аналитиков ищут повсюду.Есть рекомендация, курс «Аналитика данных с МФТИ» за 10 месяцев делает из вас универсально Бизнесу данные нужны как воздух 📊Без анализа данных сейчас не обходится ни одна крупная компания — будь то банк, ритейл или медицина. Поэтому аналитиков ищут повсюду.Есть рекомендация, курс «Аналитика данных с МФТИ» за 10 месяцев делает из вас универсально

Бизнесу данные нужны как воздух 📊Без анализа данных сейчас не обходится ни одна крупная компания — будь то банк, ритейл или медицина. Поэтому аналитиков ищут повсюду.Есть рекомендация, курс «Аналитика данных с МФТИ» за 10 месяцев делает из вас универсального специалиста. Научитесь работать с Python, применять методы ИИ и управляться с базами данных. С таким набором навыков можете выбрать любое из трёх направлений:• Аналитика данных • Data Science • Инженерия данныхВ конце получите 2 диплома от МФТИ и Нетологии. Центр развития карьеры поможет с резюме, портфолио и поиском работы.🎁 Предновогодний бонус: покупаете один курс в декабре — получаете шесть в подарок.Записывайтесь и прокачивайтесь в…

3 weeks, 3 days назад @ t.me
🚀 Ребята из ИнженеркаТех специально для канала Datalytics дарят эксклюзивный промокод DATA, который дает -15% к скидкам на все курсы дополнительно до конца октября!Сейчас самое время, чтобы прокачать свои навыки и освоить новый стек.Симулятор Data Warehous
🚀 Ребята из ИнженеркаТех специально для канала Datalytics дарят эксклюзивный промокод DATA, который дает -15% к скидкам на все курсы дополнительно до конца октября!Сейчас самое время, чтобы прокачать свои навыки и освоить новый стек.Симулятор Data Warehous 🚀 Ребята из ИнженеркаТех специально для канала Datalytics дарят эксклюзивный промокод DATA, который дает -15% к скидкам на все курсы дополнительно до конца октября!Сейчас самое время, чтобы прокачать свои навыки и освоить новый стек.Симулятор Data Warehous

🚀 Ребята из ИнженеркаТех специально для канала Datalytics дарят эксклюзивный промокод DATA, который дает -15% к скидкам на все курсы дополнительно до конца октября!Сейчас самое время, чтобы прокачать свои навыки и освоить новый стек.Симулятор Data Warehouse на базе dbt. Научитесь работать с dbt Core и освоите DataOps практики, каталог данных и data lineage. Решай реальные задачи в интерактивном тренажере → Начать в демо-доступе💚 Кстати, они перевели всю документацию dbt на русский язык! Теперь она доступна бесплатно для всех: https://docs.getdbt.tech/Тренажер Python и SQL для ML и Data Science Pandas, NumPy, работа с данными для ML/DS. Все — от загрузки до анализа. Навыки для ML-инженеров и…

4 weeks назад @ t.me
Как посчитать эффект от рекламы на ТВ или проверить эффективность нового алгоритма продвижения объявлений на платформе?В первом случае мы не можем честно разбить людей 50 на 50 и одним показывать ТВ-рекламу, а другим — нет. Во втором тестовый алгоритм выте
Как посчитать эффект от рекламы на ТВ или проверить эффективность нового алгоритма продвижения объявлений на платформе?В первом случае мы не можем честно разбить людей 50 на 50 и одним показывать ТВ-рекламу, а другим — нет. Во втором тестовый алгоритм выте Как посчитать эффект от рекламы на ТВ или проверить эффективность нового алгоритма продвижения объявлений на платформе?В первом случае мы не можем честно разбить людей 50 на 50 и одним показывать ТВ-рекламу, а другим — нет. Во втором тестовый алгоритм выте

Как посчитать эффект от рекламы на ТВ или проверить эффективность нового алгоритма продвижения объявлений на платформе?В первом случае мы не можем честно разбить людей 50 на 50 и одним показывать ТВ-рекламу, а другим — нет. Во втором тестовый алгоритм вытесняет старый из выдачи: продавцы из контроля перестают пользоваться своим продвижением из-за сетевых эффектов. Чтобы обойти подобные проблемы в тестировании, мы в Авито используем региональные тесты. А чтобы рассказать, как именно это делать, мы записали новый выпуск «Диванной аналитики» с Мишей Пирожковым, аналитиком из команды маркетинга. Из видео вы узнаете:➡️ Как работают региональные тесты и как устроен наш текущий инструмент для анал…

1 month назад @ t.me
Хотите работать там, где от решений зависят миллионы?Мошенничество — это сложные схемы, продуманные алгоритмы, десятки подставных транзакций и тысячи строк логов.Антифрод-аналитики ловят мошенников до того, как те доберутся до денег.Кто такой антифрод-анал
Хотите работать там, где от решений зависят миллионы?Мошенничество — это сложные схемы, продуманные алгоритмы, десятки подставных транзакций и тысячи строк логов.Антифрод-аналитики ловят мошенников до того, как те доберутся до денег.Кто такой антифрод-анал Хотите работать там, где от решений зависят миллионы?Мошенничество — это сложные схемы, продуманные алгоритмы, десятки подставных транзакций и тысячи строк логов.Антифрод-аналитики ловят мошенников до того, как те доберутся до денег.Кто такой антифрод-анал

Хотите работать там, где от решений зависят миллионы?Мошенничество — это сложные схемы, продуманные алгоритмы, десятки подставных транзакций и тысячи строк логов.Антифрод-аналитики ловят мошенников до того, как те доберутся до денег.Кто такой антифрод-аналитик?Это специалист, который анализирует финансовые операции, выявляет подозрительные паттерны и выстраивает защиту бизнеса от потерь.Где нужны такие специалисты?🟧в банках и финтех-компаниях🟧на e-commerce-платформах🟧в страховых и онлайн-сервисах.Средняя зарплата по рынку — от 130 000 ₽, и спрос растёт ежегодно.Рынку не хватает специалистов, умеющих работать с реальными данными и антифрод-системами.Ждем вас на первом потоке курса «Антифрод-…

1 month назад @ t.me
Продуктовые аналитики — профессиональные детективы 🔎 Докажите это, разгадав тайну «уснувших» покупателей. Проведите собственное расследование с решением квиза и продуктового кейса. За самые быстрые и точные результаты детективы получат призы от Lamoda.Как
Продуктовые аналитики — профессиональные детективы 🔎 Докажите это, разгадав тайну «уснувших» покупателей. Проведите собственное расследование с решением квиза и продуктового кейса. За самые быстрые и точные результаты детективы получат призы от Lamoda.Как Продуктовые аналитики — профессиональные детективы 🔎 Докажите это, разгадав тайну «уснувших» покупателей. Проведите собственное расследование с решением квиза и продуктового кейса. За самые быстрые и точные результаты детективы получат призы от Lamoda.Как

Продуктовые аналитики — профессиональные детективы 🔎 Докажите это, разгадав тайну «уснувших» покупателей. Проведите собственное расследование с решением квиза и продуктового кейса. За самые быстрые и точные результаты детективы получат призы от Lamoda.Как принять участие:1. Пройдите квиз и предложите решение продуктового кейса2. Примите участие до 18 декабря. Результаты всех финалистов попадут в общий лидерборд, поэтому делитесь ссылкой с коллегами-аналитиками, чтобы повысить градус соревновательности! 3. Дождитесь публикации поста с результатами в канале Lamoda TechВремя пошло! Детали и задания ждут вас на сайте.Реклама. ООО «Ламода Тех». ИНН 7734461512. erid:2W5zFJXDRw6

1 month назад @ t.me
❓ NLP для Data Scientists: получайте навыки, которые помогают решать реальные задачи с текстами.🔥 Мы подготовили для вас 3 бесплатных вебинара курса «NLP / Natural Language Processing», где вы узнаете всё необходимое для работы с текстами и моделями.🔸 Веби
❓ NLP для Data Scientists: получайте навыки, которые помогают решать реальные задачи с текстами.🔥 Мы подготовили для вас 3 бесплатных вебинара курса «NLP / Natural Language Processing», где вы узнаете всё необходимое для работы с текстами и моделями.🔸 Веби

❓ NLP для Data Scientists: получайте навыки, которые помогают решать реальные задачи с текстами.🔥 Мы подготовили для вас 3 бесплатных вебинара курса «NLP / Natural Language Processing», где вы узнаете всё необходимое для работы с текстами и моделями.🔸 Вебинар №1: Анатомия нейросетей: от трансформеров к современным архитектурам 👨‍🏫 Спикер: Андрей Носов - AI Architect, Raft⏰ 24 ноября, 20:00 МСКНа этом занятии вы узнаете: • Из чего состоят современные нейросети — внимание, эмбеддинги, нормализация и другие ключевые механизмы. • Почему трансформеры стали стандартом в NLP и какие идеи приходят им на смену. • Как применять эти принципы в задачах генерации, классификации и анализа текста.🔸 Вебина…

1 month назад @ t.me
«Круги Громова» представили новое исследование российского рынка ETL 2025Как компании сегодня решают задачу импортозамещения в области интеграции данных? Какие отечественные ETL-решения уже готовы заменить западные продукты — и даже превзойти их?В новом ис
«Круги Громова» представили новое исследование российского рынка ETL 2025Как компании сегодня решают задачу импортозамещения в области интеграции данных? Какие отечественные ETL-решения уже готовы заменить западные продукты — и даже превзойти их?В новом ис «Круги Громова» представили новое исследование российского рынка ETL 2025Как компании сегодня решают задачу импортозамещения в области интеграции данных? Какие отечественные ETL-решения уже готовы заменить западные продукты — и даже превзойти их?В новом ис

«Круги Громова» представили новое исследование российского рынка ETL 2025Как компании сегодня решают задачу импортозамещения в области интеграции данных? Какие отечественные ETL-решения уже готовы заменить западные продукты — и даже превзойти их?В новом исследовании «ETL Круг Громова 2025»:🔹 Сравнение российских ETL-платформ с Apache Airflow и NiFi.🔹 Подробный анализ функциональности и производительности отечественных решений, включая Modus ETL, Dat. ax, Loginom, PolyAnalyst, DATAREON Platform, Luxms Data Boring и другие.🔹 Ключевые тренды 2025 года: ELT, Reverse ETL, CDC, Streaming, ZeroETL, AI-автоматизация.🔹 Более 200 критериев оценки ETL-решений для корпоративного сектора — от архитектур…

1 month назад @ t.me
Как мы в Авито управляем трафиком маркетинговых коммуникацийЕжедневно Авито запускает более 900 маркетинговых CRM-кампаний и ежемесячно отправляет более 5 миллиардов коммуникаций. Чтобы повысить эффективность рассылок, аналитики стремятся улучшать покрытие
Как мы в Авито управляем трафиком маркетинговых коммуникацийЕжедневно Авито запускает более 900 маркетинговых CRM-кампаний и ежемесячно отправляет более 5 миллиардов коммуникаций. Чтобы повысить эффективность рассылок, аналитики стремятся улучшать покрытие Как мы в Авито управляем трафиком маркетинговых коммуникацийЕжедневно Авито запускает более 900 маркетинговых CRM-кампаний и ежемесячно отправляет более 5 миллиардов коммуникаций. Чтобы повысить эффективность рассылок, аналитики стремятся улучшать покрытие

Как мы в Авито управляем трафиком маркетинговых коммуникацийЕжедневно Авито запускает более 900 маркетинговых CRM-кампаний и ежемесячно отправляет более 5 миллиардов коммуникаций. Чтобы повысить эффективность рассылок, аналитики стремятся улучшать покрытие пользователей, не спамить им и, главное, отправлять релевантные сообщения.Чтобы выполнить эти задачи, Авито анализирует поведение аудитории. Это огромный массив данных и разнородных факторов, поэтому мы используем ML в алгоритмах отправок.Хотим поделиться этим опытом, для чего записали ещё один выпуск «Диванной аналитики» с Арменом Есаяном, старшим аналитиком в CRM. Армен подробно разбирает, как машинное обучение помогает добиться максима…

1 month назад @ t.me
Как за 15 минут сделать бизнес-описание всей базы данных и BI-отчетности с помощью ИИ 🤖Когда документация устаревает, аналитика перестает работать. Метаданные разбросаны, отчеты описываются вручную, а поиск нужной таблицы превращается в квест.📆 25 ноября в
Как за 15 минут сделать бизнес-описание всей базы данных и BI-отчетности с помощью ИИ 🤖Когда документация устаревает, аналитика перестает работать. Метаданные разбросаны, отчеты описываются вручную, а поиск нужной таблицы превращается в квест.📆 25 ноября в Как за 15 минут сделать бизнес-описание всей базы данных и BI-отчетности с помощью ИИ 🤖Когда документация устаревает, аналитика перестает работать. Метаданные разбросаны, отчеты описываются вручную, а поиск нужной таблицы превращается в квест.📆 25 ноября в

Как за 15 минут сделать бизнес-описание всей базы данных и BI-отчетности с помощью ИИ 🤖Когда документация устаревает, аналитика перестает работать. Метаданные разбросаны, отчеты описываются вручную, а поиск нужной таблицы превращается в квест.📆 25 ноября в 11:00 (МСК) приглашаем на бесплатный онлайн-вебинар с Павлом Хамриным (Lasmart).Разберем:— почему документация по данным всегда отстает от реальности;— как AI помогает описывать таблицы, отчеты и процедуры за минуты;— как «научить» модель понимать корпоративные термины;— как DataDesc автоматизирует документацию и интегрируется с data-catalog.👨‍💻 Кому будет полезно: data-инженерам, аналитикам, архитекторам DWH, BI-руководителям — и всем, к…

1 month назад @ t.me
⚡️Пошаговый план: как получить оффер на аналитика в 2025 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас
⚡️Пошаговый план: как получить оффер на аналитика в 2025 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас ⚡️Пошаговый план: как получить оффер на аналитика в 2025 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также рас

⚡️Пошаговый план: как получить оффер на аналитика в 2025 году?Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет все важные аспекты в работе аналитика, а также расскажет как получить оффер быстрее других.Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?На вебинаре разберём:🟠Разберем полный роадмап: что учить, в каком порядке, до какого уровня;🟠Структура хорошего портфолио с примерами;🟠Что говорят реальные наниматели — какие у ни…

1 month, 1 week назад @ t.me
avito.tech.conf, первая конфа от AvitoTech для менеджеров и лидов — как это было? ☄️Предлагаем проверить самим! Смотрим видео выше и обязательно переходим на плейлист с записями докладов:📺 Youtube🔵 VK ВидеоПочему важно послушать доклады, если не успели под
avito.tech.conf, первая конфа от AvitoTech для менеджеров и лидов — как это было? ☄️Предлагаем проверить самим! Смотрим видео выше и обязательно переходим на плейлист с записями докладов:📺 Youtube🔵 VK ВидеоПочему важно послушать доклады, если не успели под

avito.tech.conf, первая конфа от AvitoTech для менеджеров и лидов — как это было? ☄️Предлагаем проверить самим! Смотрим видео выше и обязательно переходим на плейлист с записями докладов:📺 Youtube🔵 VK ВидеоПочему важно послушать доклады, если не успели подключиться онлайн или прийти оффлайн? Во время них участники успели обсудить огромный спектр важных в индустрии тем: от внедрения в разработку и управления AI и LLM до барьеров, которые мешают инженерам вырасти в менеджера. И, на секундочку, ивент от ребят собрал 1000+ лидов, менеджеров и C-level. А в онлайне к трансляции подключилось 10 000+ человек. Поздравляем коллег и открываем плейлист 💻

1 month, 2 weeks назад @ t.me
Труба данных Труба данных
последний пост 1 day назад
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту
https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько ту

https://www.youtube.com/watch?v=rmvDxxNubIgВ личку принесли еще один прекрасный, небольшой доклад про Context Engineering.Из забавного - почти ко всем советам, про которые говорится в докладе, дошел и стал применять самостоятельно, видимо я не настолько туп 😁@ohmydataengineer - канал "Труба данных" про всякое в мире работы с данным

1 day назад @ t.me
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив
Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике крив

Хотя про AI-агентов сейчас пишут буквально из каждого утюга, в этой статье мне особенно зацепился один момент — визуализация зависимости качества ответов LLM от длины контекста. Интуитивно мы все чувствуем, что «чем больше — тем лучше», но на практике кривая выглядит иначе: после определённого порога контекст начинает не помогать, а мешать. Сигнал тонет в шуме, модель теряет фокус, а качество решений деградирует. Забрал эту картинку себе в копилку как хорошее напоминание.Из этого логично вытекает важный тезис: формулировка задачи вторична, первична политика контекста. Не «как красиво спросить», а что именно и в каком объёме сейчас действительно нужно модели. Принцип «минимум, достаточный дл…

2 days, 2 hours назад @ t.me
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr
https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andr

https://karpathy.bearblog.dev/year-in-review-2025Andrej Karpathy (ну тот, который был главнюком за AI в Tesla и не только) подвел отличные и оч лаконичные итоги года.Еще мне на прошлой неделе удалось посмотреть два интересных интервью и один докладик- Andrej Karpathy — “We’re summoning ghosts, not building animals” - https://www.youtube.com/watch?v=lXUZvyajciY- Ilya Sutskever – "We're moving from the age of scaling to the age of research"- https://www.youtube.com/watch?v=aR20FWCCjAs- Andrej Karpathy: Software Is Changing (Again) - https://www.youtube.com/watch?v=LCEmiRjPEtQИ нет, это не х2 скорость, это он так в реальности говорит 😃@ohmydataengineer - канал "Труба данных" про всякое в мире …

3 days, 1 hour назад @ t.me
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer
Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

Новые поглощения и покупки: IBM покупает Confluent (не путать с Confluence 😆, это которые Kafka)https://www.reuters.com/technology/ibm-nears-roughly-11-billion-deal-confluent-wsj-reports-2025-12-08/@ohmydataengineer

2 weeks, 3 days назад @ t.me
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL
Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL

Показываем аудитории молодые open-source проекты. Мне не жалко, вдруг кому-то будет интересно.🔐 Postgresus - self-hosted инструмент для резервного копирования и мониторинга PostgreSQL базы данных🔥 Возможности:- создание бекапов по расписанию для PostgreSQL 13-18;- уведомления в Telegram, Slack, Discord, если бекап сломался или база недоступна;- хранение бекапов локально, в S3 или Google Drive;- health check базы данных раз в минуту;- Apache 2.0 лицензия (полностью открытый);Запуск через Docker:docker run -d --name postgresus -p 4005:4005 -v ./postgresus-data:/postgresus-data --restart unless-stopped rostislavdugin/postgresus:latest📌 GitHub

2 weeks, 5 days назад @ t.me
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by
MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by

MiniO все.This project is currently under maintenance and is not accepting new changes. • The codebase is in a maintenance-only state • No new features, enhancements, or pull requests will be accepted • Critical security fixes may be evaluated on a case-by-case basis • Existing issues and pull requests will not be actively reviewed • Community support continues on a best-effort basis through Slackhttps://github.com/minio/minio@ohmydataengineer

3 weeks назад @ t.me
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни
https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из ни

https://bfcm.shopify.comУ Shopify в этом году на Βlack Friday было 45kk сообщений в Кафку в секунду...(скриншот, конечно, сегодняшний, а не пятничный, но сам вебсайт оч классный с техническими метриками)А сколько там пасхалок на этом сайте... 😃 (одна из них что он жрет гигабайт оперативки)@ohmydataengineer

3 weeks, 5 days назад @ t.me
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.
Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это. Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

Российские ETL решения....Я даж не знаю, смеяться или плакать..🙈Специально оставлю вам ссылку с картинки https://russianbi.ru/ - чтобы вы сами посмотрели на это.

1 month назад @ t.me
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer
https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

https://github.com/toon-format/toonЕсли у вас есть какие-либо автоматизации с использованием LLM и вы в них кидаетесь данными, то вот тут ребята собрали небольшой оптимизатор структур, позволяющий экономить на токенах.@ohmydataengineer

1 month, 1 week назад @ t.me
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени
https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решени

https://topicpartition.io/blog/postgres-pubsub-queue-benchmarksПрекрасная статья о том, что момент, когда вам в большинстве случаев, перестанет хватать Posgres на самом деле очень и очень далек.И как Pub/Sub решение, и как Redis решение, и Data Lake решение. Циферки, метрики, замеры внутри, все как вы любите 😃P.S. Конечно же, никто не говорит о том, что Kafka надо заменять на Postgres. The claim isn’t that Postgres is functionally equivalent to any of these specialized systems. The claim is that it handles 80%+ of their use cases with 20% of the development effort.Но поздно, стервятники уже налетели...https://www.morling.dev/blog/you-dont-need-kafka-just-use-postgres-considered-harmful/@ohm…

1 month, 2 weeks назад @ t.me
IYKYK 😆@ohmydataengineer
IYKYK 😆@ohmydataengineer IYKYK 😆@ohmydataengineer

IYKYK 😆@ohmydataengineer

1 month, 2 weeks назад @ t.me
https://clickhouse.com/blog/librechat-open-source-agentic-data-stackТут CH купил (поглотил, заполучил) еще ребят. Из забавного - opensource ребят 😂Вот этих https://www.librechat.ai@ohmydataengineer
https://clickhouse.com/blog/librechat-open-source-agentic-data-stackТут CH купил (поглотил, заполучил) еще ребят. Из забавного - opensource ребят 😂Вот этих https://www.librechat.ai@ohmydataengineer

https://clickhouse.com/blog/librechat-open-source-agentic-data-stackТут CH купил (поглотил, заполучил) еще ребят. Из забавного - opensource ребят 😂Вот этих https://www.librechat.ai@ohmydataengineer

1 month, 2 weeks назад @ t.me
На днях в open source выпустили распределённую файловую систему, которая рассчитана на эксабайты (тысячи петабайт).Сделали это чуваки из XTX, мощные трейдеры, которые известны двумя вещами: тем, что у них (по крайней мере недавно) был топ-3 кластер по коли
На днях в open source выпустили распределённую файловую систему, которая рассчитана на эксабайты (тысячи петабайт).Сделали это чуваки из XTX, мощные трейдеры, которые известны двумя вещами: тем, что у них (по крайней мере недавно) был топ-3 кластер по коли

На днях в open source выпустили распределённую файловую систему, которая рассчитана на эксабайты (тысячи петабайт).Сделали это чуваки из XTX, мощные трейдеры, которые известны двумя вещами: тем, что у них (по крайней мере недавно) был топ-3 кластер по количеству ГПУ, и тем, что их основатель, Александр Герко, так любит Лондон, что каждый год платит 500+ млн фунтов налогов на доходы как физическое лицо.Из интересного (они выделили 9 пунктов, но только 5 мне кажутся отличительными)Has no single point of failure in its metadata services.Is hardware agnostic and uses TCP/IP to communicate.Utilizes different types of storage (such as flash vs. hard disks) cost effectively.Exposes read/write acce…

2 months назад @ t.me
Python 3.14 уже здесь!Пару часов назад вышел финальный релиз новой версии Python 3.14. Это, пожалуй, один из самых мощных релизов на моей памяти. Новая версия несёт в себе ряд крутых фич, а именно:- полная поддержка Free-threaded Python- T-strings, спорная
Python 3.14 уже здесь!Пару часов назад вышел финальный релиз новой версии Python 3.14. Это, пожалуй, один из самых мощных релизов на моей памяти. Новая версия несёт в себе ряд крутых фич, а именно:- полная поддержка Free-threaded Python- T-strings, спорная

Python 3.14 уже здесь!Пару часов назад вышел финальный релиз новой версии Python 3.14. Это, пожалуй, один из самых мощных релизов на моей памяти. Новая версия несёт в себе ряд крутых фич, а именно:- полная поддержка Free-threaded Python- T-strings, спорная фича, но на мой взгляд удобно иметь в стандартной библиотеке (синтаксис знакомых нам f-strings)- zstd внутри стандартной либы, один из самых эффективных алгоритмов сжатия данных- поддержка multiple interpreters из коробки- uuid 6-8, на 40% быстрееИ многое другое, полный список изменений ловите по ссылке: https://pythoninsider.blogspot.com/2025/10/python-3140-final-is-here.html

2 months, 2 weeks назад @ t.me
Очередная движуха для тех, кто живёт аналитикой. Коллеги и друзья из NEWHR снова собирают рынок — кого, где, за сколько и зачем нанимают. Всё по классике: зарплаты, новые задачи, как и где работают, кто топит за культуру.В этот раз цепляют и бизнес/системн
Очередная движуха для тех, кто живёт аналитикой. Коллеги и друзья из NEWHR снова собирают рынок — кого, где, за сколько и зачем нанимают. Всё по классике: зарплаты, новые задачи, как и где работают, кто топит за культуру.В этот раз цепляют и бизнес/системн

Очередная движуха для тех, кто живёт аналитикой. Коллеги и друзья из NEWHR снова собирают рынок — кого, где, за сколько и зачем нанимают. Всё по классике: зарплаты, новые задачи, как и где работают, кто топит за культуру.В этот раз цепляют и бизнес/системных аналитиков, и даже начальников.⏳ 20 минут на опрос — и потом инсайты, стрим и вся вкусная инфа (полный разбор ждём в 2026, а промежуточное — сразу по ходу).Чем больше залетит народу — тем точнее картина, поэтому и делюсь ссылкойP.S. Да, ждать результат надо, но стоит того — предыдущие выпуски были полезнымиСсылка на последнее 2024 Как принять участие в исследовании?⏩ Заполните 20-мин опросник⏪

2 months, 2 weeks назад @ t.me
enthusiastech enthusiastech
последний пост None
data будни data будни
последний пост 2 weeks, 2 days назад
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви
🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и ви

🤓 Martin Fowler в гостях Pragmatic Engineerhttps://youtu.be/CQmI4XKTa0UМартину уже за 60 лет, из которых он 40 с лишним считает себя инженером; когда опыт исчисляется десятками, то накапливается тот уровень насмотренности, когда можно сравнивать эпохи и видеть глобальные тенденции⌘⌘⌘по своему масштабу Мартин сравнивает нынешний скачок с переходом программистов с ассемблера на языки более высокого уровнясам Мартин не имеет ничего против вайбкодинга как такового (тут он понимает «вайбкодинга» именно как безоглядное принятие любого результата ллм-ки без глубокого осознания написанного), однако чётко ограничивает зону его возможностей: небольшие проекты, прототипы на выброс и т.д.главный недост…

2 weeks, 2 days назад @ t.me
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи
🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддержи

🎧 Data Platform T-Bankпослушал подкаст с СТО платформы данных Т-Банкаhttps://t.me/book_cube/3766для понимания масштаба → 15К MAU пользователей платформы (при условных 18К всех сотрудниках инхаус — это довольно большое проникновение)→ всю платформу поддерживает ~230 человек→ сторадж — около 15–20 петабайт;→ компьют — порядка 100К ядер→ внутри ~20 тысяч объектов основная аналитическая СУБД — Greenplum: около 10 кластеров от 30 до 72 нод в каждомпроблемы с текущей архитектурой⌘ Greenplum имеет ограничение на количество параллельных запросов, которые он может обработать эффективно; считается, что это около ста запросов.⌘ система требует постоянного мониторинга и ручного управления распределение…

2 months, 2 weeks назад @ t.me
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024
а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024 а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

а освежить в голове результаты опроса 2024 можно тутhttps://newhr.org/data/research-analysts-2024

2 months, 2 weeks назад @ t.me
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут
NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

NewHR в очередной — уже шестой! — раз проводит опрос про работу аналитиковя бы тоже прошёл, но я, к сожалению, я не аналитикесли тоже любите читать результаты таких исследований, можно инвестировать 20 минут в опросновый опрос за 2025 год тут

2 months, 2 weeks назад @ t.me
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез
🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тез

🐤 джуны, LLM и Shopifyв интернетах есть тезис, что с внедрением LLM джуны будут не нужны: мол, llm-агент сам как крайне усердный и очень производительный джун → и тогда со временем всю базовую джуновскую работу будут делать llm-агенты⌘⌘⌘противоположный тезис высказывает Farhan Thawar, Head of Engineering в Shopify (всё время читаю как Spotify, приходится себя одёргивать и перепроверять)Shopify среди меня известен своим мега-крутым фаундером — Tobias Lütke; слушал его в Lenny's Podcast — создаёт впечатление очень здравого и продвинутого человекакроме того, про него неоднократно упоминал Lex Fridman, что даёт ещё сколько-то очков этому джентельмену и культуре в его компании⌘⌘⌘ещё добавляет ве…

3 months назад @ t.me
🎧 Podcasts
Data Engineering Podcast Data Engineering Podcast
последний пост None
Data Brew by Databricks
последний пост 4 months, 3 weeks назад
Reinforcement Fine-Tuning and the Future of Specialized AI Models
Reinforcement Fine-Tuning and the Future of Specialized AI Models Reinforcement Fine-Tuning and the Future of Specialized AI Models

What if building a custom AI model for your business was as simple as giving feedback—no massive labeled datasets required? In this episode, we sit down with Travis Addair, CTO and Co-Founder of Predibase, creators of the first reinforcement fine-tuning platform, to explore the future of specialized AI. Discover how reinforcement fine-tuning is revolutionizing model customization, enabling you to start fast, adapt to your unique data, and keep improving through human feedback. Whether you’re ...

4 months, 3 weeks назад @ buzzsprout.com
Benchmarking Domain Intelligence | |E45
Benchmarking Domain Intelligence | |E45 Benchmarking Domain Intelligence | |E45

In this episode, Pallavi Koppol, Research Scientist at Databricks, explores the importance of domain-specific intelligence in large language models (LLMs). She discusses how enterprises need models tailored to their unique jargon, data, and tasks rather than relying solely on general benchmarks. Highlights include: - Why benchmarking LLMs for domain-specific tasks is critical for enterprise AI. - An introduction to the Databricks Intelligence Benchmarking Suite (DIBS). - Evaluating models on...

8 months назад @ buzzsprout.com
SWE-bench & SWE-agent | |E44
SWE-bench & SWE-agent | |E44 SWE-bench & SWE-agent | |E44

In this episode, Kilian Lieret, Research Software Engineer, and Carlos Jimenez, Computer Science PhD Candidate at Princeton University, discuss SWE-bench and SWE-agent, two groundbreaking tools for evaluating and enhancing AI in software engineering. Highlights include: - SWE-bench: A benchmark for assessing AI models on real-world coding tasks. - Addressing data leakage concerns in GitHub-sourced benchmarks. - SWE-agent: An AI-driven system for navigating and solving coding challenges. - Ov...

8 months, 1 week назад @ buzzsprout.com
Enterprise AI: Research to Product | |E43
Enterprise AI: Research to Product | |E43 Enterprise AI: Research to Product | |E43

In this episode, Dipendra Kumar, Staff Research Scientist, and Alnur Ali, Staff Software Engineer at Databricks, discuss the challenges of applying AI in enterprise environments and the tools being developed to bridge the gap between research and real-world deployment. Highlights include: - The challenges of real-world AI—messy data, security, and scalability. - Why enterprises need high-accuracy, fine-tuned models over generic AI APIs. - How QuickFix learns from user edits to improve AI-dri...

8 months, 2 weeks назад @ buzzsprout.com
Multimodal AI | |E42
Multimodal AI | |E42 Multimodal AI | |E42

In this episode, Chang She, CEO and Co-founder of LanceDB, discusses the challenges of handling multimodal data and how LanceDB provides a cutting-edge solution. He shares his journey from contributing to Pandas to building a database optimized for images, video, vectors, and subtitles. Highlights include: - The limitations of traditional storage systems like Parquet for multimodal AI. - How LanceDB enables efficient querying and processing of diverse data types. - The growing importance of ...

8 months, 3 weeks назад @ buzzsprout.com
Age of Agents | |E41
Age of Agents | |E41 Age of Agents | |E41

In this episode, Michele Catasta, President of Replit, explores how AI-driven agents are transforming software development by making coding more accessible and automating application creation. Highlights include: - The difference between AI agents and copilots in software development. - How AI is democratizing coding, enabling non-programmers to build applications. - Challenges in AI agent development, including error handling and software quality. - The growing role of AI in entrepreneurshi...

9 months назад @ buzzsprout.com
Reward Models | |E40
Reward Models | |E40 Reward Models | |E40

In this episode, Brandon Cui, Research Scientist at MosaicML and Databricks, dives into cutting-edge advancements in AI model optimization, focusing on Reward Models and Reinforcement Learning from Human Feedback (RLHF). Highlights include: - How synthetic data and RLHF enable fine-tuning models to generate preferred outcomes. - Techniques like Policy Proximal Optimization (PPO) and Direct Preference Optimization (DPO) for enhancing response quality. - The role of reward models in improving ...

9 months, 1 week назад @ buzzsprout.com
«Ничего такого» by Dodo Enginnering
последний пост None
Запуск завтра Podcast Запуск завтра Podcast
последний пост 1 week, 6 days назад
Почему всем так нужны видеокарты от NVIDIA
Почему всем так нужны видеокарты от NVIDIA

OpenAI, Anthropic, Google, Meta и другие игроки на рынке искусственного интеллекта каждый год делают ставку на увеличение своих моделей и закупают сотни тысяч графических процессоров, которые производит компания NVIDIA. Как NVIDIA стала главным поставщиком железа для целой индустрии и почему никто пока не смог ее догнать? Разбираемся вместе с бывшим ведущим архитектором AI-решений в NVIDIA Денисом Тимониным.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdwsuEP 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Другие эпизоды подкаста про производство процессоров:Выпуск с инженером из Intel https://pc.st/e/2fNCK2Yhh-TВыпуск про литографию с инженеркой из ASML https://pc.st/e/4…

1 week, 6 days назад @ share.transistor.fm
Суперфоркастинг. Как делать точные прогнозы на будущее
Суперфоркастинг. Как делать точные прогнозы на будущее

Михаил Ягудин — математик, соосновавший группу самых точных форкастеров в мире. Вместе с коллегами Миша предсказывает выборы, войны, пандемии и другие события, способные повлиять на жизни миллионов людей. Самат расспросил Мишу, как устроена работа суперфоркастеров, помогают ли предсказательные навыки в личных целях и какие прогнозы эксперты делают по искусственному интеллекту. Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjcr9Pfd 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Группа «Самоцветы» https://samotsvety.org/Рассылка Нуньо Семпере https://blog.sentinel-team.org/Потренировать предсказания https://sage-future.org/Репорт AI 2027 от сооснователя Самоцветов https://ai…

2 weeks, 6 days назад @ share.transistor.fm
Цифровая хрупкость. Как сохранить важное в сети
Цифровая хрупкость. Как сохранить важное в сети

Возможно, вы помните фразу: «Всё, что попало в интернет, остаётся там навсегда». Оказывается, это не совсем правда. Мы уже потеряли огромную часть интернета и культурного наследия. Почему что-то может пропасть из сети? Как архивируются данные? И кто решает, что нужно сохранить, а что нет? Самат Галимов говорит с исследовательницей интернета Полиной Колозариди и кинокритиком Сергеем Сычёвым.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Чёрная Пятница в Либо/Либо с 24 ноября по 1 декабря!Подписка «Либо/Либо+ Telegram» в телеграме со скидкой https://cutt.ly/zap25bfeptg Подписка «Либо/Либо+ Apple Podcasts» со скидкой http…

4 weeks назад @ share.transistor.fm
Ваш робоводитель прибыл. Как устроено беспилотное такси
Ваш робоводитель прибыл. Как устроено беспилотное такси

Калифорнийская компания Waymo делает сервис роботакси в разных городах США. Мы позвали инженера оттуда, чтобы разобраться, как научить машину принимать решения и подготовить ее к непредсказуемости на дорогах. В этом эпизоде обсуждаем, как миллиарды миль тестовых заездов, сложные симуляции и каскадеры приближают нас к автономному вождению.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdhbXiw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке ЛибоЛибо+ в Apple Podcasts https://cutt.ly/zap0225epap и в закрытом телеграм-канале Либо/Либо https://cutt.ly/zap0225eptg Подписаться только на «Запус…

1 month назад @ share.transistor.fm
Как делать технологии доступными
Как делать технологии доступными

Без гаджетов и интернета невозможно представить современную жизнь. Но как ими пользуются люди с нарушениями зрения, слуха или, например, моторики? Можно ли спроектировать систему, которая подойдет всем? О чем надо подумать разработчикам, чтобы не отрезать часть пользователей от цифрового мира? Вместе с Валерией Курмак обсуждаем, как делать технологии доступными.Видео программиста с ДЦП Вани Бакаидова https://t.me/bakaidov/1296Канал Яндекса @yandex_inclusionКанал Леры @neiskluchenieРеклама. Рекламодатель ООО "Яндекс". erid: 2SDnjeMi1Aw 12+Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/Слушайте бонусные эпизоды «Запуск++», а еще другие бонусы студии «Либо/Либо» по подписке Либо…

1 month, 1 week назад @ share.transistor.fm
Как пользоваться нейросетями
Как пользоваться нейросетями

Прямо сейчас корпорации вкладывают сотни миллиардов долларов в развитие искусственного интеллекта, государства договариваются о сотрудничествах, а профессионалы боятся, что их заменят. Совершенно точно происходит что-то большое, но не каждый понимает, как это влияет конкретно на его жизнь. В этом выпуске Самат Галимов разбирается, чем искусственный интеллект полезен в повседневной жизни, как его внедрить и стоит ли это делать. Гость выпуска — Денис Ширяев — один из самых активных пользователей ChatGPT в мире.Как настроить ChatGPT? Инструкция от Дениса: https://github.com/DenisSergeevitch/chatgpt-custom-instructionsРекомендации телеграм-каналов про ИИ от Дениса:Denis Sexy IT https://t.me/den…

1 month, 2 weeks назад @ share.transistor.fm
Что нового в робототехнике?
Что нового в робототехнике?

С развитием нейросетей роботы стали умнеть в разы быстрее. Если раньше их действия нужно было чётко программировать, то сейчас они умеют самостоятельно складывать вещи после стирки, прокладывать лучшие маршруты до нужных объектов, точно определять вес и форму предмета, который нужно взять, и аккуратно его подхватывать. Какую проблему робототехники смог решить искусственный интеллект? Кто совершает главные прорывы на рынке? И как новые роботы могут повлиять на наш быт, работу, перемещение и даже здоровье? Говорим с Сергеем Никулиным из венчурного фонда Grishin Robotics.Кого читать в LinkedIn, если следишь за робототехникой? Рекомендации Сергея:https://www.linkedin.com/company/grishinrobotics…

1 month, 3 weeks назад @ share.transistor.fm
Крипта в три клика. Как работает кошелек в Телеграме
Крипта в три клика. Как работает кошелек в Телеграме

До сих пор не разобрались в крипте? Возможно, этот эпизод для вас. Уже несколько лет покупать, продавать и обменивать крипту можно прямо в Телеграме. Официальный криптокошелек Wallet обещает, что совершать транзакции в нем так же просто, как отправлять сообщения. Больше никаких бирж и непонятных терминов? Можно ли перевести деньги маме? Кто над этим работает? А что с безопасностью? Отвечает на вопросы руководитель core-команды Кошелька Алексей Шерченков.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjdvtLoh 12+Специальная акция с 13 октября по 3 ноября – скидка на три месяца для тарифов «Основной» и «Минимальный» – 20%. Подключай Яндекс 360 по ссылке https://360.yandex.ru/business/tariffСлу…

2 months назад @ share.transistor.fm
ИИ-психотерапия. Как машина может помочь людям разобраться в себе
ИИ-психотерапия. Как машина может помочь людям разобраться в себе

Психотерапия доступна не всем, а вопросы, с которыми хочется разобраться, есть почти у каждого. Можно ли решить свои трудности с машиной и не идти к психотерапевту? В чем целебность терапии и можно ли тут обойтись без живого человека? Как поставить ИИ на службу терапевтам? В этом эпизоде Самат пытается разобраться, как ИИ проникает в терапию и что это меняет для клиентов и специалистов, а помогает ему в этом психотерапевтка Катя Кронгауз.Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjepJgX9 12+Подключай Яндекс360 и работай с командой без проблем https://360.yandex.ru/business/tariffНаписать Кате в телеграме: @ekronhausРекомендация от Кати: Psychoanalytic Perspectives on Migration and Exile…

2 months, 1 week назад @ share.transistor.fm
Кто такие ИИ-инфлюенсеры и зачем их создают
Кто такие ИИ-инфлюенсеры и зачем их создают

У Аны есть блог с 260 тысячами подписчиков. В нём — красивая жизнь на берегу Адриатического моря, завтраки и ужины в дорогих ресторанах, постоянные путешествия. Ещё один факт об Ане: её на самом деле не существует. Ану сгенерировал искусственный интеллект. Как создают ИИ-персонажей? Кто пользуется этой технологией и как на ней можно заработать? Как отличить профиль настоящего человека от сгенерированного нейросетью? Самат Галимов говорит со специалистом по искусственному интеллекту Артёмом Родичевым. Реклама. Рекламодатель ООО "Яндекс". erid: 2SDnjepJgX9 12+Специальная акция с 13 октября по 3 ноября – скидка на три месяца для тарифов «Основной» и «Минимальный» – 20%. Подключай Яндекс 360 по…

2 months, 2 weeks назад @ share.transistor.fm
Опрос слушателей по итогам 12 сезона
Опрос слушателей по итогам 12 сезона

Недавно мы закончили уже 12-й сезон «Запуска завтра», и, как обычно, хотим узнать, что вы думаете о нем и о подкасте в целом — что вам нравится, что не нравится и какие эпизоды вы бы хотели услышать в новом сезоне. Мы сделали небольшой опрос и просим вас его пройти, это займет 5-7 минут и поможет сделать подкаст еще лучше. Проходите опрос по ссылке: https://form.typeform.com/to/ACkYIF0TСпасибо вам и до встречи в новом сезоне!

6 months, 3 weeks назад @ share.transistor.fm
Космос. Как стартапы вышли на орбиту
Космос. Как стартапы вышли на орбиту Космос. Как стартапы вышли на орбиту

Частные ракеты, выводящие в космос тысячи спутников, многоразовые корабли, журналисты и звезды голливуда на орбите Земли… Космическая индустрия последние десятилетия развивается так стремительно, что не за всеми ее прорывами успеваешь следить. Многие из этих достижений стали возможны благодаря частным компаниям, ворвавшимся в космическое пространство. В эпизоде разбираемся, как в космос пришло стартап-мышление и к чему это приводит.Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT-инфраструктуре Selectel: https://slc.tl/rolvv?erid=2SDnjf2MjAd ***Разработка сайтов и мобильных приложений от Самата: https://…

7 months назад @ share.transistor.fm
Роботы. Чему мы смогли их научить за последние 100 лет
Роботы. Чему мы смогли их научить за последние 100 лет Роботы. Чему мы смогли их научить за последние 100 лет

Железная рука, собирающая новое авто на конвейере; андроид, сортирующий коробки на складе; дружелюбный экран для общения и даже секс-кукла под управлением ChatGPT — все это достижения робототехники. Когда-то роботы были железными, неповоротливыми и подчинялись алгоритмам. Сегодня мы хотим сделать их гибкими, мягкими и эмпатичными. В этом выпуске наблюдаем, как эволюционировали роботы — от игрушек-автоматонов 18 века до умных машин на пути к координации, ощущениям, выражению эмоций и другим человеческим качествам. ***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Кейс с RPA-платформой и с тысячами одновременно работающих голосовых роботов: https://slc.tl/0c7d0 Selectel — база для развития любого совр…

7 months, 1 week назад @ share.transistor.fm
Искусственный интеллект. Могут ли машины мыслить как люди?
Искусственный интеллект. Могут ли машины мыслить как люди? Искусственный интеллект. Могут ли машины мыслить как люди?

Умение играть в шахматы, доказывать теоремы, видеть образы на картинах и самим их создавать, писать тексты и общаться на естественном языке - долгое время мы считали, что так умеет только человек благодаря интеллекту. Однако, сегодня нейросети и языковые модели тоже умеют все это, но о разумности машин речи по-прежнему не идет. Тогда что такое искусственный интеллект, если не набор умений, похожих на человеческие? В этом выпуске разбираемся, как инженеры и философы больше века пытаются создать мыслящую машину и каждый раз добиваются лишь имитации разума.***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT…

7 months, 3 weeks назад @ share.transistor.fm
Электромобили. Что мешает электродвигателям изменить мир
Электромобили. Что мешает электродвигателям изменить мир Электромобили. Что мешает электродвигателям изменить мир

В начале прошлого века электроавтомобили конкурировали с бензиновыми на равных, но затем почти сошли со сцены. Все из-за врожденных проблем электродвигателя, над которыми инженеры бьются больше столетия. В этом выпуске разбираемся, какой путь прошли электроавто, как это связано с прогрессом технологии аккумуляторов, какую революцию совершила корпорация Tesla и почему даже ей не удалось посадить нас всех на электрические автомобили.***Реклама. АО «СЕЛЕКТЕЛ» ИНН 7810962785,Selectel — база для развития любого современного бизнеса. Создавайте и масштабируйте проекты на IT-инфраструктуре Selectel: https://slc.tl/y9vpu?erid=2SDnjeZjvkd***Слушайте бонусные эпизоды «Запуска завтра» и других подкаст…

8 months назад @ share.transistor.fm
Moscow Python Podcast Moscow Python Podcast
последний пост 2 weeks, 2 days назад
Новости мира Python за ноябрь 2025
Новости мира Python за ноябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

2 weeks, 2 days назад @ learnpython.podbean.com
Новый фреймворк задач, безопасность и почему всё ещё нет Async
Новый фреймворк задач, безопасность и почему всё ещё нет Async

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

Ведущие – Григорий Петров и Михаил Корнеев Эфир с Дмитрием про карьеру — https://t.me/geekfactor_devs/16

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

2 weeks, 2 days назад @ learnpython.podbean.com
Релиз 3.14 и другие новости мира Python за октябрь 2025
Релиз 3.14 и другие новости мира Python за октябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

1 month, 1 week назад @ learnpython.podbean.com
Почему Python выбирают для масштабирования
Почему Python выбирают для масштабирования

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf Курс «Основы Python» от Learn Python — это отличный старт для новичков в программировании. За несколько уроков вы освоите ба…

1 month, 2 weeks назад @ learnpython.podbean.com
Новости мира Python за сентябрь 2025
Новости мира Python за сентябрь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: Full Python support in Wasmer Edge (Beta)

Unlocking Performance in Python's Free-Threaded Future: GC Optimizations Scaling asyncio on Free-Threaded Python Pydantic Ai 1.0 released

PEP 806 – Mixed sync/async context managers with precise async marking Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https:/…

2 months, 2 weeks назад @ learnpython.podbean.com
Отвечаем на вопросы с Никитой Соболевым
Отвечаем на вопросы с Никитой Соболевым

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF

В этом выпуске отвечаем на вопросы зрителей вместе с Никитой Соболевым и задаем свои Ведущие – Григорий Петров и Михаил Корнеев Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

Курс «Основы Python» от Learn Python — …

3 months назад @ learnpython.podbean.com
Новости мира Python за август 2025
Новости мира Python за август 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: документальный фильм о Python;

StackOverflow Developer Survey;

Python Developer Survey;

Чего ждать от Django 6?;

Astral запускают первый коммерческий продукт. Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал M…

3 months, 2 weeks назад @ learnpython.podbean.com
Новости мира Python за июль 2025
Новости мира Python за июль 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuShF Ведущие – Григорий Петров и Михаил Корнеев Новости выпуска: 20 лет Django;

Python 3.14 rc1;

Reflections on 2 years of CPython’s JIT Compiler: The good, the bad, the ugly;

PEP 792 – Project status markers in the simple index;

PyPi и inbox.ru. Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/ch…

3 months, 2 weeks назад @ learnpython.podbean.com
No GIL / JIT оптимизации в Python / Скейлинг через Kafka
No GIL / JIT оптимизации в Python / Скейлинг через Kafka

Чтобы углубить знания в Python записывайтесь на продвинутый курс Learn Python — https://clck.ru/3MxaHi Ведущие – Григорий Петров и Михаил Корнеев

Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced Канал Миши в Telegram — https://t.me/tricky_python Канал Moscow Python в Telegram — https://t.me/moscow_python Все выпуски — https://podcast.python.ru Митапы Moscow Python — https://moscowpython.ru Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf

Курс «Практики программирования» от Learn Python поможет углубить знания и прокачать написание кода. Подробности: https://clck.ru/3MxaHi

5 months, 3 weeks назад @ learnpython.podbean.com
Новости Python за июнь 2025
Новости Python за июнь 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MuSmw Новости выпуска: State of Free Threading Python (FTP) — https://pyfound.blogspot.com/2025/06/python-language-summit-2025-state-of-free-threaded-python.html Проблемы честной Concurrency — https://pyfound.blogspot.com/2025/06/python-language-summit-2025-fearless-concurrency.html Как дела у Python на мобилке — https://pyfound.blogspot.com/2025/06/python-language-summit-2025-python-on-mobile.html Python can run Mojo now — https://koaning.io/posts/giving-mojo-a-spin/

Заменит ли AI джунов? — https://blog.adarshd.dev/posts/pycon-us-ai-and-future-of-programming/ …

5 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за мая 2025
Новости мира Python за мая 2025

Чтобы научиться программировать и разбираться в тонкостях Python 3.12 записывайтесь на базовый курс Learn Python — https://clck.ru/3MWZEX Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: Microsoft дропнула спонсорскую поддержку Faster CPython project и уволила большую часть команды — https://discuss.python.org/t/community-stewardship-of-faster-cpython/92153/10;

Python 3.14 Beta — https://pythoninsider.blogspot.com/2025/05/python-3140-beta-1-is-here.html;

The first year of free-threaded Python — https://labs.quansight.org/blog/free-threaded-one-year-recap;

Тайпчекеры — https://engineering.fb.com/2025/05/15/developer-tools/introducing-pyrefly-a-new-type-checker-and-ide-experience-f…

6 months, 2 weeks назад @ learnpython.podbean.com
Day Special: dependency injection в Python
Day Special: dependency injection в Python

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm

Ведущие – Григорий Петров и Никита Соболев Ссылки выпуска: Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/ Канал Moscow Python в VK — https://vk.com/moscowpythonconf

7 months, 2 weeks назад @ learnpython.podbean.com
Day Special: асинхронность
Day Special: асинхронность

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Никита Соболев

Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

7 months, 3 weeks назад @ learnpython.podbean.com
Новости мира Python за апрель 2025
Новости мира Python за апрель 2025

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Михаил Корнеев

Новости выпуска: В Python закончили затаскивать криптографию из HACL* — https://jonathan.protzenko.fr/2025/04/18/python.html

Релиз Pydantic v2.11 — https://pydantic.dev/articles/pydantic-v2-11-release

Dependency groups и экспериментальная поддержка pylock.toml в pip — https://ichard26.github.io/blog/2025/04/whats-new-in-pip-25.1/ Приняли PEP 768 – Safe external debugger interface for CPython — https://peps.python.org/pep-0768/

Приняли PEP 750 – Template Strings — https://peps.python.org/pep-0750/ Отклонили PEP 736 – Shorthand syntax for keyword arguments at invocation — https://peps.pyt…

7 months, 3 weeks назад @ learnpython.podbean.com
Day Special: типизация в Python или mypy, Any и дженерики под микроскопом
Day Special: типизация в Python или mypy, Any и дженерики под микроскопом

Python Day на Positive Hack Days 2025 — https://clck.ru/3KW4fm Ведущие – Григорий Петров и Денис Аникин Ссылки выпуска:

Курс Learn Python — https://learn.python.ru/advanced

Канал Миши в Telegram — https://t.me/tricky_python

Канал Moscow Python в Telegram — https://t.me/moscow_python

Все выпуски — https://podcast.python.ru

Митапы Moscow Python — https://moscowpython.ru

Канал Moscow Python на Rutube — https://rutube.ru/channel/45885590/

Канал Moscow Python в VK — https://vk.com/moscowpythonconf

8 months назад @ learnpython.podbean.com
Podlodka Podcast Podlodka Podcast
последний пост 2 days назад
Podlodka #456 – Софт для авто
Podlodka #456 – Софт для авто Podlodka #456 – Софт для авто

Почему софт в автомобиле, который стоит миллионы, часто уступает по качеству и скорости телефону за 50 тысяч и как на это влияет война экосистем? Погружаемся в анатомию современного автомобильного софта вместе с Денисом Неклюдовым — тимлидом команды Android Automotive OS в Google. В выпуске разбираемся, почему автопроизводители вроде General Motors объявляют войну Apple CarPlay; заглядываем ПОД КАПОТ и обнаруживаем, что в машине часто работает не одна, а сразу две операционки; эмпатируем разработчикам приложений под авто, которые страдают из-за большой фрагментации и жестких гайдлайнов по безопасности. И, конечно, говорим о будущем: как AI и LLM превратят машину в "третье жилое пространство…

2 days назад @ soundcloud.com
Podlodka #455 – Онбординг пользователей
Podlodka #455 – Онбординг пользователей Podlodka #455 – Онбординг пользователей

Онбординг часто воспринимают как набор экранов в начале продукта, хотя на самом деле это один из самых сильных продуктовых инструментов, который напрямую влияет на активацию, удержание и LTV. В этом выпуске разбираем, зачем нужен онбординг, как он работает в B2C и B2B, почему интерактив почти всегда выигрывает у статичных экранов, как персонализация и локализация меняют конверсию, и почему хороший онбординг не спасёт плохой продукт, но плохой способен испортить даже отличный. Говорим про реальные кейсы, метрики, A/B-тесты, friction, empty states и ошибки, которые команды продолжают повторять. Партнёр команды Podlodka — наши давние друзья @AvitoTech. Это команда с крутыми процессами, культур…

1 week, 2 days назад @ soundcloud.com
Podlodka #454 – SWE-агенты
Podlodka #454 – SWE-агенты Podlodka #454 – SWE-агенты

Уже понятно, что будущее ИИ не в умении правильно отвечать на пользовательские хитрые вопросы, а в способности автономно решать многоступенчатые и сложные задачи. Вместе с Семёном Карасиком из Nebius в этом выпуске мы выясняем, что отличает агента от обычного ChatGPT, и как сделать своего цифрового джуна! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Катя Петрова

2 weeks, 1 day назад @ soundcloud.com
Podlodka #453 – Рынки предсказаний
Podlodka #453 – Рынки предсказаний Podlodka #453 – Рынки предсказаний

Что такое рынки предсказаний, и почему они удивительно точно предсказывают будущее? Обсуждаем, как работает механизм вероятностной цены, зачем рынкам нужны реальные деньги, как они справляются (или не справляются) с инсайдерской торговлей и манипуляциями. В гости к нам пришел Никита Поваров, который сейчас руководит командой аналитики в JetBrains и почти два года развивает корпоративный рынок предсказаний внутри компании. Так что не обошли стороной феномен корпоративных рынков предсказаний и разобрались, можно ли использовать их как инструмент для A/B-тестов и сколько участников нужно для хорошего прогноза. Обратите внимание на секцию полезных ссылок. Сегодняшний гость приложил внушительный…

3 weeks, 1 day назад @ soundcloud.com
Podlodka #452 – Архитектура LLM-приложений
Podlodka #452 – Архитектура LLM-приложений Podlodka #452 – Архитектура LLM-приложений

Продолжаем погружение с Владиславом Танковым! С устройством LLM мы уже разобрались, а теперь пора разобраться, гонять ли инференс локально или в облаке, какие модели брать, и во что можно упереться при масштабировании своего сервиса на LLM! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Андрей Смирнов

4 weeks, 1 day назад @ soundcloud.com
Podlodka #451 – Облака для AI вычислений
Podlodka #451 – Облака для AI вычислений Podlodka #451 – Облака для AI вычислений

Казалось бы, для AI вычислений нужно просто очень-очень много GPU. Почему же тогда техногиганты, обладая почти безграничными ресурсами, не строят эту инфраструктуру сами, а платят миллиарды долларов новым, молодым компаниям? Чтобы разобраться в этом, мы позвали Александра Патрушева, Head of Product в Nebius — том самом неоклауде, который недавно заключил сделку с Microsoft почти на $20 миллиардов. В выпуске разбираемся, в чем фундаментальное отличие AI-облаков от классических, что из себя представляет карта рынка сегодня, как устроена экономика неоклаудов и что у них под капотом: какие есть особенности устройства сети, хранения данных и эксплуатации всего этого добра. Партнёр команды Podlod…

1 month назад @ soundcloud.com
Podlodka #450 – Докмед
Podlodka #450 – Докмед Podlodka #450 – Докмед

Все говорят о доказательной медицине, но мало кто может объяснить, что это вообще такое. Чем «доказательная» отличается от «научной» и «традиционной», и зачем проверять то, что «и так работает»? В этом выпуске разбираемся в том, как устроены клинические исследования: чем причинно-следственная связь отличается от корреляции, что такое клинически значимый эффект, почему «кому-то помогло» ещё не является весомым доказательством, и почему даже хорошие исследования иногда дают противоположные результаты. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podl…

1 month, 2 weeks назад @ soundcloud.com
Podlodka #449 – Криптофинансы
Podlodka #449 – Криптофинансы Podlodka #449 – Криптофинансы

В этом выпуске обсуждаем криптофинансы: зачем вообще нужен блокчейн в мире, где уже всё работает через банки и SWIFT, как устроены кастодиальные и некастодиальные кошельки, и почему крипта — это не только про спекуляции. Говорим о том, как бизнесу защититься от потери ключей, на чём зарабатывают DeFi-протоколы, чем обеспечиваются токены и почему ставки по вкладам в крипте так далеки от привычных фиатных. В гостях Александр Тоболь, технический директор Кошелька в Telegram и бывший CTO VK. Александр рассказал, как устроены криптосервисы изнутри, что происходит с ликвидностью на биржах и почему, даже если у тебя есть все технические знания, поднимать собственного валидатора чаще всего не стоит…

1 month, 3 weeks назад @ soundcloud.com
Podlodka #448 – Supply Chain Security
Podlodka #448 – Supply Chain Security Podlodka #448 – Supply Chain Security

Даже если вы пишете идеальный код, это не значит, что ваш продукт в безопасности. Уязвимости может притащить кто-то другой – начиная от open source библиотек, и заканчивая уязвимостями в компиляторах, CI и VCS системах. Как научиться защищать не только код, вышедший из под ваших рук, но и всю цепочку поставки, нам рассказал Алексей Смирнов, основатель платформы CodeScoring. Партнёр команды Podlodka — наши давние друзья @AvitoTech. Это команда с крутыми процессами, культурой здравого смысла и эксперимента. Узнать про их технологии, подходы и прокачку компетенций в командах можно по ссылкам:

— LLM против хаоса: как я автоматизировал ревизию прав доступа в админке Авито https://clc.to/RVjkQw —…

1 month, 4 weeks назад @ soundcloud.com
Podlodka #447 – Бережливое управление людьми
Podlodka #447 – Бережливое управление людьми Podlodka #447 – Бережливое управление людьми

В этом выпуске разобрались, почему важно управлять людьми бережливо, и чем бережливое управление отличается от бережного. Гость поделился, что его зацепило в теме выгорания руководителей и почему важно рассматривать это не только как личную проблему, но и как организационный сбой. Конечно же, поговорили про переработки: в каких количествах они допустимы, а в каких уже нет. Обсудили подходы к человекоцентричному управлению и, наконец, то, почему счастье сотрудников – это не просто красивый лозунг, а экономически выгодная стратегия. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в…

2 months назад @ soundcloud.com
Podlodka #446 – AI-агенты и безопасность
Podlodka #446 – AI-агенты и безопасность Podlodka #446 – AI-агенты и безопасность

В этом выпуске обсуждаем безопасность AI-агентов: как происходят атаки через tool-calling и промпт-инъекции, и какие угрозы несут недобросовестные тулы и галлюцинации моделей. Разбираемся, что такое MCP-сервера, «USB-C для LLM» и почему одна невинная команда может привести к взлому или утечке. В гостях Ильдар Исхаков – основатель компании по безопасности AI-агентов и фанат опенсорса. Ильдар рассказал о концепции «летальной триады» и о том, как сохранить баланс между функциональностью и безопасностью с помощью readonly-режимов, guardrails и паттернов вроде CAMEL. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: http…

2 months, 1 week назад @ soundcloud.com
Podlodka #445 – Векторные базы
Podlodka #445 – Векторные базы Podlodka #445 – Векторные базы

В этом выпуске разбираемся, что такое векторные базы данных – зачем они понадобились, если есть SQL и текстовый поиск, как устроены под капотом и в чём их ключевое отличие от привычных подходов. Объясняем простыми словами: как данные превращаются в векторы, как по ним происходит быстрый поиск и почему это вообще работает. В гостях Андрей Васнецов – основатель Qdrant. Вместе обсуждаем, откуда пошёл хайп, что изменилось с приходом LLM, как на практике применяются векторные базы (не только в RAG), какие есть популярные движки и встроенные решения в Postgres и ClickHouse, а также с какими подводными камнями, ограничениями и компромиссами сталкиваются команды при работе. Партнёр команды Podlodka…

2 months, 2 weeks назад @ soundcloud.com
Podlodka #444 – Архитектура LLM
Podlodka #444 – Архитектура LLM Podlodka #444 – Архитектура LLM

Берты, трансформеры, эмбеддинги, аттеншены, энкодеры с декодерами и другие страшные слова – все это разберем в выпуске с Владиславом Танковым, директором по AI в JetBrains, попутно разложив большие языковые модели на составные части. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в выпуске:

Женя Кателла, Андрей Смирнов Полезные ссылки: Illustrated Transformer

https://jalammar.github.io/illustrated-transformer/ Attention is all you need

https://arxiv.org/abs/1706.03762 Illustra…

2 months, 3 weeks назад @ soundcloud.com
Podlodka #443 – AI в продуктах
Podlodka #443 – AI в продуктах Podlodka #443 – AI в продуктах

Сегодня AI внедряют во всё: от образования и медицины до финтеха и путешествий. Но что на самом деле означает «AI-продукт» и чем он отличается от классического? Вместе с Анной Подображных разбираем полный цикл их создания: от первых прототипов и проверки гипотез ценности до бенчмарков и эвалов, помогающих измерять качество. Обсуждаем почему важно и как проверить технологическую реализуемость. Этот выпуск – практическая карта для тех, кто хочет осознанно строить AI-продукты. Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka Telegram-канал: https://t.me/podlodkanews Страница в Facebook: www.facebook.com/podlodkacast/ Twitter-аккаунт:…

3 months назад @ soundcloud.com
Podlodka #442 – Gleam
Podlodka #442 – Gleam Podlodka #442 – Gleam

Gleam ворвался в список “The Most Admired Programming Languages” сразу на второе место — 70% разработчиков, которые писали на нём, хотят продолжать его использовать. Зачем в 2025 году нужен ещё один язык программирования, за что энтузиасты любят его, и есть ли шанс у “Elixir для хипстеров” на реальную популярность? Разбираем философию языка и его ключевые фичи с контрибьютером Gleam и CPython-core-разработчиком Никитой Соболевым! Также ждем вас, ваши лайки, репосты и комменты в мессенджерах и соцсетях! Telegram-чат: https://t.me/podlodka

Telegram-канал: https://t.me/podlodkanews

Страница в Facebook: www.facebook.com/podlodkacast

Twitter-аккаунт: https://twitter.com/PodcastPodlodka Ведущие в…

3 months, 1 week назад @ soundcloud.com
Проветримся! Проветримся!
последний пост 3 days, 14 hours назад
Александ Ерин: Автоматизация продаж
Александ Ерин: Автоматизация продаж

Александр Ерин создатель Linked Helper. Теорема, о которой Александр говорит в выпуске: https://drive.google.com/file/d/1ZwgEAEh319Jz3ea5uCfgRbU0z_dkskNh/view?pli=1 Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

3 days, 14 hours назад @ buzzsprout.com
Василий Королишин: спина айтишника
Василий Королишин: спина айтишника

Василий Королишин стажировался в Южной Корее и США, а сейчас входит в ряд международных ассоциаций врачей (NASS, EANS и RASS). Он является автором 20+ научных публикаций. За 15 лет практики он помог более 10 000 пациентам. Мы поговорили про то, как поддерживать здоровье спины, если вы работаете сидя. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

3 weeks назад @ buzzsprout.com
Дмитрий Волков: риски искусственного интеллетка
Дмитрий Волков: риски искусственного интеллетка

Дмитрий Волков старший исследователь в Palisade Research. Он занимается изучением рисков, связанных с искусственным интеллектом. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month назад @ buzzsprout.com
Максим Мусин: агенты пишут код
Максим Мусин: агенты пишут код

Максим Мусин основатель и СЕО частной лаборатории Rebels AI. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month, 1 week назад @ buzzsprout.com
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства
Артём Москалёв: как искусственный интеллект помогает разрабатывать лекарства

Артем Москалев исследователь, занимающийся применением искусственного интеллекта для фармакологических разработок. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

1 month, 2 weeks назад @ buzzsprout.com
Игорь Лабутин: мьюзикл про искусственный интеллект
Игорь Лабутин: мьюзикл про искусственный интеллект

Игорь Лабутин — специалист по машинному обучению, учёный, музыкант и продюсер. На фестивале Edinburgh Fringe с 11 по 16 августа 2025 пройдёт премьера его иммерсивного мюзикла AI: Save Our Souls. Сайт мьюзикла: aisaveoursouls.com Даты: 11–16 августа Место: Lime Studio at Greenside @ George Street Время: 19:45 (45 минут, без перерыва) Билеты: £12 / £9 https://www.edfringe.com/tickets/whats-on/ai-save-our-souls Instagram проекта: https://www.instagram.com/aisaveoursouls/ Indiegogo проекта h...

4 months, 3 weeks назад @ buzzsprout.com
Илья Смоленский: питание и психическое здоровье
Илья Смоленский: питание и психическое здоровье

Илья Смоленский — нейробиолог, постдок унивеситета Базеля. Илья ведёт телеграм канал Молекулярная психиатрия и подкаст Эффект наблюдателя. Книги, которые нам посоветовал Илья: Felice Jacka. Brain Changer Georgia Ede. Change Your Diet, Change Your Mind Jonh Cryan, Ted Dinan. Psychobiotic Revolution Джулия Эндерс. Очаровательный кишечник. Как самый могущественный орган управляет нами Netflix - Hack Your Health. The Secrets of Your Gut Support the show ApplePodcasts: https://apple.co/2Psx8yd ...

5 months назад @ buzzsprout.com
Юрий Машенцев: Адаптивный футбол для детей
Юрий Машенцев: Адаптивный футбол для детей

Юрий Машенцев первый партнер сети кофеен «Дринкит» и создатель футбольного клуб для адаптивных детей «Юнити». Основная цель клуба — дать возможность детям с синдромом Дауна через спорт проживать яркие эмоции — азарт, злость, радость от побед. Канал клуба в Юнити в телеграм: t.me/legionchance. Канал Юрия: t.me/billoncoffee. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months, 1 week назад @ buzzsprout.com
Антон Маскелиаде: как делать свою музыку
Антон Маскелиаде: как делать свою музыку

Антон Маскелиаде музыкант, основатель школы, автор книги "Твой первый трек" и карточек для музыканов "Твой второй трек". Школа https://maskeliade.school/ Книга https://maskeliade.school/book Карточки https://maskeliade.school/cards Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

5 months, 3 weeks назад @ buzzsprout.com
Борис Тарасов: от Маруси до Ровера
Борис Тарасов: от Маруси до Ровера

Борис Тарасов занимается промышленным дизайном в avride. Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

8 months назад @ buzzsprout.com
Книжный клуб: Диапазон
Книжный клуб: Диапазон

https://www.goodreads.com/book/show/41795733-range Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

8 months, 1 week назад @ buzzsprout.com
Анна Ривина: домашнее насилие
Анна Ривина: домашнее насилие

Анна Ривина эксперт по теме домашнего насилия и гендерной дискриминации, основательница Центра «Насилию.нет», Rivina Foundation и проекта Labirint. Поддержать русскоязычных женщин в эмиграции, которые оказались в ситуации насилия, можно здесь: https://rivina.foundation/supporteng/ Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

8 months, 3 weeks назад @ buzzsprout.com
Книжный клуб: Амстердам История Самого Либерального Города
Книжный клуб: Амстердам История Самого Либерального Города

Пытаемся перезапустить сезон и пробуем новый формат: обзор книги. https://www.goodreads.com/book/show/17288660-amsterdam Support the show ApplePodcasts: https://apple.co/2Psx8yd Я.Музыка: https://clck.ru/JJB8y Патреон: https://www.patreon.com/progulka

8 months, 3 weeks назад @ buzzsprout.com
Вы находитесь здесь Вы находитесь здесь
последний пост None
Comand Line Heroes by RedHat Comand Line Heroes by RedHat
последний пост None
Python Bytes Python Bytes
последний пост 3 days, 2 hours назад
#463 2025 is @wrapped
#463 2025 is @wrapped #463 2025 is @wrapped

Topics include Has the cost of building software just dropped 90%?, , How FOSS Won and Why It Matters, and.

3 days, 2 hours назад @ pythonbytes.fm
#462 LinkedIn Cringe
#462 LinkedIn Cringe #462 LinkedIn Cringe

Topics include , docs, PyAtlas: interactive map of the top 10,000 Python packages on PyPI., and Buckaroo.

1 week, 3 days назад @ pythonbytes.fm
#461 This episdoe has a typo
#461 This episdoe has a typo #461 This episdoe has a typo

Topics include PEP 798: Unpacking in Comprehensions, Pandas 3.0.0rc0, typos, and.

2 weeks, 2 days назад @ pythonbytes.fm
#460 Overlooked Python Typing
#460 Overlooked Python Typing #460 Overlooked Python Typing

Topics include Advent of Code, Django 6 is coming, Advanced, Overlooked Python Typing, and codespell.

3 weeks, 3 days назад @ pythonbytes.fm
#459 Inverted dependency trees
#459 Inverted dependency trees #459 Inverted dependency trees

Topics include PEP 814 – Add frozendict built-in type, Material for MkDocs Zensical, Tach, and.

1 month назад @ pythonbytes.fm
#458 I will install Linux on your computer
#458 I will install Linux on your computer #458 I will install Linux on your computer

Topics include , aiosqlitepool, deptry, and browsr.

1 month, 1 week назад @ pythonbytes.fm
#457 Tapping into HTTP
#457 Tapping into HTTP #457 Tapping into HTTP

Topics include httptap, 10 Smart Performance Hacks For Faster Python Code, FastRTC, and Explore Python dependencies with `pipdeptree` and `uv pip tree`

1 month, 2 weeks назад @ pythonbytes.fm
#456 You're so wrong
#456 You're so wrong #456 You're so wrong

Topics include The PSF has withdrawn a $1.5 million proposal to US government grant program, A Binary Serializer for Pydantic Models, T-strings: Python's Fifth String Formatting Technique?, and Cronboard.

1 month, 3 weeks назад @ pythonbytes.fm
#455 Gilded Python and Beyond
#455 Gilded Python and Beyond #455 Gilded Python and Beyond

Topics include Cyclopts: A CLI library, The future of Python web services looks GIL-free, Free-threaded GC, and Polite lazy imports for Python package maintainers.

1 month, 4 weeks назад @ pythonbytes.fm
#454 It's some form of Elvish
#454 It's some form of Elvish #454 It's some form of Elvish

Topics include djrest2 - A small and simple REST library for Django based on class-based views., Github CLI, caniscrape - Know before you scrape. Analyze any website's anti-bot protections in seconds., and 🐴 GittyUp.

2 months назад @ pythonbytes.fm
#453 Python++
#453 Python++ #453 Python++

Topics include PyPI+, uv-ship, How fast is 3.14?, and air - a new web framework built with FastAPI, Starlette, and Pydantic.

2 months, 1 week назад @ pythonbytes.fm
#452 pi py-day (or is it py pi-day?)
#452 pi py-day (or is it py pi-day?) #452 pi py-day (or is it py pi-day?)

Topics include , Free-threaded Python Library Compatibility Checker, Claude Sonnet 4.5, and Python 3.15 will get Explicit lazy imports.

2 months, 2 weeks назад @ pythonbytes.fm
#451 Databases are a Fad
#451 Databases are a Fad #451 Databases are a Fad

Topics include PostgreSQL 18 Released, Testing is better than DSA (Data Structures and Algorithms), Pyrefly in Cursor/PyCharm/VSCode/etc, and Playwright & pytest techniques that bring me joy.

2 months, 3 weeks назад @ pythonbytes.fm
#450 At-Cost Agentic IDE Tooling
#450 At-Cost Agentic IDE Tooling #450 At-Cost Agentic IDE Tooling

Topics include pandas is getting pd.col expressions, Cline, At-Cost Agentic IDE Tooling, uv cheatsheet, and Ducky Network UI.

3 months назад @ pythonbytes.fm
#449 Suggestive Trove Classifiers
#449 Suggestive Trove Classifiers #449 Suggestive Trove Classifiers

Topics include Mozilla’s Lifeline is Safe After Judge’s Google Antitrust Ruling, troml - suggests or fills in trove classifiers for your projects, pqrs: Command line tool for inspecting Parquet files, and.

3 months, 1 week назад @ pythonbytes.fm
Software Engineering Daily Software Engineering Daily
последний пост 21 минуту назад
Blender and Godot in Game Development with Simon Thommes
Blender and Godot in Game Development with Simon Thommes

Blender Studio is the creative arm of the Blender Foundation and it’s dedicated to producing films, games, and other projects that showcase the full potential of Blender. The studio functions as both an art and technology lab and pushes the boundaries of 3D animation through open productions. All of their assets, production files, and workflows

The post Blender and Godot in Game Development with Simon Thommes appeared first on Software Engineering Daily.

21 минуту назад @ softwareengineeringdaily.com
Node.js in 2026 with Rafael Gonzaga
Node.js in 2026 with Rafael Gonzaga

JavaScript has grown far beyond the browser. It now powers millions of backend systems, APIs, and cloud services through Node.js, which is one of the most widely deployed runtimes on the planet. Keeping such a critical piece of infrastructure fast, secure, and stable is a massive engineering challenge, and the work behind it is often

The post Node.js in 2026 with Rafael Gonzaga appeared first on Software Engineering Daily.

2 days назад @ softwareengineeringdaily.com
Building Games at Zachtronics with Zach Barth
Building Games at Zachtronics with Zach Barth

Zachtronics is a legendary independent game studio known for creating intricate, engineering-focused puzzle games that merge logic, creativity, and code. The studio was founded by Zach Barth in 2011, and it has become a cult favorite among programmers and tinkerers alike with titles such as SpaceChem, Infinifactory, TIS-100, and Shenzhen I/O. Most recently, Zachtronics released

The post Building Games at Zachtronics with Zach Barth appeared first on Software Engineering Daily.

1 week назад @ softwareengineeringdaily.com
Rivals of Aether with Dan Fornace
Rivals of Aether with Dan Fornace

Rivals of Aether and Rivals of Aether II are indie fighting games that combine fast-paced platform combat with elemental-themed characters. The game takes inspiration from Super Smash Bros. and emphasizes skillful movement, tight controls, and competitive balance, making it popular in the fighting game community. Dan Fornace is a game director and designer at Aether

The post Rivals of Aether with Dan Fornace appeared first on Software Engineering Daily.

1 week, 2 days назад @ softwareengineeringdaily.com
Aviation Cybersecurity with Serge Christiaans
Aviation Cybersecurity with Serge Christiaans

Aviation cybersecurity is becoming an urgent priority as modern aircraft increasingly rely on complex digital systems for navigation, communication, and engine performance. These systems were once isolated but are now interconnected and vulnerable to cyber threats ranging from GPS spoofing to ransomware attacks on airline infrastructure. As nation-state actors and criminal groups grow more sophisticated,

The post Aviation Cybersecurity with Serge Christiaans appeared first on Software Engineering Daily.

2 weeks назад @ softwareengineeringdaily.com
Blocking Software Supply Chain Attacks with Feross Aboukhadijeh
Blocking Software Supply Chain Attacks with Feross Aboukhadijeh

Modern software relies heavily on open source dependencies, often pulling in thousands of packages maintained by developers all over the world. This accelerates innovation but also creates serious supply chain risks as attackers increasingly compromise popular libraries to spread malware at scale. Feross Aboukhadijeh is the founder and CEO of Socket which is a security

The post Blocking Software Supply Chain Attacks with Feross Aboukhadijeh appeared first on Software Engineering Daily.

2 weeks, 2 days назад @ softwareengineeringdaily.com
Pydantic AI with Samuel Colvin
Pydantic AI with Samuel Colvin

Python’s popularity in data science and backend engineering has made it the default language for building AI infrastructure. However, with the rapid growth of AI applications, developers are increasingly looking for tools that combine Python’s flexibility with the rigor of production-ready systems. Pydantic began as a library for type-safe data validation in Python and has

The post Pydantic AI with Samuel Colvin appeared first on Software Engineering Daily.

3 weeks назад @ softwareengineeringdaily.com
SED News: Bezos Returns to Building, AI’s Reality Check, and Europe’s Cloud Ambitions
SED News: Bezos Returns to Building, AI’s Reality Check, and Europe’s Cloud Ambitions

SED News is a monthly podcast from Software Engineering Daily where hosts Gregor Vand and Sean Falconer unpack the biggest stories shaping software engineering, Silicon Valley, and the broader tech industry. In this episode, they cover Jeff Bezos’s unexpected return to the CEO seat with Project Prometheus, the growing debate over whether AI investments are

The post SED News: Bezos Returns to Building, AI’s Reality Check, and Europe’s Cloud Ambitions appeared first on Software Engineering Daily.

3 weeks, 2 days назад @ softwareengineeringdaily.com
Game Development on the PICO-8 with Johan Peitz
Game Development on the PICO-8 with Johan Peitz

PICO-8 is a software-based gaming console for making, sharing, and playing small games with a retro aesthetic. It emulates the look and feel of 8-bit consoles, providing limited color palettes, screen resolutions, and memory constraints. The PICO-8 dev environment uses Lua and is focused on being accessible to developers while offering depth for complex projects.

The post Game Development on the PICO-8 with Johan Peitz appeared first on Software Engineering Daily.

4 weeks назад @ softwareengineeringdaily.com
Running Doom in TypeScript with Dimitri Mitropoulos
Running Doom in TypeScript with Dimitri Mitropoulos

Doom has seemingly been ported to every electronic device imaginable, including picture frames, lamps, and coffee machines. The meme of “it runs Doom” has become so widespread that it spawned the r/itrunsdoom sub-Reddit. Recently, Doom made headlines again for being ported to TypeScript. The project involved representing Doom entirely in TypeScript, three and a half

The post Running Doom in TypeScript with Dimitri Mitropoulos appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Drone Warfare in Ukraine with Simon Shuster
Drone Warfare in Ukraine with Simon Shuster

Simon Shuster is a journalist who has reported on Russia and Ukraine for over 15 years, most of that time as a staff correspondent for TIME Magazine. He was born in Moscow, and he and his family came to the United States as refugees from the Soviet Union when he was six years old. After

The post Drone Warfare in Ukraine with Simon Shuster appeared first on Software Engineering Daily.

1 month назад @ softwareengineeringdaily.com
Radix UI with Chance Strickland
Radix UI with Chance Strickland

Radix UI is an open-source library of React components. Its “headless” primitives handle the complex logic and accessibility concerns—like dialogs, dropdowns, and tabs—while leaving styling completely up to the developer. The project emphasizes usability, accessibility, and composability and has become a vital part of modern web dev, in part because it forms the foundation of

The post Radix UI with Chance Strickland appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
The 2025 Stack Overflow Developer Survey with Jody Bailey and Erin Yepis
The 2025 Stack Overflow Developer Survey with Jody Bailey and Erin Yepis

The Stack Overflow Developer Survey is an annual survey conducted by Stack Overflow that gathers comprehensive insights from developers around the world. It offers a valuable snapshot of the global developer community, covering a wide range of topics such as preferred programming languages, tools, and technologies. Jody Bailey is the Chief Product and Technology Officer

The post The 2025 Stack Overflow Developer Survey with Jody Bailey and Erin Yepis appeared first on Software Engineering Daily.

1 month, 1 week назад @ softwareengineeringdaily.com
Building an Open-Source Laptop with Byran Huang
Building an Open-Source Laptop with Byran Huang

Byran Huang is a full stack developer who recently made headlines in the hacker space when he created the anyon_e, which is a highly integrated, open source laptop. The effort was a massive undertaking and showcased great design, hardware, and software. In this episode, Byran joins the show with Gregor Vand to talk about his

The post Building an Open-Source Laptop with Byran Huang appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
The Architecture of the Internet with Erik Seidel
The Architecture of the Internet with Erik Seidel

The modern internet is a vast web of independent networks bound together by billions of routing decisions made every second. It’s an architecture so reliable we mostly take it for granted, but behind the scenes it represents one of humanity’s greatest engineering achievements. Today’s internet is also dramatically more complex and capable than in its

The post The Architecture of the Internet with Erik Seidel appeared first on Software Engineering Daily.

1 month, 2 weeks назад @ softwareengineeringdaily.com
Habr Podcasts Habr Podcasts
последний пост None
Мысли и Методы Мысли и Методы
последний пост None
Трёп Себранта Трёп Себранта
последний пост 2 weeks, 5 days назад
По волнам моей памяти: от YACm-2016 до YACe-2025
По волнам моей памяти: от YACm-2016 до YACe-2025 По волнам моей памяти: от YACm-2016 до YACe-2025

-=Выпуск 81=- В 2016 мы впервые придумали, как красиво и доходчиво демонстрировать достижения тогдашнего генеративного ИИ: в финале маркетингового YACm Саша и Ваня исполнили песню с альбома "Нейронная оборона", написанную тогдашним ИИ. Финал образовательного YACe нынешнего, 2025-го, года прошел в оживленной дискуссии с ИИ, который помогает Леше Комиссарову вести семинары (а иногда и вовсе его замещает). Между двумя этими точками были девять очень интересных лет. Аудиозаписи нескольких событий я собрал в этот выпуск и добавил, как положено, некоторое количество собственного трепа. Некоторые полезные ссылки по теме: Предыдущий наш подкаст с Лешей YAC/m-2016 YAC/e-2025

2 weeks, 5 days назад @ sebrant.chat
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании
Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании Леша Комиссаров и его ИИ-спутники по жизни, в науке и в образовании

-=Выпуск 80=- Леша — биолог, который при этом читает в ИТМО курс “Программирование на естественном языке” — и это не хайп вокруг вайб-кодинга, а обучение новым практикам научной работы во времена ИИ. Для Леши важно общаться с окружающими его ИИ голосом, и это оказалось очень удобно для подкаста: к нашей беседе подключались его ИИ-агенты; разговор это заметно оживляло. Говорили мы про ИИ, но нынче это означает, что говорили про жизнь. Очень люблю лешино самопредставление на : Your AI Ever Surprised You? I Study Why | Building Consciousness-First Agents | Consciousness Through Dialogue | Genomics → Machine Minds

2 months, 3 weeks назад @ sebrant.chat
Непричесанные мысли (С) про ИИ летом 2025
Непричесанные мысли (С) про ИИ летом 2025 Непричесанные мысли (С) про ИИ летом 2025

-=Выпуск 79=- Прошло полгода с прошлого выпуска, и я все же вспомнил про “Трёп” и решил записать сольный выпуск; он, по сути, основан на разных лекциях, которые приходилось читать последние месяцы, на самых мне интересных темах в моем канальчике Techsparks, просто на разговорах с умными людьми. Тут и рынок труда, и образование, и роботы — все как я люблю:)

5 months, 2 weeks назад @ sebrant.chat
⌨ Coding
Martin Fowler
последний пост 1 week, 1 day назад
Fragments: December 16
Fragments: December 16 Fragments: December 16

 ❄                ❄                ❄                ❄                ❄Wondering why I’ve been making a lot of posts like this recently?

 ❄                ❄                ❄                ❄                ❄Simon Willison describes how he uses LLMs to build disposable but useful web appsThese are the characteristics I have found to be most productive in building tools of this nature: A single file: inline JavaScript and CSS in a single HTML file means the least hassle in hosting or distributing them, and crucially means you can copy and paste…

1 week, 1 day назад @ martinfowler.com
Writing Fragments
Writing Fragments Writing Fragments

These are usually a reference to something I’ve found on the web, sometimes a small thought of my own.

A few years ago, I wouldn’t have covered these topics with posts on my own site.

When I have enough notes, I post a fragments post.

I’m probably showing my age, but I’m a big fan of RSS (or in my case, strictly Atom) feeds.

Now I don’t need to - the fragments are available in my RSS feed.

1 week, 2 days назад @ martinfowler.com
Fragments Dec 11
Fragments Dec 11 Fragments Dec 11

Martin Fowler: 11 Dec 2025Why does AI write like… that (NYT, gift link).

Sam Kriss delves into the quiet hum of AI writing.

 ❄                ❄                ❄                ❄                ❄Emily Bache has written a set of Test Desiderata, building on some earlier writing from Kent Beck.

 ❄                ❄                ❄                ❄                ❄Daphe Keller explains that the EUs fines on X aren’t about free speech.

 ❄                ❄                ❄                ❄…

1 week, 6 days назад @ martinfowler.com
Fragments Dec 4
Fragments Dec 4 Fragments Dec 4

 ❄                ❄                ❄                ❄                ❄Rob’s post is typical of much of the thoughtful writing on AI.

It offers a positive harbinger for our future and opens my mind to a whole different perspective of the role of AI in it ❄                ❄                ❄                ❄                ❄Anthroopic recently announced that it disrupted a Chinese state-sponsored operation abusing Claude Code.

 ❄                ❄                ❄                ❄    …

2 weeks, 6 days назад @ martinfowler.com
Fragments Nov 19
Fragments Nov 19 Fragments Nov 19

Martin Fowler: 19 Nov 2025I’ve been on the road in Europe for the last couple of weeks, and while I was there Thoughtworks released volume 33 of our Technology Radar.

                ❄                ❄                ❄                ❄My trip to Europe started in Amsterdam, for a Thoughtworks event for a few of our clients there.

                ❄                ❄                ❄                ❄My travels also took me to Nüremberg, where I attended an internal conference for Siemens on the future of software architecture.

           …

1 month назад @ martinfowler.com
My Foreword to "Frictionless"
My Foreword to "Frictionless" My Foreword to "Frictionless"

I find most writing on software productivity to be twaddle, but Nicole and Abi are notable exceptions.

But occasionally I run into folks who study developer productivity without falling into magical thinking - such as Nicole and Abi.

They describe effective developer experience in terms of three elements: feedback loops, flow state, and cognitive load.

Focusing on developer experience is about finding what gets in the way of these three elements.

Improving developer experience leads to better outcomes for the business.

1 month назад @ martinfowler.com
The Learning Loop and LLMs
The Learning Loop and LLMs The Learning Loop and LLMs

There is a learning loop that is fundamental to our workAs we consider the nature of any work we do, it's clear that continuous learning is the engine that drives our work.

✣     ✣     ✣ There Are No Shortcuts to Learning ✣     ✣     ✣Everybody has a unique way of navigating the learning cycleThis learning cycle is unique to each person.

By offering seemingly perfect code at lightning speed, LLMs represent the ultimate version of the Maintenance Cliff: a tempting shortcut that bypasses the essential learning required to build robust, maintainable systems for the long term.

LLMs Provide a Natural-Language Interface to All the ToolsSo why so much excitement abo…

1 month, 2 weeks назад @ martinfowler.com
Fragments Nov 3
Fragments Nov 3 Fragments Nov 3

Martin Fowler: 03 Nov 2025I’m very concerned about the security dangers of LLM-enabled browsers, as it’s just too easy for them to contain the Lethal Trifecta.

                ❄                ❄                ❄                ❄Rob BowleyUnsurprisingly, there are a lot of strong opinions on AI assisted coding.

                ❄                ❄                ❄                ❄Charlie Brown and Garfield, like most comic strip characters, never changed over the decades.

was shown without a helmet, readers were so startled that they didn’t immed…

1 month, 3 weeks назад @ martinfowler.com
Agentic AI and Security
Agentic AI and Security Agentic AI and Security

Agentic AI systems present unique security challenges.

My aim was to provide an accessible, practical overview of agentic AI security issues and mitigations.

The fundamental security weakness of LLMs is described in Simon Willison's “Lethal Trifecta for AI agents” article, which I will discuss in detail below.

What do we mean by Agentic AI The terminology is in flux so terms are hard to pin down.

Mitigations So how do we lower our risk, without giving up on the power of LLM applications?

1 month, 3 weeks назад @ martinfowler.com
Fragments and Links
Fragments and Links Fragments and Links

Martin Fowler: 21 Oct 2025Mathias Verraes writes about the relationship between Domains and Bounded Contexts in Domain-Driven Design.

are truly to be harnessed, the tech industry should stop focusing so heavily on these one-size-fits-all tools and instead concentrate on narrow, specialized A.I.

One of the truly annoying things about the US tax system is that we can’t easily file our tax returns electronically.

He also explains how the creators of Direct File are working to prepare the ground for it to reappear.

Security issues are only getting worse, but the US government agency for cybersecurity is having its staff reassigned to other duties.

2 months назад @ martinfowler.com
Understanding Spec-Driven-Development: Kiro, spec-kit, and Tessl
Understanding Spec-Driven-Development: Kiro, spec-kit, and Tessl Understanding Spec-Driven-Development: Kiro, spec-kit, and Tessl

I looked at three of the tools that label themselves as SDD tools and tried to untangle what it means, as of now.

It turns out to be quite time-consuming to evaluate SDD tools and approaches in a way that gets close to real usage.

Tessl Framework(Still in private beta)Like spec-kit, the Tessl Framework is distributed as a CLI that can create all the workspace and config structure for a variety of coding assistants.

This is currently a 1:1 mapping between spec and code files, i.e.

(The Tessl team themselves see their framework as something that is more in the future than their current public product, the Tessl Registry.)

2 months, 1 week назад @ martinfowler.com
Anchoring AI to a reference application
Anchoring AI to a reference application Anchoring AI to a reference application

Service templates are a typical building block in the “golden paths” organisations build for their engineering teams, to make it easy to do the right thing.

And what’s more, if you’re creating prompts for multiple coding patterns, you want to keep them consistent with each other.

Maintaining code samples in a reference application project that you can compile and run (like a service template) makes it a lot easier to provide AI with compilable, consistent samples.

So in a second step, I wondered how we might use this approach to do a “code pattern drift detection” between the codebase and the reference application.

I tested this with a relatively simple example, I added a logger…

3 months назад @ martinfowler.com
To vibe or not to vibe
To vibe or not to vibe To vibe or not to vibe

And the more experience I get with using AI, the more honed and intuitive these assessments become.

You can also more generally consider if you’re working on a use case that needs a high level of “correctness”, or not.

This dimension leans heavily on traditional engineering skills: test coverage, system knowledge, code review practices.

Let’s take the extremes as an example to illustrate this idea:Low probability + low impact + high detectability Vibe coding is fine!

High probability + high impact + low detectability High level of review is advisable.

3 months назад @ martinfowler.com
Some thoughts on LLMs and Software Development
Some thoughts on LLMs and Software Development Some thoughts on LLMs and Software Development

                ❄                ❄                ❄                ❄I’m often asked, “what is the future of programming?” Should people consider entering software development now?

                ❄                ❄               ❇                ❄I’m also asked: “is AI a bubble”?

                ❄                ❄                ❄                ❄I retired from public speaking a couple of years ago.

                ❄                ❅

3 months, 4 weeks назад @ martinfowler.com
From Black Box to Blueprint
From Black Box to Blueprint From Black Box to Blueprint

This engagement revealed that turning a system from black box to blueprint empowers modernization decisions and accelerates migration efforts.

Yet the business logic they embody is still critical to daily operations of thousands of users.

The result is what we call a black box: a system whose outputs we can observe, but whose inner workings remain opaque.

Even with partial CDC, the insights proved valuable in linking UI behavior to underlying data changes and enriching the system blueprint.

We faced multiple challenges (API usage limit, rate limits) - We couldn't verify what LLM translation of business logic was right or wrong.

3 months, 4 weeks назад @ martinfowler.com
Антон Жиянов Антон Жиянов
последний пост 4 days, 18 hours назад
Go-фича: Обновленный go fix
Go-фича: Обновленный go fix Go-фича: Обновленный go fix

КакНовая команда go fix :usage: go fix [build flags] [-fixtool prog] [fix flags] [packages] Fix runs the Go fix tool (cmd/fix) on the named packages and applies suggested fixes.

Index ( s , " " ) if idx == - 1 { return s } return strings .

ReplaceAll ( s , " " , "" ) }// after func nospace ( s string ) string { found := strings .

found { return s } return strings .

TrimPrefix ( s , "> " ) } return s }// after func unindent ( s string ) string { if after , ok := strings .

4 days, 18 hours назад @ antonz.ru
Утечки горутин в Go 1.24+
Утечки горутин в Go 1.24+ Утечки горутин в Go 1.24+

Вы конечно и так в курсе, но на всякий случай:Утрированный пример утечки:Традиционно Go не очень-то помогал в поиске утечек.

Обнаружить их можно было разве что пристально разглядывая профиль или трассировку с продакшена, а в тестах приходилось использовать сторонний пакет goleak от Убера.

Сейчас это меняется.

Сначала в Go 1.24 добавили пакет synctest, который прекрасно справляется с поиском утечек при тестировании.

Об этом почему-то никто не говорит — наверно, потому что не проходили мой курс по многозадачности 😁

6 days назад @ antonz.ru
Go-фича: Защита секретов
Go-фича: Защита секретов Go-фича: Защита секретов

// Do invokes f.//// Do ensures that any temporary storage used by f is erased in a// timely manner.

(In this context, "f" is shorthand for the// entire call tree initiated by f.)// - Any registers used by f are erased before Do returns.

// - Any stack used by f is erased before Do returns.

// - Any heap allocation done by f is erased as soon as the garbage// collector realizes that it is no longer reachable.

As part of// that, any panic raised by f will appear as if it originates from// Do itself.

2 weeks, 2 days назад @ antonz.ru
Go-фича: Безопасная проверка ошибок
Go-фича: Безопасная проверка ошибок Go-фича: Безопасная проверка ошибок

// AsType finds the first error in err's tree that matches the type E,// and if one is found, returns that error value and true.

//// The tree consists of err itself, followed by the errors obtained by// repeatedly calling its Unwrap() error or Unwrap() []error method.

// When err wraps multiple errors, AsType examines err followed by a// depth-first traversal of its children.

//// An error err matches the type E if the type assertion err.

(E) holds,// or if the error has a method As(any) bool such that err.As(target)// returns true when target is a non-nil *E. In the latter case, the As// method is responsible for setting target.

3 weeks, 2 days назад @ antonz.ru
Курс: Знакомство с Go
Курс: Знакомство с Go Курс: Знакомство с Go

Для всех, кто уверенно программирует на другом языке и хочет попробовать Go.

3 weeks, 4 days назад @ antonz.ru
Go-фича: Метрики горутин
Go-фича: Метрики горутин Go-фича: Метрики горутин

Подробные метрики горутин от рантайма.

Метрики по состояниям горутин помогают находить типичные проблемы в продакшене.

Много горутин в состоянии not-in-go — значит, они застряли в системных вызовах или cgo.

Добавить следующие метрики в пакет runtime/metrics :Сумма значений показателей по каждому состоянию не обязательно равна общему количеству активных горутин (метрика /sched/goroutines:goroutines , доступна в Go 1.16+).

Запускаем несколько горутин и выводим метрики через 100 мс работы:

4 weeks назад @ antonz.ru
Go-фича: Dialer с контекстом
Go-фича: Dialer с контекстом Go-фича: Dialer с контекстом

Новые методы Dialer с поддержкой контекста — DialTCP , DialUDP , DialIP и DialUnix — объединяют эффективную реализацию (как в существующих Dial -функциях) с возможностью отмены (как в Dialer.DialContext ).

Он поддерживает отмену и может использоваться для подключения по любому из поддерживаемых протоколов:func ( d * Dialer ) DialContext ( ctx context .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

Context , network string , laddr , raddr netip .

1 month, 1 week назад @ antonz.ru
Go-фича: Сравнение IP-подсетей
Go-фича: Сравнение IP-подсетей Go-фича: Сравнение IP-подсетей

Как это делают IANA и Python.

2 months назад @ antonz.ru
Go-фича: Хешеры
Go-фича: Хешеры Go-фича: Хешеры

// Hasher реализует хеширование и проверку на равенство для типа T. type Hasher [ T any ] interface { Hash ( hash * maphash .

// То есть, если Equal(a, b) возвращает true, то Hash(h, a) и Hash(h, b) // должны записывать одинаковые данные в h. Hash ( hash * maphash .

Hasher [ V ], V any ]( hasher H ) * Set [ H , V ] { return & Set [ H , V ]{ seed : maphash .

func ( s * Set [ H , V ]) calcHash ( val V ) uint64 { var h maphash .

func ( s * Set [ H , V ]) Has ( val V ) bool { hash := s . calcHash ( val ) if bucket , ok := s . data [ hash ]; ok { for _ , item := range bucket { if s . hasher .

2 months, 3 weeks назад @ antonz.ru
Go-фича: new(expr)
Go-фича: new(expr) Go-фича: new(expr)

Println ( * p1 ) // 0А теперь можно и с выражениями:// Указатель на переменную типа int со значением 42. p := new ( 42 ) fmt .

Println ( * p2 )42 go// go 1.26 p1 := new ( 42 ) fmt .

Println ( * p2 )42 goУказатель на составное значение:// go 1.25 s := [] int { 11 , 12 , 13 } p1 := & s fmt .

Println ( * p )go// go 1.26 f := func () string { return "go" } p := new ( f ()) fmt .

Println ( * p )goПередавать nil по-прежнему нельзя:// go 1.25 and go 1.26 p := new ( nil ) // compilation errorСсылки𝗣 45624 • 𝗖𝗟 704935, 704737, 704955, 705157

3 months назад @ antonz.ru
Вам не нужен testify/assert
Вам не нужен testify/assert Вам не нужен testify/assert

Вам не нужен testify/assertМногие Go-разработчики предпочитают ассерты (asserts, проверки в тестах) без if, чтобы тесты были короче и понятнее.

Nil ( t , age ) }Но я не думаю, что для хороших тестов действительно нужен testify/assert с его 40 разными ассертами.

func isNil ( v any ) bool { if v == nil { return true } // Интерфейс может быть не nil, но содержать nil, // поэтому проверяем внутреннее значение.

Стандартное сообщение подскажет, что не так, а номер строки укажет, где искать проблему.

TB , got error , want error ) { tb .

5 months, 1 week назад @ antonz.ru
Интерактивный тур по Go 1.25
Интерактивный тур по Go 1.25 Интерактивный тур по Go 1.25

Выпуск Go 1.25 запланирован на август, так что сейчас самое время изучить, что нового.

Не делайте так в продакшене ツПоехали!

Мы могли бы сделать таймаут параметром функции (наверное, так и стоило бы), но допустим, что это не вариант.

Внутри пузыря функции пакета time используют искусственные часы, что позволяет тесту пройти мгновенно:Начальное время в пузыре — полночь 2000-01-01 UTC.

Она ждет, пока все горутины в пузыре заблокируются, а затем продолжает выполнение:

6 months назад @ antonz.ru
fuzzy: Нечеткое сравнение строк в SQLite
fuzzy: Нечеткое сравнение строк в SQLite fuzzy: Нечеткое сравнение строк в SQLite

Cравнивать строки на похожесть и транслитерировать текст.

7 months, 1 week назад @ antonz.ru
No-Code и заклинатели дождя
No-Code и заклинатели дождя No-Code и заклинатели дождя

Прощай, зерокод.

7 months, 1 week назад @ antonz.ru
Stack Overflow помер (ну почти)
Stack Overflow помер (ну почти) Stack Overflow помер (ну почти)

Вернулся в 2007.

7 months, 1 week назад @ antonz.ru