목록전체 글 (622)
꿈 많은 사람의 이야기
포스팅 개요작년까지만 해도 AI 안전성(Safety)을 이야기할 때 "이 모델이 폭탄 제조법을 알려주느냐", "이 모델이 차별 발언을 하느냐" 같은 단일 응답의 위험에 대한 이야기가 많았었습니다. 모델은 입력에 답하는 함수였고, 평가는 그 답이 얼마나 위험한가에 초점을 맞췄던 것이죠.1년이 더 지난 지금, 무게중심이 옮겨간 것 같습니다. 이제는 우리가 걱정해야 하는 건 모델이 무슨 말을 하느냐가 아니라, 모델이 도구를 들고 무엇을 하느냐인 것 같습니다. 코드를 실행하고, 파일을 읽고, 메일을 보내고, 다른 에이전트와 협업하는 AI Agent 시스템의 시대이기 때문이죠. 그리고 이 에이전트들이 본격적으로 실서비스에 들어가기 시작하면서, 챗봇 시대의 안전 평가 방식이 더 이상 통하지 않는다는 이야기가 점점 ..
포스팅 개요2026년 들어 클로드 코드(Claude Code) 생태계에서 가장 화제가 된 GitHub 저장소가 하나 있습니다. 이름은 andrej-karpathy-skills입니다. 카파시가 X(구 트위터)에 올린 짧은 글 한 편에서 영감을 받아 한 개발자가 그 다음 날 만든 저장소인데요(이름만 들으면 안드레이 카파시(Andrej Karpathy)가 직접 만든 공식 저장소처럼 보이지만, 사실은 그렇지 않습니다.) 그런데 이 저장소가 단 한 장의 마크다운 파일을 중심으로 GitHub에서 별 10만 개를 넘기는 폭발적인 반향을 일으켰습니다.저는 이전 글들에서 그동안 클로드 코드의 스킬, 룰, 서브 에이전트이라는 개념을 차례로 다뤄왔습니다. 이번에 살펴볼 카파시 저장소는 그 모든 흐름이 가장 압축된 형태로 구..
포스팅 개요본 포스팅은 2026년 2월 구글(Google)과 버지니아 대학(University of Virginia) 공동 연구팀이 발표한 Think Deep, Not Just Long: Measuring LLM Reasoning Effort via Deep-Thinking Tokens 논문을 리뷰하고, 이 연구가 실제 AI 사용자들에게 어떤 의미를 가지는지까지 개인적인 생각을 정리한 포스팅입니다.최근 추론 모델(Reasoning Model)이 AI 업계의 주류로 자리 잡으면서, 이른바 "길게 생각할수록 더 정확하다"는 가정이 업계의 암묵적인 통념이 되었습니다. 그런데 어느 순간부터 그 반대 방향의 연구들이 조금씩 나오기 시작했고, 이 논문도 그 흐름 중 하나인 연구입니다.논문의 핵심 주장을 한 문장으로..
포스팅 개요본 포스팅은 Claude Code의 Custom Agents(커스텀 에이전트) 기능에 대해 다루는 글입니다. Claude Code로 복잡한 작업을 하다 보면, 하나의 대화 안에서 코드 탐색, 구현, 테스트, 리뷰를 모두 처리하게 됩니다. 이렇게 하면 컨텍스트 윈도우가 금방 차고, Claude가 앞에서 봤던 내용을 놓치는 경우가 생깁니다. Custom Agents는 이 문제를 해결합니다. 특정 작업을 전담하는 전문 에이전트를 만들어두면, Claude가 해당 작업을 만났을 때 그 에이전트에게 위임합니다. 각 에이전트는 자기만의 컨텍스트 윈도우에서 독립적으로 작동하고, 작업이 끝나면 요약된 결과만 돌려줍니다. 주 대화의 컨텍스트는 깔끔하게 유지되는 것이죠. 이 글에서는 Custom Agents의 기..
포스팅 개요본 포스팅은 Claude Code의 Rules 기능에 대해 다루는 글입니다. Claude Code로 작업하다 보면, 매 세션마다 같은 지시를 반복하게 되는 경우가 있습니다. "이모지 쓰지 마", "로그는 이 형식으로 작성해", "테스트는 pytest로 돌려" 같은 것들이죠. 한두 번이면 괜찮지만, 프로젝트가 커지고 팀원이 늘어나면 이런 반복 지시는 꽤 번거로워집니다. Claude Code의 Rules는 이런 문제를 해결합니다. CLAUDE.md 파일이나 .claude/rules/ 디렉토리에 규칙을 작성해두면, Claude가 매 세션 시작 시 자동으로 읽고 따르려 합니다. 다만 이것은 강제 설정이 아니라 컨텍스트로 취급되기 때문에, 지침이 구체적이고 간결할수록 더 일관되게 따릅니다. 한 번 써두..
포스팅 개요본 포스팅은 Claude Code의 Skills 기능에 대해 다루는 글입니다. Claude Code를 사용하다 보면 반복적으로 같은 지시를 내리는 경우가 많습니다. "배포 전에 테스트 돌려줘", "PR 요약해줘", "이 형식으로 로그 남겨줘" 같은 것들이죠. 매번 동일한 프롬프트를 입력하는 건 비효율적이고, 지시 내용이 길어지면 실수가 생기기도 합니다. Claude Code의 Skills는 이런 문제를 해결하기 위해 만들어진 기능입니다. 반복되는 지시사항이나 워크플로우를 SKILL.md 파일로 정의해두면, /skill-name으로 간편하게 호출하거나 Claude가 상황에 맞게 자동으로 불러올 수 있습니다. 쉽게 말해, Claude에게 새로운 능력을 가르쳐주는 기능이라고 보면 됩니다. 이 글에서..
나는 지금까지 일하면서, 지난 2025년만큼 빠르게, 그리고 미친듯이 일하고 업무에 집중하여 결과물을 낸 적이 없다. 동시에 2025년만큼 빠르게 지친 적도 없다. 두 이유 다 AI 때문이다. 나는 지금 데이터사이언티스트 직책을 담당하고 있다. 직책만 데싸이고, 사실상 PM의 역할을 수행하고 있다. 현업 실무자 분들과 커뮤니케이션하며 업무 효율화 향상을 위한 AI 시스템 개발, AI 문화 확산 등 흔히 말하는 AX(AI Transformation) 업무를 하고 있다. 아이템(혹은 문제점)에 대한 발굴부터 전략, 기획을 수립하고 PoC, MVP, 운영 배포, 모니터링까지 진행하고 있고 혼자서 3~4개를 동시에 진행하고 있다.생성형 AI가 업무 전반에 들어온 이후, 확실히 개발 작업의 속도는 빨라졌다. 코드..
포스팅 개요본 포스팅은 Agent Drift: Quantifying Behavioral Degradation in Multi-Agent LLM Systems Over Extended Interactions라는 논문을 리뷰하는 포스팅입니다. 최근 AI 에이전트(AI Agent) 기술이 빠르게 발전하면서, 단순히 하나의 LLM이 질의응답을 수행하는 것을 넘어서 여러 에이전트가 협력하여 복잡한 작업을 수행하는 Multi-Agent LLM 시스템이 주목받고 있습니다.LangGraph, AutoGen, CrewAI와 같은 프레임워크의 등장으로 이러한 다중 에이전트 시스템의 배포가 급격히 가속화되었는데요. 이러한 시스템들은 코드 생성, 연구 종합, 기업 자동화 등 다양한 영역에서 인상적인 성능을 보여주고 있습니다...
들어가며: 왜 지금 AI 기본법인가?2022년 11월 ChatGPT의 등장은 전 세계를 뒤흔들었습니다. 출시 2개월 만에 1억 명의 사용자를 확보하며 역사상 가장 빠르게 성장한 서비스가 되었고, 이후 GPT-4, Claude, Gemini 등 생성형 AI의 발전은 우리 일상을 근본적으로 바꾸고 있습니다. 이러한 배경 속에서, 2024년 12월 26일 국회 본회의에서 재석 264명 중 찬성 260명이라는 압도적인 지지로 「인공지능 발전과 신뢰 기반 조성 등에 관한 기본법」이 통과되었습니다(이하 AI기본법). 2026년 1월 22일부터 시행되는 이 법은 EU AI Act에 이어 전 세계에서 두 번째로 포괄적인 AI 규제 체계를 갖춘 법률입니다. 본 포스팅은 법률 조항을 순서대로 나열하는 대신, 독자 여러분이..
포스팅 개요본 포스팅은 Chandra라는 파이썬 OCR 라이브러리를 소개하는 포스팅입니다. 최근 RAG(Retrieval Augmented Generation)과 AI Agent에 대한 연구와 개발 수요가 증가하면서 문서 디지털화와 OCR(Optical Character Recognition) 기술에 대한 수요가 급증하고 있습니다.기존의 OCR 솔루션들은 텍스트만 추출할 뿐, 문서의 레이아웃 구조를 보존하지 못하는 한계가 있었죠.Chandra는 이러한 문제를 해결하기 위해 등장한 Vision-Language Model(VLM) 기반의 문서 OCR 시스템입니다.단순히 텍스트만 추출하는 것이 아니라, 문서의 레이아웃 정보까지 보존하면서 HTML, Markdown, JSON 형식으로 변환해주는 강력한 기능을 ..