AI 도구를 쓰고 있는데 왜 업무가 달라진 느낌이 없을까요? ChatGPT도 써보고, Gemini도 써봤는데 결국 "그냥 검색보다 조금 편한 것" 정도로 느껴진다면, 아직 1단계에 머물러 있을 가능성이 높습니다. 저도 처음엔 그랬습니다. AI 활용에는 명확히 구분되는 3단계가 있고, 어느 단계에 있느냐에 따라 체감 효과가 완전히 달라집니다.
1단계 LLM 증강: AI가 생각을 도와주는 단계
혹시 ChatGPT를 한 달 써봤는데도 "뭔가 크게 달라지지 않았다"는 느낌을 받으셨나요? 사실 그건 당연한 반응입니다. 1단계인 LLM(Large Language Model, 거대 언어 모델) 활용 단계는 AI가 사람의 사고 과정을 보조하는 수준이기 때문입니다. LLM이란 방대한 텍스트 데이터를 학습해 자연어로 대화하고 추론할 수 있는 AI 모델을 말합니다. ChatGPT, Gemini, Claude가 모두 여기에 해당합니다.
제가 처음 LLM을 사용한 건 아이디어 정리와 글 초안 작성이었습니다. 분명 편해지긴 했는데, 업무 방식 자체가 바뀌었다는 느낌은 솔직히 없었습니다. 왜냐면 결국 제가 머릿속으로 생각하고, AI는 그걸 말로 풀어주는 역할에 그쳤으니까요. 아이디어를 정제하거나 문서 초안을 잡는 속도는 빨라졌지만, 여전히 제 손이 많이 가는 구조였습니다.
그럼에도 이 단계를 건너뛰면 안 됩니다. LLM은 이후 모든 AI 활용의 기반이 되는 도구입니다. 기획 과정에서 생각을 구조화하거나, 복잡한 문제를 언어로 정리할 때 가장 빠르게 작동하는 도구가 바로 LLM이기 때문입니다. ChatGPT, Gemini, Claude 중 조직 환경에 따라 하나를 골라 유료 플랜으로 쓰는 것을 권장합니다. 무료 버전으로는 이 단계의 효과조차 제대로 체감하기 어렵습니다.
2단계 업무 자동화: 반복 업무를 머릿속에서 지우는 단계
그렇다면 AI를 쓰면서 "이건 진짜 달라졌다"는 감각은 언제 오는 걸까요? 저는 2단계인 업무 자동화(Task Automation)에 접어들면서 처음으로 그 감각을 받았습니다. 자동화란 특정 업무를 일일이 수행하는 대신, 규칙이나 코드로 프로세스를 만들어 AI가 반복 실행하게 하는 것을 말합니다.
제 경우엔 매주 반복하던 번역, 데이터 정리, 이메일 초안 작업을 자동화했습니다. 간단한 스크립트를 짜거나 자동화 툴을 연결했더니 체감 시간 절약이 확실했습니다. 그런데 여기서 흥미로운 점이 있었습니다. AI를 자동화 모듈(Automation Module)로 활용하면, 기존 코드로는 구현하기 어려웠던 정성적 평가나 분류 작업까지 자동화할 수 있다는 겁니다. 자동화 모듈이란 AI를 하나의 처리 단위로 삽입해 판단이나 생성이 필요한 작업도 자동 흐름 안에 넣는 방식을 뜻합니다.
자동화 방법은 크게 두 갈래로 나뉩니다.
- 코드 기반 자동화: Claude Code, Codex 같은 AI 코딩 도구를 활용해 직접 스크립트나 프로그램을 만드는 방식. 유연성이 높고 복잡한 로직 처리에 유리합니다.
- 노코드 기반 자동화: Zapier, Make, n8n 같은 노코드 도구를 활용해 코딩 없이 자동화 시나리오를 구성하는 방식. 진입 장벽이 낮지만 커스터마이징에 한계가 있습니다.
여기서 한 가지 짚고 싶은 게 있습니다. 코딩 에이전트(Coding Agent)를 단순히 노코드 도구처럼 쓰는 분들이 많은데, 그건 이 도구의 절반도 못 쓰는 겁니다. 코딩 에이전트란 단순히 코드를 생성하는 것을 넘어, 목표를 이해하고 스스로 계획·실행·수정하는 능력을 가진 AI를 말합니다. 이 점을 모르고 쓰면 2단계에서 3단계로 넘어가는 문이 보이지 않습니다.
실제로 맥킨지 글로벌 인스티튜트 보고서에 따르면 생성형 AI는 전체 업무 시간의 60~70%를 차지하는 지식 노동에서 자동화 잠재력이 가장 높다고 분석됩니다. 이 수치는 2단계 자동화가 단순 시간 절약을 넘어 업무 구조 자체를 바꿀 수 있음을 보여줍니다.
3단계 AI 조직화: 가상 팀을 꾸리고 지휘하는 단계
지금 AI를 쓰면서 "이건 마치 팀원에게 일을 맡기는 느낌"이라는 말을 들어보셨나요? 3단계인 AI 조직화(AI Orchestration)가 바로 그 감각입니다. AI 조직화란 여러 AI 에이전트에게 역할을 부여하고, 사람이 방향과 품질만 관리하는 방식으로 복잡한 업무를 처리하는 체계를 말합니다.
제가 최근에 콘텐츠 기획 작업을 이 방식으로 진행해봤습니다. 리서치 단계, 구조화 단계, 초안 작성 단계를 각각 다른 역할로 분리하고, Claude에게 단계별 목표와 조건을 주면서 결과를 검토·피드백하는 방식이었습니다. 솔직히 처음엔 설정하는 데 시간이 꽤 들었습니다. 하지만 한 번 구조가 잡히고 나니, 복잡도가 높은 작업일수록 효과가 확실히 컸습니다.
2단계와 3단계의 결정적 차이는 이렇습니다. 2단계 자동화는 "이것만 해"라고 시키면 그것만 합니다. 3단계 조직화는 목표와 맥락을 주면 AI가 스스로 판단하고 실행하며, 사람은 중간에 개입해 방향을 조정합니다. 이를 휴먼-인-더-루프(Human-in-the-loop)라고 합니다. 쉽게 말해 "완전 방임"이 아니라 "상호 위임과 감독"이 이루어지는 방식입니다. 이 구조 덕분에 결과물의 품질이 단순 자동화보다 훨씬 높아집니다.
현재 이 분야에서 가장 주목받는 도구는 Claude Code입니다. 에이전트적 워크플로우(Agentic Workflow), 즉 AI가 단계적으로 계획을 세우고 실행하는 작업 흐름을 설계하고 업무를 위임하는 능력에서 두드러집니다. 비개발자에게는 처음 접근이 낯설 수 있습니다. 그런데 제 경험상 허들을 한 번 넘고 나면, 오히려 2단계 자동화 툴을 배우는 것보다 적용이 더 빠릅니다. 유튜브 콘텐츠 기획, 강의 설계, 고객 문의 정리 등 다양한 지식 노동에 실제로 적용되고 있다는 점도 인상적입니다.
다만 한 가지 분명히 짚고 싶습니다. "코딩 에이전트가 모든 지식 노동을 대체한다"는 표현은 아직은 과장된 측면이 있습니다. 현재 AI는 맥락 이해나 책임 있는 의사결정에서 분명한 한계를 보입니다. 특히 조직마다 보안 정책, 기존 시스템, 비용 구조가 다르기 때문에, Claude Code가 최선인 환경도 있고 아닌 환경도 있습니다. 스탠퍼드 HAI의 AI 인덱스 2024 보고서에서도 AI 에이전트의 자율성 한계와 인간 감독의 필요성을 여전히 강조하고 있습니다.
정리하면, AI 활용의 3단계는 우열이 아닙니다. LLM은 사고를 확장할 때, 자동화는 단순 반복 업무를 없앨 때, 조직화는 복잡하고 다층적인 작업을 처리할 때 각각 가장 빛납니다. 저는 지금도 세 단계를 상황에 따라 섞어 씁니다. 만약 지금 1단계에 머물고 있다면, 자동화 하나만 시도해보는 것으로 충분합니다. 작은 성공 하나가 다음 단계로 넘어가는 신호가 되어줄 겁니다.
--- 참고: https://www.youtube.com/watch?v=wP48xJLWuB0