첫 글자를 입력하기도 전에, AI는 이미 어떻게 행동할지 지시받은 상태예요.
메시지가 들어오기 전, 방 맨 위에는 보이지 않는 단락 하나가 먼저 자리를 잡고 있어요. 눈에는 보이지 않지만, AI는 그걸 읽어요. 그리고 그것이 돌아오는 모든 답변을 빚어내죠.
새 직원에게 첫 출근 전 건네는 핸드북이라고 생각해 보세요. 같은 사람인데, 핸드북에 뭐라고 쓰여 있느냐에 따라 행동이 완전히 달라져요.
- "당신은 병원 직원입니다. 침착하게, 신중하게, 절대 추측하지 마세요."
- "당신은 코미디 클럽 직원입니다. 긴장 풀고, 농담하고, 빠르게 진행하세요."
같은 사람이에요. 그런데 두 직원은 완전히 다르게 행동해요. 핸드북이 그렇게 만든 것이지, 사람이 달라진 게 아니에요.
시스템 프롬프트가 AI에게 바로 그 핸드북이에요. 보통 세 종류의 지시가 층층이 쌓여 있어요.
어떤 존재가 될 것인가. "당신은 친절한 어시스턴트입니다." 말투, 성격, 태도를 정해요.
무엇을 할 것인가. "우리 제품에 관한 질문에만 답하세요." 실제 역할을 규정해요.
절대 하지 말아야 할 것. "의료 조언은 절대 금지. 가격을 지어내지 말 것." 가드레일을 세워요.
완전히 같은 모델로 만든 AI 툴 두 개가 전혀 다른 느낌을 주는 이유가 여기 있어요. 환불 정책 외에는 정중하게 대화를 거부하는 고객 지원 봇과, 재미 삼아 욕설도 내뱉는 혼돈의 밈 생성기가 사실 동일한 엔진 위에서 돌아갈 수 있어요. 달라진 건 누군가 맨 위에 써넣은 핸드북뿐이에요.
당신과 직접 맞닿는 지점도 있어요. ChatGPT에서 "맞춤 지침"(이름, 직업, 선호하는 답변 방식을 입력하는 칸)을 설정하면, 그게 바로 직접 쓴 작은 시스템 프롬프트예요. 이후의 모든 대화에 핸드북을 먼저 건네는 거죠. AI가 갑자기 장황한 설명을 줄이거나, 매번 요청하지 않아도 짧은 버전을 내놓기 시작하는 건 그 때문이에요.
대부분의 사람이 놓치는 지점이 있어요. AI가 계속 마음에 안 드는 행동을 반복할 때, 본능적으로 따지고 싶어져요. 지적하면 사과하고, 세 메시지쯤 지나면 다시 똑같이 행동해요. 당연한 결과예요. 현장 직원에게 소리를 질렀지만, 그가 오늘 아침에 읽은 핸드북은 건드리지 않은 거니까요.
AI의 행동을 바꾸고 싶다면, 매번 싸우지 말고 핸드북을 고치세요.