새로 쓰지 마라, 고쳐 써라 — AI가 인용하는 콘텐츠로 바꾸는 5가지 변환

1. 어디가 문제인지 알았으면, 이제 고친다

3편에서 RAG citation(인용, AI가 답하면서 출처 링크로 우리를 다는 것)이 약한 두 가지 이유를 봤다 — AI 봇이 사이트에 못 들어오는 입구 문제, 들어와도 가져갈 단위가 없는 구조 문제. 4편은 그중 구조 문제를 고친다. 핵심부터 말하면, 처음부터 새로 쓸 필요 없다. 이미 있는 페이지를 AI가 가져가기 좋게 다시 쓰는 5가지 패턴이면 된다.

여기엔 전제가 하나 있다. 이 작업은 AI 봇이 이미 우리 사이트에 들어오고 있을 때 효과가 있다. 입구가 막혀 있으면 아무리 잘 고쳐 써도 AI가 그 페이지를 볼 수 없으니까. 입구 문제는 3편으로 돌아가 먼저 풀어야 한다.

왜 '구조'가 문제가 되는지부터 짚자. AI는 답을 만들 때 우리 페이지를 통째로 읽고 요약하지 않는다. 페이지를 한두 단락 단위로 자른 조각 — 청크(chunk) — 으로 가져가, 그중 질문에 맞는 조각만 골라 답에 쓴다.

여기서 오해 하나를 미리 끊고 가자. 1.5편에서 봤듯, 구글은 "콘텐츠를 청크 단위로 쪼갤 필요 없다"고 했다. 맞는 말이다. AI에 잘 보이겠다고 글을 인위적으로 토막 내면 사람이 읽기 나쁜 글이 되고, 그건 어디서도 보상받지 못한다.

이번 편의 5가지는 그 '쪼개기'가 아니다. 단락 하나하나가 떼어 놓고 봐도 말이 되도록 — 자기완결적이 되도록 — 만드는 글쓰기 품질 작업이다. 결론을 앞에 두는 것, 한 단락에 한 답을 담는 것은 AI 이전에 좋은 글의 조건이다.

다만 이 작업이 citation으로 직접 보상받는 무대는 따로 있다. 1.5편 2×2 프레임의 아래 행 — 구글 바깥, 즉 ChatGPT·Claude·Perplexity다. 구글 영역에서는 좋은 글이니 손해가 없고, 구글 바깥에서는 좋은 글이면서 동시에 인용될 확률을 올린다. ChatGPT가 브랜드를 주로 citation으로 처리하는 모델인 만큼(등장 시 87%, 1편), 이 작업의 효과가 가장 먼저 보이는 곳도 ChatGPT다.

그러니 우리가 할 일은 분명하다. AI가 우리 페이지에서 '잘라 가기 좋은 조각'을 만들어 두는 것. 아래 5가지 변환은 전부 이 한 가지를 위한 방법이다.

2. 변환 전에: 어떤 페이지를 먼저 손대나

5가지를 모든 페이지에 적용할 필요는 없다. 순서가 있다.

1순위는 트래픽은 있는데 citation이 안 나오는 페이지다. 검색 유입은 꾸준한데 AI 답변에는 안 잡히는 페이지 — 이건 입구는 열려 있고(봇이 들어와 색인됐으니 검색 유입이 있는 것) 구조에서 막히고 있다는 신호다. 고치면 가장 빨리 결과가 나오는 자리다.

그런데 어떤 페이지가 거기 해당하는지는 감으로 찍을 일이 아니다. 2편에서 본 자가 측정 — AI 답변에 우리가 출처 링크(citation)로 잡히는지, 이름만(mention, 출처 없이 브랜드 이름만 등장하는 것)으로 잡히는지를 분리해 세어 보는 작업 — 이 그 페이지를 가려내는 도구다. citation이 비어 있는 페이지가 바로 이번 편의 1순위 후보다.

반대로 트래픽도 없고 citation도 없는 페이지는 입구 문제일 가능성이 크다. 구조부터 고쳐도 AI가 못 보면 소용없다.

우리가 작업할 때도 이 페이지들을 먼저 추려 놓고 시작한다. 손이 한정돼 있으니까. 그래서 작업 순서는 — 트래픽 있고 citation 없는 페이지부터. 여기에 5가지 변환을 적용한다.

3. 변환 1 — 헤딩을 질문으로

Before: 주요 기능
After: ○○은 노션·트렐로와 무엇이 다른가?

사람들이 AI에 던지는 건 키워드가 아니라 질문이다. "최고의 협업 툴"이 아니라 "노션이랑 트렐로 중에 뭐 써야 해?"처럼. 헤딩이 그 질문 형태를 그대로 닮으면, AI가 질문과 우리 단락을 직접 맞춰 보기 쉽다. 헤딩이 곧 '이 조각이 어떤 질문에 대한 답인지'를 알려주는 라벨이 되는 셈이다.

4. 변환 2 — 결론을 첫 문장으로 (BLUF)

Before: 배경 → 근거 → … → (맨 끝에) 결론
After: (첫 문장) 결론 → 그 뒤에 근거·배경

기자들이 쓰는 원칙 중 BLUF(Bottom Line Up Front, 결론을 맨 앞에)가 있다. 예를 들어 요금 안내 단락이라면, "○○ 무료 플랜은 멤버 수 제한이 없다"를 첫 문장에 두고 그 뒤에 조건을 붙이는 식이다. AI가 청크를 가져갈 때, 한 조각만 떼어 가도 그 안에 답이 들어 있어야 쓸 수 있다. 결론이 단락 맨 끝에 있으면 AI가 앞부분만 잘라 갔을 때 정작 답이 빠진다. 첫 문장에 답을 두면, 어느 지점에서 잘려도 답이 살아남는다.

5. 변환 3 — 한 단락에 한 답

Before: 한 단락에 가격·보안·외부 연동이 다 섞여 있음
After: 가격 단락 / 보안 단락 / 연동 단락으로 분리

AI는 단락을 조각의 기본 단위로 본다. 한 단락에 가격·보안·연동이 엉켜 있으면, AI가 가져간 조각도 세 답이 섞인 흐릿한 덩어리가 된다. "이 툴 보안 어때?"라는 질문에 깨끗이 답하려면, 보안만 다루는 단락이 따로 있어야 한다. 단락 하나가 하나의 질문에만 답하면, 그 조각은 그 질문에 대한 깨끗한 답이 된다. '잘라 가기 좋은 조각'의 가장 기본 조건이다.

6. 변환 4 — 수치와 출처를 더한다

Before: "많은 팀이 ○○을 쓴다"
After: "2026년 ○○ 자체 조사에서 50인 이하 팀의 41%가 이 방식을 택했다(출처)"

이건 감이 아니라 측정된 결과다. 1편에서 인용한 Princeton GEO 논문(arXiv:2311.09735)은 콘텐츠에 통계·인용·출처를 더하는 것만으로 생성형 답변에서의 가시성이 방법에 따라 최대 40%가량 올랐다고 보고했다.

AI는 검증 가능한 구체적 정보를 답에 쓰기를 선호한다. 막연한 형용사보다 숫자와 출처가 붙은 문장이 인용될 확률이 높다. (단, 이건 현재 모델 세대 기준의 경향이지 모든 수치가 똑같이 작동한다는 뜻은 아니다. 핵심은 '검증 가능한 형태'다.)

7. 변환 5 — FAQ 섹션을 붙인다

Before: 가격·연동·보안 정보가 본문 곳곳에 흩어져 있음
After: 페이지 끝에 '자주 묻는 질문' — "무료 플랜에 인원 제한이 있나요?" "기존 툴에서 데이터를 옮길 수 있나요?" 같은 질문 + 짧은 답 묶음

FAQ는 앞의 네 가지를 한 번에 적용한 형태다. 질문이 헤딩이고(변환 1), 답이 첫 문장에 오고(변환 2), 한 질문에 한 답이고(변환 3), 거기에 수치를 넣을 수 있다(변환 4). AI 입장에서 FAQ는 '잘라 가기 좋은 조각'이 줄지어 있는 구간인 셈이다.

그래서 새 페이지를 만들기 어렵다면, 기존 페이지에 FAQ 한 블록을 붙이는 게 비용 대비 효과가 가장 큰 변환인 경우가 많다.

8. 고쳐 쓰기의 끝, 그리고 다음 게임

5가지는 결국 한 문장으로 줄어든다 — AI가 잘라 가기 좋은 조각을 만들어라. 헤딩으로 라벨을 붙이고, 결론을 앞에 두고, 한 단락에 한 답을 담고, 수치로 검증 가능하게 만들고, FAQ로 묶는다. 처음부터 새로 쓰는 게 아니라, 이미 있는 페이지를 이 방향으로 고치는 일이다.

여기까지가 마케터가 직접 할 수 있는 작업이다. 다만 어떤 페이지부터, 어떤 우선순위로, 어디까지 손대야 효율적인지 — 페이지가 수백 개로 늘면 그 판단 자체가 일이 된다. 직접 할 수 있는 일과 진단이 필요한 일이 갈리는 자리가 거기다.

그리고 한 가지 더. 지금까지 3·4편은 모두 RAG 게임이었다. 우리 사이트 안에서, 우리 손으로 끝나는 작업 — citation을 올리는 일이다.

하지만 1·2편에서 본 다른 흔적, mention — 출처 링크 없이 AI가 우리 이름만 답에 적는 것 — 은 이 작업으로 올라가지 않는다. 우리 페이지를 아무리 잘 고쳐 써도, AI 머릿속의 기억은 우리 사이트 바깥에서 만들어지기 때문이다. mention이 약한 쪽은 완전히 다른 게임이다.

다음 편(5편, 7월 3일)에서 그 게임을 연다 — 파라미터 게임: 외부 노출과 시간 누적.

이 글의 한 줄

RAG citation이 약한 건 대개 콘텐츠 구조 문제이고, 새로 쓸 필요 없이 5가지 패턴으로 고치면 된다 — 헤딩을 질문으로, 결론을 첫 문장으로, 한 단락에 한 답, 수치·출처 추가, FAQ. 전부 'AI가 잘라 가기 좋은 조각'을 만드는 일이다.

참고 자료

Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), 5–16. — 통계·인용·출처 추가가 생성형 답변에서의 가시성을 방법에 따라 최대 40%가량 향상시킨다고 보고.