SEO 1위인데 ChatGPT는 왜 우리를 인용하지 않을까

1. 이상한 비대칭

ChatGPT에 우리 회사에 대해 직접 물어봤다. 답이 길게 나왔다. 그런데 출처 링크는 없다.

며칠 뒤 같은 질문을 다시 던졌다. 이번엔 출처 링크가 줄줄이 달렸는데, 답변 본문에 우리 이름은 거의 없다.

같은 질문, 며칠 차이. 한 번은 이름은 있는데 링크가 없고, 한 번은 링크는 있는데 이름이 없다.

마케터 입장에서 처음엔 이게 한 가지 현상의 두 얼굴인 줄 알았다. 'AI가 우리를 잘 모르나 보다.' 그런데 이건 두 얼굴이 아니라 두 개의 다른 일이다. AI가 우리 이름을 답변에 가져오는 방식은 한 가지가 아니라 두 가지이고, 둘은 따로 작동한다.

이걸 모르고 GEO 작업을 시작하면, 한쪽만 닦다가 다른 쪽이 왜 안 열리는지 영영 모른 채 끝난다. 한국 GEO 콘텐츠가 거의 한쪽만 다룬다 — 청크(chunk) 최적화, FAQ 추가, Schema 마크업 같은 RAG 쪽 작업법으로 GEO 전체를 설명한다. 다른 한쪽은 작업법으로 거의 등장하지 않는다.

이번 시즌은 그 두 가지 방식을 따라간다. 1편은 두 가지 방식이 있다는 사실을 확실히 짚는다. 2편부터는 각각 어떻게 작동하는지, 우리 브랜드는 어떻게 보이는지, 어디서부터 작업해야 하는지 따라간다.

그 전에, 'SEO 1위인데 ChatGPT는 왜 우리를 인용하지 않는가'라는 익숙한 좌절부터 정리하고 가자. 그게 두 가지 방식의 첫 단서니까.

2. SEO 1위인데 ChatGPT가 인용 안 하는 이유

검색 1위인데 AI 답변엔 안 보인다. 이 현상은 GEO 영역에서 가장 먼저 마케터를 당황하게 만든다. 그리고 이 좌절이 GEO라는 단어가 만들어진 배경이기도 하다.

GEO(Generative Engine Optimization, 생성형 엔진 최적화)는 마케터들이 만든 신조어가 아니다. 2023년 11월, Princeton·IIT Delhi 연구진이 GEO: Generative Engine Optimization 논문을 arXiv에 올렸고, 2024년 KDD(데이터마이닝 분야 최상위 학회)에 정식 게재됐다. 광고 업계가 만든 단어가 아니라, 학술 영역에서 새 검색 패러다임을 가리키는 말로 출발했다.

그 논문이 짚은 핵심은 단순하다 — 생성형 검색 엔진은 전통 검색 엔진과 가시성(visibility) 정의가 다르다. Google에서는 '1위 자리에 있다'가 가시성이지만, ChatGPT 답변에는 1위 자리가 없다. 답변 안에 우리 콘텐츠의 흔적이 있느냐 없느냐, 있다면 어떤 형태로 있느냐 — 그게 가시성이다.

논문은 이 흔적이 한 가지 형태가 아니라는 점도 짚었다. 답변 텍스트 안에 우리 콘텐츠가 인용되는 경우, 답변 끝에 우리 URL이 출처로 달리는 경우, 단지 우리 브랜드 이름만 등장하고 출처는 없는 경우. 같은 답변 안에서도 흔적의 종류가 다르다.

왜 SEO 1위가 GEO에서 자동으로 보장되지 않는지는, 두 게임이 답을 만드는 방식 자체가 다르기 때문이다.

SEO는 페이지를 보여주는 게임이다. Google이 페이지마다 점수를 매기고, 그 점수 순서대로 검색 결과 화면에 나열한다. 우리 페이지가 1위면 가장 위에 보인다. 페이지 자체가 통째로 노출되니까, 페이지의 점수가 곧 노출의 기준이다.

GEO는 답을 조합해서 만드는 게임이다. AI는 페이지를 보여주지 않는다. 학습 시점에 외워둔 기억(파라미터)과 답할 때 검색해서 가져온 글 조각(청크)을 섞어 새 답을 생성한다. 페이지가 그대로 노출되는 게 아니라, 그 안의 문장들이 AI에 기억되어 있느냐, 그 자리에서 인용되느냐가 노출의 기준이다.

그래서 SEO 1위라는 사실 자체가 GEO 노출을 만들지 않는다. AI 머릿속에 우리 문장이 기억되어 있거나, 답 만들 때 우리 청크를 가져와야 답에 등장한다. 둘 중 어디에도 흔적이 없으면, 검색 결과 1위였든 100위였든 결과는 같다 — 답에 안 나온다.

이제 우리가 물어야 할 질문은 두 개다 — AI 머릿속에 우리 문장이 기억되는가? 그리고 우리 사이트가 출처로 인용되는가? 이 둘은 서로 다른 일이고, 작동 방식이 다르고, 작업 방법도 다르다.

여기서부터가 두 가지 방식 이야기다.

3. AI는 두 가지 방식으로 답한다

AI 챗봇이 답변을 만들 때 우리 브랜드를 가져오는 경로는 크게 둘이다. 두 가지가 있다는 사실 자체는 새롭지 않다. 새로운 건 — 두 가지 방식은 같은 작업으로 풀리지 않는다는 점이다. 둘은 다른 시점에, 다른 메커니즘으로 작동한다. 그래서 한쪽만 작업해서는 다른 쪽이 안 열린다.

첫 번째 방식: 파라미터 지식

AI 모델은 학습 단계에서 인터넷의 거대한 텍스트 더미를 읽는다. ChatGPT가 학습한 데이터에는 위키피디아, 뉴스 기사, 블로그, 포럼, 책이 다 들어가 있다. 학습이 끝나면 모델은 그 모든 내용을 — 정확히는 그 내용에서 추출한 통계적 패턴을 — 파라미터(parameter, AI 모델 안의 수천억 개 가중치)라는 형태로 저장한다.

답변할 때 모델은 이 파라미터에서 정보를 꺼낸다. 우리 브랜드가 학습 데이터에 충분히 자주, 일관된 맥락으로 등장했다면 모델은 우리 이름을 '기억'하고 있다. 질문이 들어오면 그 기억을 끌어와 답변에 자연스럽게 섞는다. 이때 모델은 출처 URL을 댈 수 없다 — 학습 시점에 본 무수한 자료가 합쳐진 결과지, 한 곳에서 가져온 게 아니니까.

이게 '이름은 있는데 링크가 없다'가 일어나는 첫 번째 방식이다. 업계에서는 이걸 mention(언급)이라 부른다.

두 번째 방식: RAG

또 다른 방식은 답변 시점에 실시간으로 검색하는 것이다. 사용자가 질문하면 AI가 그 질문에 맞는 웹 페이지를 그 자리에서 찾고, 가져온 페이지의 일부 — 보통 한두 단락 단위로 잘린 청크(chunk) — 를 답변 생성에 사용한다. 이 방식의 정식 이름이 RAG(Retrieval-Augmented Generation, 검색 증강 생성)다.

RAG로 답변할 때는 출처 URL이 따라온다. 답변 옆에 [1], [2] 같은 각주가 붙고 클릭하면 원문으로 이동한다. 이게 citation(인용)이다.

비유하자면 도서관 사서다. 미리 책을 다 읽어두고 그 기억으로 답하는 사서(파라미터)와, 질문을 받고 그제야 책장에서 책을 꺼내와 펼쳐 보여주는 사서(RAG). 같은 도서관에 있어도 두 사서의 작동 방식은 완전히 다르다.

모델마다 비중이 다르다

같은 AI 챗봇이라도 모델마다 두 가지를 쓰는 비중이 다르다. 이게 가장 중요한 사실이다.

우리는 RAG 검색 기능이 켜진 ChatGPT를 기준으로 본다. 토글이 꺼진 상태에서는 거의 100% 파라미터 지식만 쓴다. Gemini는 답변마다 자동으로 두 가지를 섞는다.

SEO 분석가 Kevin Indig가 2026년 4월 발표한 분석은 이 차이를 정밀한 숫자로 보여준다. Semrush AI Toolkit 데이터로 ChatGPT와 Gemini의 답변에서 브랜드가 어떻게 나타나는지를 추적한 결과(14개국, 115개 프롬프트, 3,981개 도메인):

모델	등장 시 인용(citation) 비율	등장 시 언급(mention) 비율
ChatGPT	87.0%	20.7%
Gemini	21.4%	83.7%

ChatGPT는 브랜드를 출처 링크로 처리하는 경우가 많고, Gemini는 반대로 답변 본문에 브랜드 이름을 직접 적는 경우가 많다. 같은 질문, 같은 브랜드인데 두 모델이 완전히 다르게 처리한다.

이 차이가 말하는 건 하나다 — 두 가지 방식 다 닦아야 하지만, 모델마다 강조하는 쪽이 다르다. 어느 한쪽만 작업하면 절반은 헛일이 될 수 있다.

전체적으로 봐도 mention이 우세하다. BrightEdge AI Catalyst 분석에 따르면 ChatGPT는 브랜드를 citation보다 mention으로 처리하는 횟수가 3.2배 많다. 즉, ChatGPT가 어떤 브랜드를 가져올 때 그 대부분은 파라미터 기억에서 꺼내는 것이지, 실시간 검색 결과가 아니다.

4. 두 가지 방식은 시간 스케일이 다르다

두 가지 방식의 차이는 비중만이 아니다. 작업이 효과를 내는 데 걸리는 시간도 다르다.

파라미터는 학습 단계에 작용한다. 우리가 오늘 콘텐츠를 발행하면, 그게 다음 모델 학습 데이터에 포함되고, 새 모델이 출시되어야 답변에 반영된다. 이 주기가 보통 6~18개월이다. ChatGPT가 GPT-5에서 GPT-5.4로, Claude가 4.5에서 4.7로 넘어가는 그 주기. (요즘은 주기가 빨라졌다)

RAG는 답변 시점에 작용한다. 우리가 오늘 콘텐츠를 발행하면, 검색 엔진(ChatGPT의 경우 Bing, Google AI는 Google) 인덱스에 잡히는 데 수일~수주, 그 뒤로 RAG 검색에 걸릴 수 있다. 발행에서 답변까지 빠르면 며칠.

이 시간 스케일 차이가 작업 우선순위와 측정 기대치를 갈라놓는다. RAG 작업을 했는데 한 달이 지나도 결과가 없다면 작업에 문제가 있을 가능성이 크다. 파라미터 작업을 했는데 한 달째 변화가 없다면 — 그건 정상이다. 1년 뒤를 보고 하는 일이니까.

같은 'AI 답변에서 우리 브랜드 보이게 만들기'라는 목표라도, 두 가지 방식은 다른 작업, 다른 주기, 다른 측정을 필요로 한다.

다음 편(2편, 5월 22일)에서는 우리 브랜드가 두 방식에서 실제로 어떻게 보이는지 — mention과 citation을 분리해서 첫 측정을 해보는 워크플로우를 다룬다.

5. 이 글의 한 줄

AI가 답변에서 우리 브랜드를 가져오는 방식은 두 가지다 — 학습 시점에 새겨진 기억(파라미터 지식)과 답할 때 가져오는 검색(RAG). 두 가지는 작동 방식이 다르고, 시간 스케일이 다르고, 측정 흔적이 다르다. 그래서 GEO는 한 게임이 아니라 두 게임이다.

참고 자료

Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K., & Deshpande, A. (2024). GEO: Generative Engine Optimization. Proceedings of the 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD '24), 5–16.
Indig, K. (2026, April). The ghost citation problem. Growth Memo. Semrush AI Toolkit 데이터 기반 (3,981 도메인, 115 프롬프트, 14개국, 4개 AI 엔진).
BrightEdge. (2024). BrightEdge AI Catalyst. ChatGPT mention vs citation 비율 분석.