콘텐츠로 이동

코딩 없이 엑셀 키워드 분석 (Claude Code·Codex)

코딩 없이 엑셀 뉴스 데이터의 키워드 뽑기 — 바른 MCP + AI 코딩 도구

엑셀에 모아 둔 수천~수만 건의 문장에서 무엇이 자주 등장하는지(핵심 키워드) 를 알고 싶을 때가 있습니다. 한국어 키워드는 대부분 명사라서, 문장을 형태소로 나눠 명사만 정확히 뽑아 세는 것이 가장 견고한 방법입니다. 이 작업을 해 주는 것이 바른 형태소 분석기입니다.

이 문서는 프로그래밍을 전혀 모르는 분이, 코드를 한 줄도 직접 쓰지 않고 AI 코딩 도구 (Claude Code 또는 Codex)에게 말로 시켜서 엑셀의 키워드 분석을 끝내는 과정을 하나하나 따라 할 수 있게 정리한 안내서입니다.

이 문서대로 하면 생기는 결과

한국언론진흥재단 빅카인즈(BigKinds) 에서 내려받은 것 같은, 문장 1만 건 이상이 든 엑셀 파일을 넣으면 → 자주 나온 키워드(명사) 순위 표막대그래프가 새 엑셀 파일로 만들어집니다. 코드는 AI 가 대신 쓰고 실행합니다. 여러분은 말(한국어)로 요청만 합니다.

준비 시간

처음 한 번만 프로그램 3가지(① 파이썬 ② AI 코딩 도구 ③ 바른 연결)를 설치·설정합니다. 여기까지 보통 20~30분이면 끝납니다. 그다음부터는 엑셀을 바꿔 가며 몇 분 만에 분석할 수 있습니다.

전체 그림 — 무엇을, 왜 설치하나요?

세 가지를 준비합니다. 각자 역할이 다릅니다.

준비물 한 줄 역할 비유
파이썬(Python) AI 가 만든 분석용 코드를 실제로 돌리는 엔진 요리를 할 주방
AI 코딩 도구(Claude Code·Codex) 여러분의 말을 알아듣고 코드를 대신 써서 실행하는 조수 주방에서 일하는 요리사
바른 MCP 서버 한국어 문장을 정확히 형태소 분석해 명사를 뽑아 주는 전문 도구 요리사가 쓰는 칼·저울
graph LR
  YOU[사람: 말로 요청] --> AI[AI 코딩 도구<br/>Claude Code·Codex];
  AI -->|코드 작성·실행| PY[파이썬];
  AI -->|한국어 형태소 분석| BAREUN[바른 MCP 서버];
  PY --> XLSX[엑셀 읽기·집계];
  BAREUN --> NOUN[명사 추출];
  XLSX --> OUT[키워드 순위 + 차트<br/>새 엑셀 파일];
  NOUN --> OUT;

왜 형태소 분석이 필요한가요?

한국어는 정부가, 정부는, 정부를처럼 명사에 조사가 붙어 한 덩어리가 됩니다. 그냥 띄어쓰기 로만 세면 이 셋이 서로 다른 단어로 잡혀 키워드 통계가 어긋납니다. 바른으로 형태소 분석을 하면 조사·어미가 떨어져 나가 정부 하나로 합쳐져 정확히 셉니다. 자세한 배경은 키워드 추출·텍스트 마이닝 문서를 참고하세요.

준비물 체크리스트

  • [x] 인터넷이 되는 PC (Windows 또는 macOS)
  • [x] 바른 API 키 (아래 0단계에서 발급 — koba- 로 시작하는 문자열)
  • [x] 분석할 엑셀 파일 (예: 빅카인즈에서 내려받은 뉴스 데이터)
  • [x] AI 코딩 도구 계정 — Claude Code(Anthropic 계정) 또는 Codex(ChatGPT 계정) 중 하나

Claude Code 와 Codex 중 무엇을 쓰나요?

둘 중 아무거나 하나만 있으면 됩니다. 이미 쓰는 구독(클로드 또는 ChatGPT)에 맞춰 고르세요. 이 문서는 두 도구 모두에 대해 각각 안내합니다. 화면의 (Claude Code / Codex)에서 여러분이 쓰는 쪽을 누르며 따라 하면 됩니다.


0단계: 바른 API 키 받기

바른 MCP 서버는 API 키로 사용자를 확인합니다. 키가 있어야 분석을 할 수 있습니다.

  1. 웹브라우저로 bareun.ai 에 접속해 회원가입합니다.
  2. 가입 후 받은 메일에서 이메일 인증을 마칩니다.
  3. 로그인한 다음 ‘로그인 – 내정보(내 정보)’ 화면에서 API 키를 확인합니다. 키는 koba- 로 시작하는 긴 문자열입니다.
  4. 이 키를 복사해 둡니다. 뒤에서 발급받은_API_키 자리에 그대로 붙여 넣습니다.

API 키는 비밀번호처럼 다루세요

API 키는 남에게 보이지 않게 보관하세요. 메신저·화면 공유 등에 노출되지 않도록 주의합니다. 요금·사용량과 발급 안내는 클라우드에서 사용하기 문서를 참고하세요.


1단계: 파이썬(Python) 설치하기

파이썬은 AI 가 만든 분석 코드를 실제로 돌리는 엔진입니다. 여러분이 파이썬을 직접 다룰 일은 없습니다. 설치만 해 두면 됩니다.

  1. python.org/downloads 에서 노란색 ‘Download Python’ 버튼을 눌러 설치 파일을 내려받습니다.
  2. 내려받은 파일을 실행합니다. 설치 첫 화면 맨 아래의 Add python.exe to PATH(또는 Add Python to PATH) 체크박스를 반드시 켭니다. 그다음 Install Now 를 누릅니다.
  3. 설치가 끝나면 PowerShell(시작 메뉴에서 "PowerShell" 검색)을 열고 아래를 입력합니다.

    python --version
    
  4. Python 3.xx.x 처럼 버전이 나오면 성공입니다.

  1. python.org/downloads 에서 macOS용 설치 파일(.pkg)을 내려받아 실행하고, 안내대로 계속 → 설치를 누릅니다.
  2. 설치가 끝나면 터미널(Spotlight에서 "터미널" 검색)을 열고 아래를 입력합니다.

    python3 --version
    
  3. Python 3.xx.x 처럼 버전이 나오면 성공입니다.

‘터미널’이 처음이신가요?

터미널(Windows의 PowerShell, macOS의 터미널)은 글자로 명령을 입력하는 검은 창입니다. 이 문서의 회색 칸에 있는 명령을 그대로 복사해 붙여 넣고 Enter 만 누르면 됩니다. 붙여넣기는 보통 마우스 오른쪽 클릭 또는 Ctrl+V(맥은 ⌘+V)입니다.


2단계: AI 코딩 도구 설치하기

여러분의 말을 알아듣고 코드를 대신 써 줄 조수를 설치합니다. Claude Code 또는 Codex 중 하나만 설치하면 됩니다.

터미널(Windows는 PowerShell, macOS는 터미널)에 아래 한 줄을 붙여 넣고 Enter 합니다. 파이썬과 달리 Node.js 같은 것이 따로 필요 없는 설치 방법입니다.

irm https://claude.ai/install.ps1 | iex
curl -fsSL https://claude.ai/install.sh | bash

설치가 끝나면 아래를 입력해 실행하고, 화면 안내에 따라 브라우저에서 로그인합니다 (Claude Pro·Max 등 Anthropic 유료 계정이 필요합니다).

claude

설치가 잘 됐는지 확인하려면 claude --version 을, 문제가 있을 땐 claude doctor 를 입력하세요. 자세한 설치 안내는 Claude Code 공식 설치 문서 를 참고하세요.

Codex 는 ChatGPT 계정으로 쓰는 터미널용 AI 코딩 도구입니다. 아래 한 줄을 붙여 넣고 Enter 합니다.

powershell -ExecutionPolicy ByPass -c "irm https://chatgpt.com/codex/install.ps1 | iex"
curl -fsSL https://chatgpt.com/codex/install.sh | sh

설치가 끝나면 아래를 입력해 실행하고, 안내에 따라 ChatGPT 계정으로 로그인합니다.

codex

자세한 설치 안내는 Codex 공식 시작 문서 를 참고하세요.

설치 후 ‘command not found’ 가 나오면

터미널을 완전히 닫았다가 다시 열고 같은 명령을 한 번 더 해 보세요. 설치한 프로그램의 위치를 새 창이 인식하려면 재실행이 필요할 때가 있습니다.


3단계: 바른 MCP 서버 연결하기

이제 조수(AI)에게 바른이라는 전문 도구를 손에 쥐여 줍니다. 이 연결을 해 두면 AI 가 한국어 문장을 분석할 때 바른을 직접 불러 정확한 형태소 분석을 합니다. (바른 MCP 서버에 대한 자세한 설명은 MCP 서버로 사용하기 문서에 있습니다.)

아래에서 발급받은_API_키 는 0단계에서 복사한 여러분의 실제 키(koba-...)로 바꿔야 합니다.

터미널에 아래 한 줄을 붙여 넣고(키만 바꿔서) Enter 합니다.

claude mcp add --transport http bareun https://api.bareun.ai:443/mcp --header "api-key: 발급받은_API_키"

제대로 등록됐는지 확인합니다.

claude mcp list

목록에 bareun 이 보이면 성공입니다. Claude Code 대화 중에 /mcp 라고 입력하면 바른이 제공하는 도구(analyze_syntax 등)도 볼 수 있습니다.

Codex 는 설정 파일(config.toml)에 서버를 적습니다. 파일 위치는 다음과 같습니다.

  • Windows: C:\Users\사용자이름\.codex\config.toml
  • macOS: ~/.codex/config.toml (홈 폴더 안의 .codex 폴더)

이 파일을 메모장(또는 텍스트 편집기)으로 열어 맨 아래에 아래 내용을 추가하고 저장합니다. (발급받은_API_키 만 바꾸세요.)

[mcp_servers.bareun]
url = "https://api.bareun.ai:443/mcp"
http_headers = { "api-key" = "발급받은_API_키" }

파일을 찾거나 만드는 게 어렵다면

Codex 를 실행한 상태에서 이렇게 말로 부탁해도 됩니다 — "내 ~/.codex/config.toml 파일에 바른 MCP 서버를 추가해 줘. url 은 https://api.bareun.ai:443/mcp 이고, http_headers 의 api-key 는 koba-... 로 해 줘." Codex 가 파일을 만들고 내용을 채워 줍니다. 저장 후 Codex 를 한 번 껐다 켜면 반영됩니다.

바른 MCP 는 맞춤법 검사기가 포함된 바른에서 제공됩니다

위 클라우드 주소(api.bareun.ai)는 맞춤법 검사가 포함된 바른이라 MCP 를 바로 쓸 수 있습니다. 회사 안에 직접 설치한 바른을 연결한다면, 주소를 그 서버 주소로 바꾸고 맞춤법 검사기가 포함된 바른인지 확인하세요(형태소 분석 전용 바른에는 /mcp 가 없습니다).


4단계: 분석할 엑셀 파일 준비하기

빅카인즈에서 ‘엑셀 다운로드’를 하면 보통 아래와 같은 열(칼럼) 들이 있는 파일이 나옵니다. 이 중 분석에 쓰는 건 주로 제목·본문(실제 문장이 든 칸)입니다.

자주 보이는 열 이름 내용 분석에 쓰나요?
일자 기사 날짜(예: 20260105) 기간별로 나눌 때
언론사 매체 이름 매체별로 나눌 때
제목 기사 제목 문장 ✅ 키워드 추출 대상
본문 기사 본문 문장 ✅ 키워드 추출 대상
키워드 빅카인즈가 미리 뽑아 둔 단어 참고용
URL 기사 주소 보통 안 씀

예시 파일로 먼저 연습해 보세요

실제 파일과 같은 모양의 작은 예시 엑셀을 준비했습니다. 내 파일이 없거나 구조가 헷갈릴 때 이걸로 먼저 따라 해 보세요. → 예시 엑셀 파일 내려받기 (bigkinds-sample.xlsx)

이 예시는 뉴스 12건이 들어 있고, 위 표와 같은 열을 가지고 있습니다. 여러분의 진짜 파일 (문장 1만 건 이상)도 열 구조만 비슷하면 똑같은 방법으로 분석됩니다.

파일을 한 폴더에 두세요. 예를 들어 바탕화면에 키워드분석 폴더를 만들고 그 안에 엑셀 파일 (예: news.xlsx)을 넣습니다. 그리고 그 폴더 안에서 AI 코딩 도구를 실행하면, AI 가 그 파일을 바로 찾을 수 있어 편합니다.

cd $HOME\Desktop\키워드분석
claude

(Codex 를 쓰면 마지막 줄을 codex 로 바꾸세요.)

cd ~/Desktop/키워드분석
claude

(Codex 를 쓰면 마지막 줄을 codex 로 바꾸세요.)

폴더로 ‘이동’이 어렵다면

Windows 탐색기(또는 macOS 파인더)에서 그 폴더를 연 다음, AI 도구를 실행하고 "내 바탕화면의 키워드분석 폴더에 있는 news.xlsx 를 분석하고 싶어" 라고 경로를 말로 알려 줘도 됩니다.


5단계: 말로 분석 요청하기 (복붙용 프롬프트)

여기가 핵심입니다. AI 코딩 도구를 실행한 상태에서, 아래 요청문을 그대로 복사해 붙여 넣고 Enter 하세요. 파일 이름(news.xlsx)과 열 이름(본문)만 여러분 것에 맞게 바꾸면 됩니다.

복사해서 붙여 넣을 요청문

아래 폴더에 있는 엑셀 파일 news.xlsx 를 분석해 줘.

  1. 본문 열(없으면 제목 열)에 든 문장들을 대상으로 해.
  2. 바른(bareun) MCP 의 형태소 분석으로 각 문장에서 명사(일반명사 NNG·고유명사 NNP)만 뽑아 줘. 한 글자짜리 명사와 의미가 약한 의존명사(NNB)는 빼 줘.
  3. 뽑은 명사들의 등장 횟수를 모두 합쳐 빈도 순위를 매겨 줘.
  4. 결과를 키워드결과.xlsx 라는 새 엑셀 파일로 저장해 줘. 열은 키워드, 빈도 두 개로.
  5. 상위 20개로 막대그래프도 그려서 이미지 파일로 저장해 줘.

문장이 아주 많으니(수천~수만 건), 한 건씩 묻지 말고 효율적으로 한 번에 처리하는 방법으로 진행해 줘. 중간에 필요한 파이썬 패키지가 있으면 설치해도 좋아.

AI 가 계획을 설명한 뒤, 엑셀을 읽고 → 바른으로 명사를 뽑고 → 빈도를 세어 → 결과 파일을 만드는 코드를 스스로 작성하고 실행합니다. 진행 중에 "이 명령을 실행해도 될까요?" 또는 "이 도구를 사용해도 될까요?" 라고 물으면 예/허용(Yes/Allow) 을 선택하세요.

Claude Code 는 파일을 읽거나 명령을 실행하기 전에 허용을 물어봅니다. Yes 를 누르면 진행합니다. 바른 도구(analyze_syntax)를 쓸 때도 허용을 물을 수 있습니다.

Codex 도 명령 실행 전에 승인을 요청합니다. 화면 안내에 따라 승인하면 진행합니다.

문장이 1만 건이 넘는데 괜찮나요? — 바른을 쓰는 두 가지 방식

적은 양(수십~수백 문장)은 AI 가 바른 MCP 도구를 직접 호출해 바로 분석합니다. 여러분 파일처럼 수천~수만 문장일 때는, AI 가 같은 바른 서비스·같은 API 키를 쓰는 짧은 파이썬 프로그램(바른 파이썬 라이브러리 bareunpy)을 만들어 한 번에 빠르게 처리합니다. 둘 다 분석 품질은 같은 바른이며, 여러분은 어느 쪽이든 코드를 만질 필요가 없습니다. 위 요청문의 마지막 문단이 AI 에게 이 효율적인 방식을 택하도록 알려 줍니다.


6단계: 결과 받아 보기

AI 가 작업을 마치면 폴더에 키워드결과.xlsx (그리고 막대그래프 이미지)가 생깁니다. 엑셀을 열면 아래처럼 자주 나온 키워드 순위가 보입니다(예시 파일로 돌렸을 때의 모습).

키워드 빈도
인공지능 9
반도체 6
수출 6
정부 3
교육 2

조사·어미가 떨어져 나가 인공지능·반도체 같은 핵심어가 또렷하게 모였습니다. 결과가 마음에 들지 않으면 다시 말로 고쳐 달라고 하면 됩니다 — 예: "숫자만 있는 건 빼 줘", "상위 50개로 늘려 줘", "엑셀 말고 CSV 로도 저장해 줘".


더 해보기 — 응용 요청문 모음

같은 방식으로, 아래 문장을 이어서 말하면 분석을 더 깊게 할 수 있습니다.

하고 싶은 일 이렇게 말하세요
인명·기관·지명만 보기 "고유명사(NNP)만 뽑아서 자주 나온 인물·기관 순위를 따로 만들어 줘."
월별 추이 보기 "일자 열을 월 단위로 묶어서, 달마다 키워드 상위 10개가 어떻게 달라지는지 표로 만들어 줘."
언론사별 비교 "언론사 열로 나눠서 매체마다 자주 쓰는 키워드를 비교해 줘."
불용어 빼기 "‘기자·오늘·관련’ 같은 의미 없는 단어 목록을 만들어 결과에서 빼 줘."
워드클라우드 "상위 키워드로 워드클라우드 이미지도 만들어 줘."
두 글자 이상만 "한 글자 명사는 빼고 두 글자 이상 명사만 세어 줘."

고유명사(NNP)가 강한 이유

바른은 빅카인즈 뉴스 1억 어절을 포함한 대규모 말뭉치로 학습되어, 인명·기관명 같은 시사 고유명사 인식에 강합니다. 뉴스 데이터의 인물·조직 분석에 특히 잘 맞습니다. 자세한 사례는 뉴스 핵심어 추출 문서를 참고하세요.


잘 안 될 때 (문제 해결)

python 을 입력했는데 "찾을 수 없다"고 나와요

설치할 때 Add Python to PATH 체크를 놓친 경우가 가장 많습니다. 파이썬을 다시 설치하면서 그 체크박스를 꼭 켜 주세요. 그래도 안 되면 터미널을 닫았다가 다시 열어 보세요. macOS 에서는 python 대신 python3 로 입력해야 할 수 있습니다.

AI 도구에서 바른(bareun)이 안 보여요

  • Claude Code: claude mcp listbareun 이 있는지, 대화 중 /mcp 로 도구가 보이는지 확인하세요. 주소 끝에 /mcp 가 붙었는지, api-key 헤더에 진짜 키를 넣었는지 보세요.
  • Codex: config.toml 을 저장한 뒤 Codex 를 껐다 켰는지 확인하세요. 주소·키 오타도 살펴보세요.

"권한이 없다 / 키가 거부됐다(401)" 같은 메시지가 나와요

API 키가 틀렸거나, koba- 앞뒤로 공백·따옴표가 잘못 들어간 경우입니다. 0단계에서 키를 다시 복사해 정확히 붙여 넣으세요. 키 발급·사용량은 클라우드에서 사용하기를 보세요.

문장이 너무 많아서 오래 걸려요

수만 건이면 몇 분 이상 걸릴 수 있습니다. AI 에게 "먼저 100건만 시험 삼아 돌려서 결과 모양을 보여 주고, 괜찮으면 전체를 돌려 줘" 라고 하면 안전하게 확인하며 진행할 수 있습니다.

결과 키워드에 이상한 단어가 섞여요

기자, , 같은 단어가 거슬리면 "이 단어들을 불용어로 빼 줘" 라고 목록을 주세요. 의존명사(NNB)나 한 글자 명사를 빼 달라고 해도 깔끔해집니다.


자주 묻는 질문

Q. 정말 코드를 한 줄도 안 써도 되나요?

네. 코드는 AI 코딩 도구가 작성하고 실행합니다. 여러분은 한국어로 무엇을 원하는지 말하고, 실행 허용을 눌러 주기만 하면 됩니다. 결과가 마음에 안 들면 말로 고쳐 달라고 하면 됩니다.

Q. 파이썬은 왜 설치하나요? 제가 파이썬을 배워야 하나요?

아니요. 파이썬은 AI 가 만든 분석 코드를 돌리는 엔진일 뿐, 여러분이 배우거나 직접 다룰 필요는 없습니다. 한 번 설치해 두면 그 뒤로는 신경 쓸 일이 없습니다.

Q. 바른 MCP 만으로 1만 건을 다 분석하나요?

적은 양은 AI 가 바른 MCP 도구를 직접 호출해 분석하고, 수천~수만 건처럼 많을 때는 AI 가 같은 바른 서비스·같은 API 키를 쓰는 짧은 파이썬 프로그램(bareunpy)을 만들어 한 번에 빠르게 처리합니다. 어느 쪽이든 분석 품질은 같은 바른이고, 여러분이 코드를 만질 일은 없습니다.

Q. Claude Code 와 Codex 중 무엇이 더 좋나요?

둘 다 이 작업을 잘합니다. 이미 쓰고 있는 구독(Claude 또는 ChatGPT)에 맞춰 하나만 고르면 됩니다. 등록 방법만 다를 뿐, 분석을 맡기는 방식(말로 요청)은 같습니다.

Q. 엑셀이 아니라 CSV·텍스트 파일이어도 되나요?

됩니다. 요청문에서 파일 이름만 바꾸고 "CSV 파일이야" 라고 알려 주면 AI 가 맞춰 읽습니다. 결과도 엑셀·CSV·이미지 등 원하는 형태로 저장해 달라고 할 수 있습니다.

Q. 분석 결과의 명사가 잘못 잡히면 어떻게 하나요?

학습 시점 이후 등장한 새 인물·기관명 등은 사용자 사전에 등록하면 바른이 한 단어로 인식합니다. AI 에게 사용자 사전 등록을 부탁할 수도 있습니다.

관련 문서

도움이 되었나요?