2025년 7월 AI: 단순한 ‘생성’을 넘어 ‘행동’하는 에이전트 시대의 개막

2025년 7월 AI

숨 가쁘게 발전하는 인공지능 기술의 흐름 속에서, 우리는 얼마나 많은 전환점을 무심코 지나치고 있을까요? 2025년 7월은 바로 그런 결정적인 변곡점이었습니다.

이 시점부터 AI는 단순히 주어진 프롬프트에 따라 텍스트를 생성하는 수동적인 도구에서 벗어나, 스스로 추론하고 외부 세계와 상호작용하며 복잡한 과업을 수행하는 능동적인 ‘에이전트’로 근본적인 전환을 시작했습니다.

이 글에서는 2025년 7월을 기점으로 AI의 미래를 형성하고 있는 가장 중요한 5가지 트렌드를 심도 있게 분석합니다.

1. AI 에이전트 생태계 표준

인간이 앱을 사용해 세상과 소통하듯, AI가 진정으로 유용해지려면 외부 도구와 상호작용할 수 있어야 합니다.

2025년 7월은 바로 이 상호작용을 위한 표준화된 ‘중앙 신경망’이 업계를 지배하기 시작한 달이었습니다.

모델 컨텍스트 프로토콜(MCP)이라는 표준이 등장하며 AI 에이전트의 도구 사용을 확장 가능하고 보편적인 것으로 만들었고, 이는 거대한 생태계의 탄생을 예고했습니다.

에이전트들의 언어, MCP의 표준화

모델 컨텍스트 프로토콜(MCP)은 AI 모델이 API, 데이터베이스, 파일 시스템과 같은 외부 도구를 사용할 때마다 개별적인 맞춤 통합 없이도 소통할 수 있게 하는 보편적 표준입니다 [4, 6].

이것이 왜 기념비적인 변화일까요? 이는 마치 모든 전자기기가 각자의 충전기를 버리고 범용 USB 포트로 통일되는 것과 같습니다. MCP는 AI 모델 개발과 도구 개발을 분리(decoupling)함으로써, AI의 능력을 사고파는 거대하고 개방된 시장을 창출했습니다.

개발자들은 더 이상 특정 모델에 종속된 도구를 만들 필요 없이, MCP 표준만 준수하면 어떤 AI 모델이든 자신의 도구를 활용할 수 있게 된 것입니다.

2025년 7월 기준으로, 이 시장에는 이미 40개 이상의 카테고리에 걸쳐 4,000개가 넘는 MCP 서버가 존재했습니다 [5].

Cognition AI의 결정적 한 수: Windsurf 인수와 데빈 MCP 마켓플레이스

이러한 생태계의 잠재력을 가장 먼저 꿰뚫어 본 곳은 Cognition AI였습니다.

2025년 7월, 이들은 두 가지 결정적인 전략적 움직임을 보였습니다. 7월 14일에는 ‘에이전트 통합개발환경(Agentic IDE)’이라 불리는 Windsurf를 인수했고 [7],

7월 22일에는 사용자가 직접 MCP 서버를 연결할 수 있는 데빈 MCP 마켓플레이스(Devin MCP Marketplace)를 출시했습니다 [7].

이 두 가지 사건은 소프트웨어 개발의 미래가 ‘AI의 도움을 받는 코딩’에서 ‘AI와 협력하는 코딩’으로 전환되고 있음을 명확히 보여줍니다.

이제 AI 에이전트는 인간 개발자와 동등한 파트너로서, 표준화된 도구 생태계에 완전히 접근하며 프로젝트에 참여하게 된 것입니다.

에이전트의 신경망이 표준화되면서, 이제 그 신경망을 구동할 강력하고 접근성 높은 ‘뇌’가 필요해졌습니다.

2. 내 손안의 AI

지금까지 최고 수준의 AI 추론 능력은 비싼 비용을 지불해야 하는 클라우드 기반의 독점 모델에 갇혀 있었습니다.

하지만 2025년 7월은 오픈소스 모델이 성능 저하 없이 개인용 컴퓨터에서 로컬로 실행될 만큼 강력해진 전환점이었습니다. 이 모든 것은 특정 아키텍처의 혁신 덕분이었습니다.

클라우드 의존성의 종말: MoE 아키텍처의 혁신

MoE(Mixture-of-Experts) 아키텍처는 모델이 거대한 총 파라미터 수를 가지면서도, 특정 작업을 처리할 때는 그중 일부 전문가(expert) 모듈만 활성화하는 방식입니다 [8].

이는 마치 한 두뇌 안에 시인, 수학자, 프로그래머 등 수많은 전문가 라이브러리를 갖추고, 특정 질문에 가장 관련 있는 전문가 한두 명만 불러내어 답하게 하는 것과 같습니다.

이를 통해 모델은 엄청난 효율성을 달성하며, 적은 컴퓨팅 자원으로도 높은 성능을 낼 수 있게 되었습니다.

두 거인의 참전: OpenAI의 gpt-oss-20b와 Alibaba의 Qwen3

2025년 7월, 두 개의 강력한 MoE 기반 오픈소스 모델이 공개되며 이러한 흐름을 가속화했습니다.

ModelRelease DateParameter Count (Total/Active)ArchitecturePrimary Optimization
gpt-oss-20bJuly 202521B / ~3.6BMixture-of-Experts (MoE)Local Reasoning & STEM
Qwen3-30B-A3B-Instruct-2507July 202530B / 3BMixture-of-Experts (MoE)Software Engineering & Tool Calling

이 모델들의 등장은 AI 환경의 근본적인 권력 이동을 의미했습니다. 독점적인 클라우드 기반 시스템이 가졌던 기술적 해자(moat)를 허물어뜨린 것입니다.

이제 개발자들은 클라우드 API의 비용, 지연 시간, 개인정보 침해 위험 없이도 자신의 컴퓨터에서 정교한 추론 모델을 실행할 수 있게 되었습니다.

이는 거대 클라우드 기업의 종속성(vendor lock-in)에서 벗어나, 독립적이고 안전한 AI 개발의 새로운 물결을 일으키는 중요한 변화입니다 [8].

추론 능력이 로컬 환경에서 민주화되자, 에이전트 혁명의 다음 단계는 이 힘에 깊고 실행 가능한 전문 분야 지식을 부여하는 것이었습니다.

3. 전문가 AI의 확산

범용 지능도 유용하지만, 실제 세계에서 가치를 창출하는 것은 종종 깊이 있는 전문 지식입니다.

2025년 7월은 AI 지능의 ‘수직화(verticalization)’가 가속화된 시기였습니다.

특히 의료와 같이 중대한 결정이 요구되는 전문 분야를 위해 설계된 강력한 오픈소스 모델들이 대거 등장했습니다.

의료 AI의 민주화 선언: OpenMed 프로젝트

2025년 7월 16일, OpenMed 프로젝트가 시작되었습니다. 이는 단순한 모델 출시 이상의 의미를 가집니다 [11].

  1. 380개 이상의 최첨단 의료 모델 공개: 종양학, 유전체학, 병리학 등 실제 의료 현장의 ‘운영 현실’에 맞춘 전문 모델들이 포함되었습니다.
  2. 허용적인 아파치 2.0 라이선스: 상업적 활용을 포함한 모든 종류의 사용, 수정, 배포를 허용했습니다.
  3. 현실적인 배포 시나리오 고려: 실시간 CPU 추론을 위한 소형 모델부터 AWS Marketplace를 통한 엔터프라이즈 배포용 대형 모델까지 다양한 크기로 제공되었습니다.

OpenMed는 비싸고 내부를 들여다볼 수 없는 ‘블랙박스’ 시스템이 지배하던 의료 AI 분야에 대한 도전이자, 누구나 최고 수준의 의료 AI를 활용할 수 있도록 하자는 하나의 ‘운동’이었습니다 [11].

과학의 미지를 탐사하는 AI

이 시기 AI는 과학 연구 분야에서도 중요한 도구로 자리 잡기 시작했습니다.

  • BioReason 프레임워크는 DNA 모델과 LLM을 연결하여 유전체 데이터를 분석하고, 그 결과를 자연어 설명으로 제공함으로써 데이터와 인간의 이해 사이의 간극을 메웠습니다 [10].
  • NASA 외계행성 아카이브 분석에서는 AI가 2025년 7월까지 지구형 행성을 찾기 위한 529개의 유력한 K형 왜성(K dwarf) 후보를 식별해냈습니다. 이는 인간의 수동 분석으로는 불가능에 가까운 ‘방대한 데이터 속에서 바늘 찾기’ 문제를 해결한 사례입니다 [12].

이 사례들은 AI가 인간의 능력을 넘어서는 복잡한 과학적 난제를 해결하는 데 필수적인 파트너가 되고 있음을 보여줍니다.

이처럼 AI 모델이 더 복잡하고 전문화된 영역의 문제를 다루게 되면서, 방대한 정보를 장기간에 걸쳐 처리하고 기억하는 능력이 다음 핵심 병목 현상으로 떠올랐습니다.이는 연구의 초점을 모델이 ‘무엇을 아는가’에서 ‘어떻게 기억하는가’로 전환시켰습니다.

4. 더 긴 기억력 vs. 더 똑똑한 기억력

단순히 AI의 기억 용량(context window)을 늘리는 것은 ‘정보 과부하’ 문제에 부딪힙니다.

특히 긴 문서의 중간에 있는 정보를 놓치는 ‘lost in the middle’ 현상은 잘 알려진 한계였습니다.

2025년 7월, 연구자들은 AI의 기억을 무작정 길게 만드는 것에서 더 똑똑하게 만드는 방향으로 전략을 전환하기 시작했습니다.

중요한 것만 기억하는 뇌: Titans 아키텍처

구글의 Titans 아키텍처는 이러한 전환을 상징합니다.

이 구조의 핵심 혁신은 ‘놀라움(surprise)’ 신호를 사용하여 어떤 정보가 중요해서 유지하고, 어떤 정보가 노이즈라서 잊어야 할지를 스스로 판단하는 심층 MLP 메모리입니다.

이를 통해 Titans는 RNN(순환 신경망)과 같은 속도와 트랜스포머와 같은 정확성을 동시에 달성하는 획기적인 성과를 거두었습니다 [9, 10].

AI를 위한 운영체제: MemOS

2025년 7월 4일에 발표된 “MemOS” 논문은 한 걸음 더 나아갔습니다 [2].

컴퓨터의 운영체제가 RAM을 관리하듯, MemOS는 AI의 컨텍스트를 지능적으로 관리해야 할 희소 자원으로 재정의했습니다.

이 개념은 AI의 메모리를 필요에 따라 캐싱하고, 스왑하고, 할당함으로써, 여러 파일과 대화를 장시간에 걸쳐 처리해야 하는 복잡한 에이전트 작업에 필수적인 기반을 제공합니다.

AI의 내부 구조가 정교해짐에 따라, 이를 널리 사용하는 과정에서 발생하는 새롭고 복잡한 도전 과제들도 수면 위로 떠오르기 시작했습니다.

5. 모두가 같은 생각만 한다면? ‘인공적 집단 지성’이라는 새로운 위협

우리가 사용하는 모든 AI 모델이 같은 대답, 같은 아이디어, 같은 해결책만 내놓는다면 어떻게 될까요?

‘다양성 붕괴(diversity collapse)’는 바로 이러한 우려를 현실적인 위협으로 제시했으며, 그 뿌리는 바로 이 시기에 굳어진 훈련 방식에 있었습니다.

이 현상이 공식적으로 명명되고 분석된 것은 2025년 후반 NeurIPS 논문을 통해서였지만, 그 기반은 7월에 자리 잡고 있었습니다 [10].

다양성의 붕괴: ‘Artificial Hivemind’의 경고

“Artificial Hivemind”라는 연구는 서로 다른 LLM들이 개방형 질문에 대해 놀라울 정도로 유사한 답변을 생성하는 현상을 발견했습니다 [10].

연구진이 지목한 원인은 명확했습니다. 대부분의 모델이 동일한 거대 인터넷 데이터셋으로 훈련되고, 유사한 RLHF(인간 피드백 기반 강화학습) 기법으로 미세 조정되기 때문입니다.

아이러니하게도, 에이전트와 도구의 생태계는 점점 더 다양해지는(트렌드 1) 반면, 그들을 구동하는 모델들의 핵심 사고는 위험할 정도로 획일화되고 있었던 것입니다.

이러한 ‘다양성 붕괴’는 창의성을 저해하고 AI 생태계 전반에 걸쳐 시스템적 편향을 강화할 수 있는 심각한 결과를 초래할 수 있으며, AI 안전성과 혁신의 미래를 위한 중대한 도전 과제로 남았습니다.

2025년 7월은 AI가 단순한 생성기를 넘어 행동하는 에이전트로 도약한 결정적인 변곡점이었습니다.

이 한 달 동안 나타난 트렌드들은 서로 맞물려 오늘날 우리가 보는 AI 환경의 청사진을 그렸습니다.

에이전트의 신경망(MCP)이 표준화되고, 새롭게 접근 가능해진 로컬 두뇌(MoE 모델)와 결합하면서, 특정 분야에 통달한 전문가(OpenMed) AI가 등장할 완벽한 조건이 만들어졌습니다.

이러한 새로운 복잡성은 더 스마트한 메모리(Titans/MemOS)를 요구했고, 동시에 ‘인공적 집단 지성’과 같은 시스템적 위험을 노출시켰습니다.

References

  1. https://hippocampus-garden.com/ai_papers_2025/
  2. https://huggingface.co/collections/ajinkyakolhe112/july-2025-top-papers
  3. https://huggingface-paper-explorer.vercel.app/
  4. https://huggingface.co/papers?q=Model%20Context%20Protocol%20(MCP)
  5. https://huggingface.co/papers/2508.07575
  6. https://huggingface.co/papers?q=tool-execution-signaled
  7. https://cognition.ai/blog/1
  8. https://www.kdnuggets.com/top-5-small-ai-coding-models-that-you-can-run-locally
  9. https://www.reddit.com/r/MachineLearning/comments/1pvmrx9/d_best_papers_of_2025/
  10. https://huggingface.co/posts/Kseniase/673116238988658
  11. https://huggingface.co/blog/MaziyarPanahi/openmed-year-in-review-2025
  12. https://huggingface.co/papers/2601.00462

Leave a Comment


목차