LLM 용어, 까보면 다 API 호출이다 — RAG · Tool Calling · Agent 정리
AI 프로젝트를 시작하면서 가장 거슬렸던 건 용어였다. LLM API, RAG, Tool Calling, Function Calling, Agent... 다들 무슨 대단한 기술처럼 말하는데, 막상 들여다보니 본질은 하나였다. "남이 만든 모델한테 프롬프트 보내고 답 받기." 그게 전부다.
이 글은 그 거품을 한 번 걷어내고, 각 용어가 실제로 가리키는 기술적 차이가 뭔지 코드로 정리한 기록이다.

공통 기반: 전부 "모델 API 호출"이다
먼저 짚고 갈 것. LLM API, RAG, Tool Calling, Agent — 이것들의 밑바닥은 전부 동일하다. 모델에 텍스트를 보내고 텍스트를 받는다. 차이는 그 호출을 어떻게 구성하고, 몇 번 하고, 중간에 뭘 끼우느냐일 뿐이다.
요리에 비유하면 다 "불로 가열하기"인데, 굽기·볶기·삶기로 이름이 나뉜 것과 같다. 불을 쓰는 건 똑같다.
1. LLM API 호출 — 가장 기본
프롬프트 보내고 답 받기. 1회 호출로 끝.
import { generateText } from "ai";
import { google } from "@ai-sdk/google";
const { text } = await generateText({
model: google("gemini-2.5-flash"

