왜 필요한가?
Claude 는 학습 데이터 컷오프 이후의 웹 페이지를 직접 읽지 못합니다. 보통 별도 스크래퍼·헤드리스 브라우저를 띄워 결과를 정리하고 컨텍스트에 다시 붙여 넣는 흐름이 반복됐는데, 페이지마다 자바스크립트 렌더링·복잡한 마크업·로그인 흐름이 다 달라 직접 구현 비용이 큽니다.
Firecrawl MCP 는 그 단계를 통째로 위임합니다 — Claude 가 직접 도구를 호출하면 Firecrawl 이 페이지를 가져와 LLM 이 바로 읽을 수 있는 정제된 markdown / 구조화 JSON 으로 변환해 돌려줍니다.
핵심 기능 — 12 개 이상의 도구
-
스크래핑 —
firecrawl_scrape/firecrawl_batch_scrape/firecrawl_check_batch_status단일 URL 을 JSON·markdown·branding 포맷으로 추출하거나, 이미 알고 있는 URL 다수를 병렬 일괄 처리합니다. 배치는 비동기로 돌아가며
firecrawl_check_batch_status로 진행 상황을 폴링. -
사이트 탐색 —
firecrawl_map/firecrawl_crawl/firecrawl_check_crawl_statusfirecrawl_map으로 한 사이트의 인덱싱된 URL 을 한 번에 발견하고,firecrawl_crawl로 깊이·페이지 수 제한을 두어 다중 페이지를 수집합니다. crawl 도 비동기로 polling 필요. -
웹 검색 —
firecrawl_search검색 결과를 가져오면서 선택적으로 각 결과의 본문까지 함께 추출합니다.
-
구조화 추출 —
firecrawl_extract대상 페이지에 LLM 을 적용해 사용자가 지정한 스키마대로 구조화된 데이터를 뽑습니다. 단순 텍스트가 아닌 JSON 결과가 필요할 때.
-
자율 리서치 에이전트 —
firecrawl_agent/firecrawl_agent_status주제를 던지면 여러 출처를 가로질러 비동기로 리서치를 수행합니다. 진행 상황은
firecrawl_agent_status로 확인. -
인터랙티브 페이지 자동화 —
firecrawl_interact클릭·입력·내비게이션 같은 페이지 인터랙션을 자동화합니다. 정적 스크래핑으로는 닿지 못하는 흐름에 사용.
-
클라우드 브라우저 세션 —
firecrawl_browser_*(Deprecated)firecrawl_browser_create/execute/list/delete도구가 있지만 deprecated 표기. 새 통합은 위의 다른 도구를 사용하는 게 안전합니다.
설치 방법
Claude Code (권장)
claude mcp add firecrawl \
--env FIRECRAWL_API_KEY="fc-YOUR_API_KEY" \
-- npx -y firecrawl-mcp
npx 직접 실행
env FIRECRAWL_API_KEY=fc-YOUR_API_KEY npx -y firecrawl-mcp
Claude Desktop · Cursor · Windsurf · VS Code — 각 클라이언트의 mcpServers JSON 설정에 다음을 추가:
{
"mcpServers": {
"mcp-server-firecrawl": {
"command": "npx",
"args": ["-y", "firecrawl-mcp"],
"env": { "FIRECRAWL_API_KEY": "YOUR_API_KEY_HERE" }
}
}
}
설정 파일 위치는 클라이언트마다 다릅니다 — Claude Desktop 은 claude_desktop_config.json, Cursor 는 v0.48.6+ 의 Settings → Features → MCP Servers, Windsurf 는 ./codeium/windsurf/model_config.json.
HTTP Streamable 모드 — 공유 환경이나 원격 호출용.
env HTTP_STREAMABLE_SERVER=true FIRECRAWL_API_KEY=fc-YOUR_API_KEY npx -y firecrawl-mcp
# http://localhost:3000/mcp 에서 접근
Self-Hosted Firecrawl — FIRECRAWL_API_URL 환경변수로 자체 호스팅한 Firecrawl 인스턴스를 가리키면 클라우드 API 키 없이 동작합니다(자체 인스턴스가 별도 인증을 요구하지 않는 경우).
환경 변수
| 변수 | 필수 | 기본값 | 설명 |
|---|---|---|---|
FIRECRAWL_API_KEY | ✅ (클라우드 사용 시) | — | Firecrawl 클라우드 API 키. https://www.firecrawl.dev/app/api-keys 에서 발급 |
FIRECRAWL_API_URL | 클라우드 기본 | 자체 호스팅 인스턴스 URL — 설정 시 클라우드 API 우회 | |
FIRECRAWL_RETRY_MAX_ATTEMPTS | 3 | 재시도 횟수 | |
FIRECRAWL_RETRY_INITIAL_DELAY | 1000ms | 첫 재시도 지연 | |
FIRECRAWL_RETRY_MAX_DELAY | 10000ms | 최대 재시도 지연 | |
FIRECRAWL_RETRY_BACKOFF_FACTOR | 2 | 지수 백오프 배수 | |
FIRECRAWL_CREDIT_WARNING_THRESHOLD | 1000 | 잔여 크레딧 경고 임계 | |
FIRECRAWL_CREDIT_CRITICAL_THRESHOLD | 100 | 잔여 크레딧 위급 임계 |
알아두면 좋은 점
- 공식 Firecrawl 운영 —
github.com/firecrawl조직이 직접 배포·유지. 비공식 래퍼와 구분됩니다. - Firecrawl 은 별도 서비스 — Y Combinator 백업 회사 firecrawl.dev 의 클라우드 인프라를 사용합니다. 무료 플랜은 월 1,000 크레딧 — 검색 결과·페이지 스크래핑 1건당 1 크레딧, 인터랙션 1건당 5 크레딧. 실패 요청은 일반적으로 과금되지 않습니다.
- Self-Host 옵션 — 데이터 통제·비용 둘 다 직접 관리하고 싶을 때
FIRECRAWL_API_URL로 자체 인스턴스를 가리킬 수 있습니다. - 자동 재시도 + 크레딧 모니터링 내장 — 지수 백오프 기반 재시도와 잔여 크레딧 경고가 환경변수로 튜닝됩니다.
- 백엔드 엔진은 Firecrawl 오픈소스 — 이 MCP 가 호출하는 API 의 실체는 AGPL-3.0 으로 공개된
firecrawl/firecrawl엔진(★ 118k).FIRECRAWL_API_URL로 self-host 인스턴스를 가리키면 클라우드 의존 없이도 동일한 도구 셋이 동작. - claude.com/plugins/firecrawl 플러그인이 별도로 존재 — 같은 Firecrawl 통합이지만 Claude Code 전용 슬래시 명령(
/firecrawl:scrape등) 기반의 다른 배포 경로입니다. 이 MCP 서버는 표준 MCP 도구 호출(firecrawl_scrape등) 기반이라 Cursor·Windsurf·VS Code 등 다른 클라이언트에서도 동일하게 동작. - MIT 라이선스 — 영리 사용 포함 자유 활용 가능.