트레이싱
Agents SDK에는 내장 트레이싱이 포함되어 있어, 에이전트 실행 중 발생하는 이벤트(LLM 생성, 도구 호출, 핸드오프, 가드레일, 사용자 정의 이벤트 등)에 대한 포괄적인 기록을 수집합니다. Traces 대시보드를 사용하면 개발 중과 프로덕션에서 워크플로를 디버그하고, 시각화하고, 모니터링할 수 있습니다
Note
트레이싱은 기본적으로 활성화되어 있습니다. 다음의 세 가지 일반적인 방법으로 비활성화할 수 있습니다:
- 환경 변수
OPENAI_AGENTS_DISABLE_TRACING=1을 설정하여 전역적으로 트레이싱을 비활성화할 수 있습니다 - 코드에서
set_tracing_disabled(True)로 전역적으로 트레이싱을 비활성화할 수 있습니다 - 단일 실행에 대해
agents.run.RunConfig.tracing_disabled를True로 설정하여 트레이싱을 비활성화할 수 있습니다
OpenAI API를 사용하며 Zero Data Retention (ZDR) 정책 하에서 운영되는 조직의 경우, 트레이싱을 사용할 수 없습니다.
트레이스 및 스팬
- 트레이스는 하나의 "워크플로"에 대한 단일 엔드투엔드 작업을 나타냅니다. 트레이스는 스팬으로 구성됩니다. 트레이스에는 다음 속성이 있습니다:
workflow_name: 논리적 워크플로 또는 앱입니다. 예: "Code generation", "Customer service"trace_id: 트레이스의 고유 ID입니다. 전달하지 않으면 자동 생성됩니다. 형식은trace_<32_alphanumeric>이어야 합니다group_id: 선택적 그룹 ID로, 동일한 대화의 여러 트레이스를 연결하는 데 사용합니다. 예를 들어 채팅 스레드 ID를 사용할 수 있습니다disabled: True이면 트레이스가 기록되지 않습니다metadata: 트레이스에 대한 선택적 메타데이터입니다
- 스팬은 시작 시간과 종료 시간이 있는 작업을 나타냅니다. 스팬에는 다음이 있습니다:
started_at및ended_at타임스탬프trace_id: 해당 스팬이 속한 트레이스를 나타냅니다parent_id: 이 스팬의 부모 스팬(있는 경우)을 가리킵니다span_data: 스팬에 대한 정보입니다. 예를 들어AgentSpanData는 에이전트 정보를,GenerationSpanData는 LLM 생성 정보를 포함합니다
기본 트레이싱
기본적으로 SDK는 다음을 트레이싱합니다:
- 전체
Runner.{run, run_sync, run_streamed}()는trace()로 래핑됩니다 - 에이전트가 실행될 때마다
agent_span()으로 래핑됩니다 - LLM 생성은
generation_span()으로 래핑됩니다 - 함수 도구 호출은 각각
function_span()으로 래핑됩니다 - 가드레일은
guardrail_span()으로 래핑됩니다 - 핸드오프는
handoff_span()으로 래핑됩니다 - 오디오 입력(음성-텍스트)은
transcription_span()으로 래핑됩니다 - 오디오 출력(텍스트-음성)은
speech_span()으로 래핑됩니다 - 관련 오디오 스팬은
speech_group_span()아래에 부모-자식으로 배치될 수 있습니다
기본적으로 트레이스 이름은 "Agent workflow"입니다. trace를 사용하면 이 이름을 설정할 수 있고, RunConfig로 이름과 기타 속성을 구성할 수도 있습니다.
또한 사용자 정의 트레이스 프로세서를 설정하여 트레이스를 다른 대상으로 전송할 수 있습니다(대체 또는 보조 대상).
장기 실행 워커와 즉시 내보내기
기본 BatchTraceProcessor는 몇 초마다 백그라운드에서
트레이스를 내보내거나, 메모리 내 큐가 크기 임계값에 도달하면 더 빨리 내보내며,
프로세스가 종료될 때 최종 flush도 수행합니다. Celery,
RQ, Dramatiq 또는 FastAPI 백그라운드 작업과 같은 장기 실행 워커에서는 이는 일반적으로 트레이스가
추가 코드 없이 자동으로 내보내된다는 의미이지만, 각 작업이
완료된 직후에는 Traces 대시보드에 즉시 표시되지 않을 수 있습니다.
작업 단위 종료 시 즉시 전달 보장이 필요하다면
트레이스 컨텍스트가 종료된 후 flush_traces()를 호출하세요.
from agents import Runner, flush_traces, trace
@celery_app.task
def run_agent_task(prompt: str):
try:
with trace("celery_task"):
result = Runner.run_sync(agent, prompt)
return result.final_output
finally:
flush_traces()
from fastapi import BackgroundTasks, FastAPI
from agents import Runner, flush_traces, trace
app = FastAPI()
def process_in_background(prompt: str) -> None:
try:
with trace("background_job"):
Runner.run_sync(agent, prompt)
finally:
flush_traces()
@app.post("/run")
async def run(prompt: str, background_tasks: BackgroundTasks):
background_tasks.add_task(process_in_background, prompt)
return {"status": "queued"}
flush_traces()는 현재 버퍼링된 트레이스와 스팬이
내보내질 때까지 블로킹하므로, 부분적으로 구성된 트레이스를 flush하지 않도록 trace()가 닫힌 뒤에
호출해야 합니다. 기본 내보내기 지연 시간이 허용 가능하다면
이 호출을 생략할 수 있습니다.
상위 수준 트레이스
때로는 여러 run() 호출을 하나의 트레이스에 포함하고 싶을 수 있습니다. 전체 코드를 trace()로 래핑하면 가능합니다.
from agents import Agent, Runner, trace
async def main():
agent = Agent(name="Joke generator", instructions="Tell funny jokes.")
with trace("Joke workflow"): # (1)!
first_result = await Runner.run(agent, "Tell me a joke")
second_result = await Runner.run(agent, f"Rate this joke: {first_result.final_output}")
print(f"Joke: {first_result.final_output}")
print(f"Rating: {second_result.final_output}")
- 두 번의
Runner.run호출이with trace()로 래핑되어 있으므로, 개별 실행은 각각 두 개의 트레이스를 생성하는 대신 전체 트레이스의 일부가 됩니다
트레이스 생성
trace() 함수를 사용해 트레이스를 생성할 수 있습니다. 트레이스는 시작과 종료가 필요합니다. 방법은 두 가지입니다:
- 권장: 트레이스를 컨텍스트 매니저로 사용합니다. 즉,
with trace(...) as my_trace형태로 사용합니다. 이렇게 하면 적절한 시점에 트레이스가 자동으로 시작되고 종료됩니다 trace.start()와trace.finish()를 수동으로 호출할 수도 있습니다
현재 트레이스는 Python contextvar를 통해 추적됩니다. 즉, 동시성 환경에서도 자동으로 동작합니다. 트레이스를 수동으로 시작/종료하는 경우, 현재 트레이스를 갱신하기 위해 start()/finish()에 mark_as_current와 reset_current를 전달해야 합니다.
스팬 생성
다양한 *_span() 메서드를 사용해 스팬을 생성할 수 있습니다. 일반적으로 스팬을 수동으로 생성할 필요는 없습니다. 사용자 정의 스팬 정보를 추적하기 위해 custom_span() 함수를 사용할 수 있습니다.
스팬은 자동으로 현재 트레이스의 일부가 되며, Python contextvar로 추적되는 가장 가까운 현재 스팬 아래에 중첩됩니다.
민감한 데이터
일부 스팬은 잠재적으로 민감한 데이터를 캡처할 수 있습니다.
generation_span()은 LLM 생성의 입력/출력을 저장하고, function_span()은 함수 호출의 입력/출력을 저장합니다. 여기에는 민감한 데이터가 포함될 수 있으므로 RunConfig.trace_include_sensitive_data를 통해 해당 데이터 캡처를 비활성화할 수 있습니다.
마찬가지로 오디오 스팬은 기본적으로 입력 및 출력 오디오에 대한 base64 인코딩 PCM 데이터를 포함합니다. VoicePipelineConfig.trace_include_sensitive_audio_data를 구성하여 이 오디오 데이터 캡처를 비활성화할 수 있습니다.
기본적으로 trace_include_sensitive_data는 True입니다. 앱 실행 전에 OPENAI_AGENTS_TRACE_INCLUDE_SENSITIVE_DATA 환경 변수를 true/1 또는 false/0으로 설정하면 코드 변경 없이 기본값을 지정할 수 있습니다.
사용자 정의 트레이싱 프로세서
트레이싱의 상위 수준 아키텍처는 다음과 같습니다:
- 초기화 시, 트레이스 생성을 담당하는 전역 [
TraceProvider][agents.tracing.setup.TraceProvider]를 생성합니다 TraceProvider를BatchTraceProcessor로 구성하며, 이 프로세서는 트레이스/스팬을 배치로BackendSpanExporter에 전송하고, 익스포터는 스팬과 트레이스를 배치로 OpenAI 백엔드에 내보냅니다
이 기본 구성을 사용자 지정하여 트레이스를 대체 또는 추가 백엔드로 전송하거나 익스포터 동작을 수정하려면 두 가지 방법이 있습니다:
add_trace_processor()를 사용하면 준비되는 대로 트레이스와 스팬을 수신하는 추가 트레이스 프로세서를 추가할 수 있습니다. 이를 통해 OpenAI 백엔드로 전송하는 것 외에 자체 처리를 수행할 수 있습니다set_trace_processors()를 사용하면 기본 프로세서를 사용자 정의 트레이스 프로세서로 대체할 수 있습니다. 이 경우 해당 기능을 수행하는TracingProcessor를 포함하지 않으면 트레이스는 OpenAI 백엔드로 전송되지 않습니다
비-OpenAI 모델에서의 트레이싱
트레이싱을 비활성화하지 않고도 OpenAI Traces 대시보드에서 무료 트레이싱을 활성화하려면 비-OpenAI 모델과 함께 OpenAI API 키를 사용할 수 있습니다. 어댑터 선택 및 설정 시 주의사항은 Models 가이드의 Third-party adapters 섹션을 참조하세요.
import os
from agents import set_tracing_export_api_key, Agent, Runner
from agents.extensions.models.any_llm_model import AnyLLMModel
tracing_api_key = os.environ["OPENAI_API_KEY"]
set_tracing_export_api_key(tracing_api_key)
model = AnyLLMModel(
model="your-provider/your-model-name",
api_key="your-api-key",
)
agent = Agent(
name="Assistant",
model=model,
)
단일 실행에 대해서만 다른 트레이싱 키가 필요하다면 전역 익스포터를 변경하는 대신 RunConfig를 통해 전달하세요.
from agents import Runner, RunConfig
await Runner.run(
agent,
input="Hello",
run_config=RunConfig(tracing={"api_key": "sk-tracing-123"}),
)
추가 참고 사항
- Openai Traces 대시보드에서 무료 트레이스를 확인하세요
에코시스템 통합
다음 커뮤니티 및 벤더 통합은 OpenAI Agents SDK 트레이싱 표면을 지원합니다