트레이싱

Agents SDK에는 내장 트레이싱이 포함되어 있어, 에이전트 실행 중 발생하는 이벤트(LLM 생성, 도구 호출, 핸드오프, 가드레일, 사용자 정의 이벤트 등)에 대한 포괄적인 기록을 수집합니다. Traces 대시보드를 사용하면 개발 중과 프로덕션에서 워크플로를 디버그하고, 시각화하고, 모니터링할 수 있습니다

Note

트레이싱은 기본적으로 활성화되어 있습니다. 다음의 세 가지 일반적인 방법으로 비활성화할 수 있습니다:

환경 변수 OPENAI_AGENTS_DISABLE_TRACING=1을 설정하여 전역적으로 트레이싱을 비활성화할 수 있습니다
코드에서 set_tracing_disabled(True)로 전역적으로 트레이싱을 비활성화할 수 있습니다
단일 실행에 대해 agents.run.RunConfig.tracing_disabled를 True로 설정하여 트레이싱을 비활성화할 수 있습니다

OpenAI API를 사용하며 Zero Data Retention (ZDR) 정책 하에서 운영되는 조직의 경우, 트레이싱을 사용할 수 없습니다.

트레이스 및 스팬

트레이스는 하나의 "워크플로"에 대한 단일 엔드투엔드 작업을 나타냅니다. 트레이스는 스팬으로 구성됩니다. 트레이스에는 다음 속성이 있습니다:
- workflow_name: 논리적 워크플로 또는 앱입니다. 예: "Code generation", "Customer service"
- trace_id: 트레이스의 고유 ID입니다. 전달하지 않으면 자동 생성됩니다. 형식은 trace_<32_alphanumeric>이어야 합니다
- group_id: 선택적 그룹 ID로, 동일한 대화의 여러 트레이스를 연결하는 데 사용합니다. 예를 들어 채팅 스레드 ID를 사용할 수 있습니다
- disabled: True이면 트레이스가 기록되지 않습니다
- metadata: 트레이스에 대한 선택적 메타데이터입니다
스팬은 시작 시간과 종료 시간이 있는 작업을 나타냅니다. 스팬에는 다음이 있습니다:
- started_at 및 ended_at 타임스탬프
- trace_id: 해당 스팬이 속한 트레이스를 나타냅니다
- parent_id: 이 스팬의 부모 스팬(있는 경우)을 가리킵니다
- span_data: 스팬에 대한 정보입니다. 예를 들어 AgentSpanData는 에이전트 정보를, GenerationSpanData는 LLM 생성 정보를 포함합니다

기본 트레이싱

기본적으로 SDK는 다음을 트레이싱합니다:

전체 Runner.{run, run_sync, run_streamed}()는 trace()로 래핑됩니다
에이전트가 실행될 때마다 agent_span()으로 래핑됩니다
LLM 생성은 generation_span()으로 래핑됩니다
함수 도구 호출은 각각 function_span()으로 래핑됩니다
가드레일은 guardrail_span()으로 래핑됩니다
핸드오프는 handoff_span()으로 래핑됩니다
오디오 입력(음성-텍스트)은 transcription_span()으로 래핑됩니다
오디오 출력(텍스트-음성)은 speech_span()으로 래핑됩니다
관련 오디오 스팬은 speech_group_span() 아래에 부모-자식으로 배치될 수 있습니다

기본적으로 트레이스 이름은 "Agent workflow"입니다. trace를 사용하면 이 이름을 설정할 수 있고, RunConfig로 이름과 기타 속성을 구성할 수도 있습니다.

또한 사용자 정의 트레이스 프로세서를 설정하여 트레이스를 다른 대상으로 전송할 수 있습니다(대체 또는 보조 대상).

장기 실행 워커와 즉시 내보내기

기본 BatchTraceProcessor는 몇 초마다 백그라운드에서 트레이스를 내보내거나, 메모리 내 큐가 크기 임계값에 도달하면 더 빨리 내보내며, 프로세스가 종료될 때 최종 flush도 수행합니다. Celery, RQ, Dramatiq 또는 FastAPI 백그라운드 작업과 같은 장기 실행 워커에서는 이는 일반적으로 트레이스가 추가 코드 없이 자동으로 내보내된다는 의미이지만, 각 작업이 완료된 직후에는 Traces 대시보드에 즉시 표시되지 않을 수 있습니다.

작업 단위 종료 시 즉시 전달 보장이 필요하다면 트레이스 컨텍스트가 종료된 후 flush_traces()를 호출하세요.

from agents import Runner, flush_traces, trace


@celery_app.task
def run_agent_task(prompt: str):
    try:
        with trace("celery_task"):
            result = Runner.run_sync(agent, prompt)
        return result.final_output
    finally:
        flush_traces()

from fastapi import BackgroundTasks, FastAPI
from agents import Runner, flush_traces, trace

app = FastAPI()


def process_in_background(prompt: str) -> None:
    try:
        with trace("background_job"):
            Runner.run_sync(agent, prompt)
    finally:
        flush_traces()


@app.post("/run")
async def run(prompt: str, background_tasks: BackgroundTasks):
    background_tasks.add_task(process_in_background, prompt)
    return {"status": "queued"}

flush_traces()는 현재 버퍼링된 트레이스와 스팬이 내보내질 때까지 블로킹하므로, 부분적으로 구성된 트레이스를 flush하지 않도록 trace()가 닫힌 뒤에 호출해야 합니다. 기본 내보내기 지연 시간이 허용 가능하다면 이 호출을 생략할 수 있습니다.

상위 수준 트레이스

때로는 여러 run() 호출을 하나의 트레이스에 포함하고 싶을 수 있습니다. 전체 코드를 trace()로 래핑하면 가능합니다.

from agents import Agent, Runner, trace

async def main():
    agent = Agent(name="Joke generator", instructions="Tell funny jokes.")

    with trace("Joke workflow"): # (1)!
        first_result = await Runner.run(agent, "Tell me a joke")
        second_result = await Runner.run(agent, f"Rate this joke: {first_result.final_output}")
        print(f"Joke: {first_result.final_output}")
        print(f"Rating: {second_result.final_output}")

두 번의 Runner.run 호출이 with trace()로 래핑되어 있으므로, 개별 실행은 각각 두 개의 트레이스를 생성하는 대신 전체 트레이스의 일부가 됩니다

트레이스 생성

trace() 함수를 사용해 트레이스를 생성할 수 있습니다. 트레이스는 시작과 종료가 필요합니다. 방법은 두 가지입니다:

권장: 트레이스를 컨텍스트 매니저로 사용합니다. 즉, with trace(...) as my_trace 형태로 사용합니다. 이렇게 하면 적절한 시점에 트레이스가 자동으로 시작되고 종료됩니다
trace.start()와 trace.finish()를 수동으로 호출할 수도 있습니다

현재 트레이스는 Python contextvar를 통해 추적됩니다. 즉, 동시성 환경에서도 자동으로 동작합니다. 트레이스를 수동으로 시작/종료하는 경우, 현재 트레이스를 갱신하기 위해 start()/finish()에 mark_as_current와 reset_current를 전달해야 합니다.

스팬 생성

다양한 *_span() 메서드를 사용해 스팬을 생성할 수 있습니다. 일반적으로 스팬을 수동으로 생성할 필요는 없습니다. 사용자 정의 스팬 정보를 추적하기 위해 custom_span() 함수를 사용할 수 있습니다.

스팬은 자동으로 현재 트레이스의 일부가 되며, Python contextvar로 추적되는 가장 가까운 현재 스팬 아래에 중첩됩니다.

민감한 데이터

일부 스팬은 잠재적으로 민감한 데이터를 캡처할 수 있습니다.

generation_span()은 LLM 생성의 입력/출력을 저장하고, function_span()은 함수 호출의 입력/출력을 저장합니다. 여기에는 민감한 데이터가 포함될 수 있으므로 RunConfig.trace_include_sensitive_data를 통해 해당 데이터 캡처를 비활성화할 수 있습니다.

마찬가지로 오디오 스팬은 기본적으로 입력 및 출력 오디오에 대한 base64 인코딩 PCM 데이터를 포함합니다. VoicePipelineConfig.trace_include_sensitive_audio_data를 구성하여 이 오디오 데이터 캡처를 비활성화할 수 있습니다.

기본적으로 trace_include_sensitive_data는 True입니다. 앱 실행 전에 OPENAI_AGENTS_TRACE_INCLUDE_SENSITIVE_DATA 환경 변수를 true/1 또는 false/0으로 설정하면 코드 변경 없이 기본값을 지정할 수 있습니다.

사용자 정의 트레이싱 프로세서

트레이싱의 상위 수준 아키텍처는 다음과 같습니다:

초기화 시, 트레이스 생성을 담당하는 전역 [TraceProvider][agents.tracing.setup.TraceProvider]를 생성합니다
TraceProvider를 BatchTraceProcessor로 구성하며, 이 프로세서는 트레이스/스팬을 배치로 BackendSpanExporter에 전송하고, 익스포터는 스팬과 트레이스를 배치로 OpenAI 백엔드에 내보냅니다

이 기본 구성을 사용자 지정하여 트레이스를 대체 또는 추가 백엔드로 전송하거나 익스포터 동작을 수정하려면 두 가지 방법이 있습니다:

add_trace_processor()를 사용하면 준비되는 대로 트레이스와 스팬을 수신하는 추가 트레이스 프로세서를 추가할 수 있습니다. 이를 통해 OpenAI 백엔드로 전송하는 것 외에 자체 처리를 수행할 수 있습니다
set_trace_processors()를 사용하면 기본 프로세서를 사용자 정의 트레이스 프로세서로 대체할 수 있습니다. 이 경우 해당 기능을 수행하는 TracingProcessor를 포함하지 않으면 트레이스는 OpenAI 백엔드로 전송되지 않습니다

비-OpenAI 모델에서의 트레이싱

트레이싱을 비활성화하지 않고도 OpenAI Traces 대시보드에서 무료 트레이싱을 활성화하려면 비-OpenAI 모델과 함께 OpenAI API 키를 사용할 수 있습니다. 어댑터 선택 및 설정 시 주의사항은 Models 가이드의 Third-party adapters 섹션을 참조하세요.

import os
from agents import set_tracing_export_api_key, Agent, Runner
from agents.extensions.models.any_llm_model import AnyLLMModel

tracing_api_key = os.environ["OPENAI_API_KEY"]
set_tracing_export_api_key(tracing_api_key)

model = AnyLLMModel(
    model="your-provider/your-model-name",
    api_key="your-api-key",
)

agent = Agent(
    name="Assistant",
    model=model,
)

단일 실행에 대해서만 다른 트레이싱 키가 필요하다면 전역 익스포터를 변경하는 대신 RunConfig를 통해 전달하세요.

from agents import Runner, RunConfig

await Runner.run(
    agent,
    input="Hello",
    run_config=RunConfig(tracing={"api_key": "sk-tracing-123"}),
)

추가 참고 사항

Openai Traces 대시보드에서 무료 트레이스를 확인하세요

에코시스템 통합

다음 커뮤니티 및 벤더 통합은 OpenAI Agents SDK 트레이싱 표면을 지원합니다