Thousand Token Wood는 무엇이며 어떤 모델을 사용하나요?

Build Small Hackathon 출품작으로, Qwen2.5-3B 소형 모델 기반 멀티 에이전트 경제 시뮬레이션입니다. 다섯 마리 숲 동물이 다섯 가지 상품을 돌 화폐로 거래하며, vLLM·Modal·Gradio로 구성됩니다.

왜 작은 모델로도 버블과 부의 분화가 재현됐나요?

모델 규모가 아니라 세 가지 희소성 규칙 덕분입니다. 한 끼 한 단위 제한, 식료품 부패, 겨울철 장작 단독 공급. 이 제약이 거래 유인을 만들어 꿀 10→3 폭락, 장작 4→7 급등을 자연 발생시켰습니다.

비용과 안정성은 어느 정도인가요?

매 라운드 한 번의 배치 GPU 호출로 전 캐릭터 의사결정을 끝내 비용을 낮춥니다. 15라운드·75회 API 호출에서 100% 유효 JSON을 출력했고, 라운드당 3~9건 거래가 성사됐습니다.

이 시스템의 한계는 무엇인가요?

JSON 형식은 안정적이나 경제적 추론 능력은 약합니다. 외부 희소성 규칙이 없으면 과잉 생산으로 거래가 사라지며, 프롬프트에 생산·금지·부족 품목을 명시하지 않으면 의사결정 품질이 급락합니다.

멀티 에이전트가 잘 작동하지 않을 때 흔한 실수는?

모델을 더 큰 것으로 즉시 교체하는 것입니다. 먼저 환경 제약을 강화하고 프롬프트에 각 캐릭터의 생산 품목·구매 금지·재고 부족 목록과 예시를 구체적으로 나열해야 합니다. 구조가 규모보다 중요합니다.

어떤 개발자에게 적합한 사례인가요?

소형 LLM으로 멀티 에이전트 파이프라인을 비용 효율적으로 운영하려는 엔지니어, 시뮬레이션·게임·경제 모델링 연구자에게 적합합니다. 대형 모델 예산 없이 에이전트 상호작용을 검증하려는 팀이 핵심 독자입니다.

내 멀티 에이전트 설계가 올바른지 어떻게 점검하나요?

외부 제약을 모두 제거했을 때 에이전트들이 상호작용할 이유가 남는지 자문하세요. 이유가 없다면 모델 교체가 아니라 규칙 설계를 다시 해야 합니다. 희소성·역할 분담·금지 목록을 프롬프트에 명시하는 것이 출발점입니다.

Thousand Token Wood 멀티 에이전트 경제 실전기

이 글은 JudyAI Lab의 AI 엔지니어링 시리즈 중 하나입니다 — 100편 이상 발행된 가이드, 60개국 5,000명 이상의 주간 독자가 읽는 콘텐츠로, AI 에이전트·트레이딩 시스템·콘텐츠 파이프라인의 실전 운영에 초점을 둡니다.

📰 핵심 요약

천대목(Thousand Token Wood)은 Build Small Hackathon에 출품된 멀티 에이전트 경제 시뮬레이션 시스템으로, Qwen2.5-3B 소형 모델을 사용해 다섯 마리의 숲 동물 캐릭터가 가상 시장에서 다섯 가지 상품을 돌 화폐로 거래합니다. 전체 시스템은 vLLM으로 Modal에 배포되고, 프론트엔드는 Gradio를 사용하며, 매 라운드마다 단 한 번의 배치 GPU 호출로 모든 캐릭터의 의사결정이 완료되어 연속 시뮬레이션을 비용 효율적으로 운영할 수 있습니다.

기술팀은 시장에 인위적인 희소성 메커니즘이 없으면 과잉 생산으로 인해 거래 유인이 사라진다는 사실을 발견하고, 세 가지 제약을 도입했습니다: 한 끼에 같은 종류의 식료품은 한 단위만 섭취 가능, 식료품은 부패하여 비축 불가, 겨울에는 장작 수요가 급증하지만 공급자는 한 명뿐. 이 세 가지 규칙이 직접적으로 버블과 붕괴를 만들어냈습니다. 1929년 뱅크런을 원형으로 한 시나리오에서 캐릭터 Oona가 꿀을 팔아 돌 화폐를 얻으면서, 꿀 가격이 수 라운드 만에 10에서 3으로 폭락했습니다. 장작은 겨울 위기로 인해 4에서 7로 급등했습니다.

15라운드 테스트에서 75번의 API 호출이 100% 유효 JSON 출력을 달성했으며, 매 라운드 3~9건의 거래가 성사되었고, 지니 계수는 0.14에서 0.38로 확대되어 부의 격차가 자연스럽게 나타났습니다. 모델은 JSON 형식은 안정적이지만 경제적 추론 능력은 다소 약했습니다. 해결책은 더 큰 모델로 교체하는 것이 아니라, 프롬프트에 각 캐릭터의 생산 품목, 구매 금지 목록, 재고 부족 목록과 예시를 명확히 나열하는 것이었습니다. 저자의 핵심 결론은 “구조가 규모보다 중요하다"입니다.

💬 JudyAI Lab 관점

Thousand Token Wood는 Qwen2.5-3B 소형 모델로 버블과 부의 분화를 구현해냈습니다. 이는 반직관적인 사실 하나를 알려줍니다: 더 큰 모델이 아니라 더 좋은 규칙 설계가 필요하다는 것입니다.

꿀 가격이 수 라운드 만에 10에서 3으로, 장작이 4에서 7로 변동한 것은 모델의 경제적 추론 능력 덕분이 아니라, 세 가지 인위적인 희소성 규칙 덕분이었습니다. 식료품 부패, 한 끼 한 단위 제한, 겨울철 단독 공급자. 이 규칙들이 캐릭터에게 실질적인 거래 유인을 만들어냈고, 버블도 자연스럽게 나타났습니다. 프롬프트에 각 캐릭터의 생산 품목, 구매 금지 목록, 재고 부족 목록을 명시함으로써 75번의 API 호출에서 100% 유효 JSON 출력을 달성했고, 지니 계수는 0.14에서 0.38로 확대되어 부의 분화가 의도치 않아도 나타났습니다. 이 사례에서 우리가 주목하는 핵심은 이것입니다: 멀티 에이전트 시스템이 기대대로 작동하지 않을 때, 더 큰 모델로 서둘러 교체하기 전에 먼저 환경 제약을 강화하고 프롬프트를 구체적으로 작성해야 한다는 점입니다.

멀티 에이전트 파이프라인을 설계하고 있다면, 한 가지 질문을 스스로에게 던져보세요: 외부 제약을 모두 제거했을 때 에이전트들이 서로 상호작용할 이유가 있나요? 답은 대개 모델 크기가 아니라 규칙 설계 안에 있습니다.

📅 원문 정보

발행 시각: 2026-06-05T22:18
원문 링크: https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim

Thousand Token Wood 멀티 에이전트 경제 실전기

📰 핵심 요약

💬 JudyAI Lab 관점

📅 원문 정보

🔗 더 읽어보기

참고 자료

📰 핵심 요약#

💬 JudyAI Lab 관점#

📅 원문 정보#

🔗 더 읽어보기#

참고 자료#

매주 AI 다이제스트를 받아보세요:

📰 핵심 요약

💬 JudyAI Lab 관점

📅 원문 정보

🔗 더 읽어보기

참고 자료