GazePrinter: 새로운 codebase에서 초보자를 안내하기 위해 전문가의 시선을 시각화

GazePrinter: Visualizing Expert Gaze to Guide Novices in a New Codebase

arXiv2026-03-20Peng Kuang, Emma Söderberg, April Yi Wang, Martin Höst

배경 및 소개

최근 software engineering에서 program comprehension, 특히 새로운 codebase를 빠르게 파악하는 일이 큰 화제입니다. 대형 codebase는 파일 수, 이질적 스타일, 히스토리가 얽히면서 초심자에게 부담이 큰데요. 시선추적(eye-tracking) 기반 gaze는 개발자 주의(attention)를 엿보는 연구 도구로 주로 쓰여 왔지만, IDE 안에서 직접 지원을 제공하는 형태의 통합은 제한적이었습니다. 공동 주의(joint attention) 관점에서도 전문가의 시선을 공유하는 설계는 학습 촉진 가능성이 높다고 볼 수 있습니다. 이런 맥락에서 저자들은 전문가 gaze를 시각화해 초심자의 codebase 이해를 돕는 GazePrinter를 제안했습니다. Cognitive apprenticeship과 Eye Movement Modeling Examples(EMME) 전통을 IDE 맥락으로 확장하려는 시도인데요. 단일 파일 위주의 기존 연구를 넘어, 실제 개발 환경(IntelliJ)에서 중간 규모 codebase를 대상으로 효과를 점검했다는 점에서 의미가 있습니다.

주요 내용

핵심 아이디어는 전문가가 새로운 codebase를 읽을 때의 gaze 패턴을 수집·가공해, 이후 초심자에게 시선을 유도하는 시각적 큐로 제공하는 것입니다. GazePrinter는 IntelliJ plugin으로 구현되었는데요. 코드 편집 영역 자체를 과도하게 강조하면 시각적 혼잡이 생긴다는 점을 고려해, project explorer, gutter, mini-overview 같은 IDE의 기존 채널을 활용해 주의를 부드럽게 안내하도록 설계했습니다. 이는 IDE와 보조 도구가 동일한 커뮤니케이션 채널을 공유할 때 생길 수 있는 주의 경쟁을 최소화하려는 선택이라고 볼 수 있습니다. 수집 파이프라인은 CodeGRITS로 전문가 5명의 gaze 데이터를 모으고, 품질 이슈로 일부를 제외해 최종 3명의 데이터를 통합한 뒤, attention 구성 파일로 변환해 plugin에 내장하는 구조인데요. 결과적으로 초심자는 전문가가 밟은 파일·구성요소 탐색 경로에 가까운 방향으로 유도됩니다.

연구는 설문, 통제 실험, 인터뷰를 결합한 mixed-methods로 진행되었습니다. 참가자는 비교적 동질적인 초심자 40명이며, 두 개의 중간 규모 Java codebase에서 code reading과 간단한 code editing 과제를 수행했습니다. 연구질문은 네 가지였는데요. 시각화가 초심자 comprehension에 얼마나 도움 되는지(RQ1), 읽기 전략의 즉각적 전이가 있는지(RQ2), 학습 경험(자신감 등)에 어떤 영향을 주는지(RQ3), 그리고 사용자 경험(UX)은 어떠한지(RQ4)였습니다. 주요 정량 결과로, GazePrinter 사용군은 control 대비 전문가 경로에 통계적으로 유의미하게 가까운 파일 탐색 순서를 보였는데요. 이는 attention 유도만으로도 읽기 전략의 상위 수준 구조가 변할 수 있음을 시사합니다. 또한 시간과 cognitive load 감소의 정황이 관찰되었고, 인터뷰에서는 비평가 없는(judgment-free) 안내라는 점에서 심리적 부담을 낮춘다는 인식이 보고되었습니다. 다만 전이(RQ2)는 ‘즉각적’ 수준에서 신호가 엿보이는 정도로, 과제·codebase가 바뀌어도 전략 일부가 남는지에 대한 추가 검증이 필요하다고 볼 수 있습니다. UX 측면에서는 과도한 강조를 피한 시각화가 IDE 흐름을 방해하지 않는다는 긍정적 반응이 있었는데요. 이는 EMME 문헌에서 지적된 ‘추가 인지부하’ 위험을 잘 피해 간 설계라는 점에서 흥미롭습니다.

결론 및 시사점

전문가 gaze 시각화는 초심자의 codebase 탐색 경로를 전문가에 가깝게 정렬시키는 데 효과가 있었는데요. 이는 program comprehension에서 가장 난도 높은 초기 맥락화와 경로 선택을 ‘주의 유도’만으로도 보조할 수 있음을 보여줍니다. 시간 단축과 cognitive load 완화의 신호도 관찰되어, 온보딩과 유지보수 초기 단계에 실질적 이득이 있을 것으로 보입니다. 개인적으로는 cognitive apprenticeship과 joint attention을 IDE 수준에서 실현했다는 점이 설득력 있다고 생각합니다. 다만 전문가 gaze 수집의 비용·범용성, 중간 규모에 한정된 외적 타당성, 실험 맥락이라는 제약은 분명한 한계입니다. 시각화가 특정 코드 스타일이나 아키텍처 편향을 강화할 가능성, 장기 사용 시 과의존 문제, gaze 데이터의 프라이버시·윤리 이슈도 점검해야 합니다. 다음 단계로는 더 다양한 언어·대규모 codebase, 현업 배포 연구, 장기 전이 측정, 그리고 LLM 기반 코드 투어와의 하이브리드 설계가 유효해 보이는데요. 특히 path similarity, task time, subjective cognitive load를 함께 추적하는 프로토콜이 표준화되면, 연구-실무 간 비교 가능성이 높아질 것이라는 기대가 있습니다.

💡 전문가의 attention trail을 eye-tracking으로 캡처해 IDE의 project explorer·gutter·mini-overview에 가볍게 투사하면, 초심자의 codebase 탐색 경로를 빠르게 정렬시킬 수 있습니다. 실무에서는 온보딩용 경량 시각화와 path similarity·cognitive load 지표 기반 평가를 결합해, 과도한 강조 없이 ‘방향’만 제시하는 방식으로 도입하는 것이 안전합니다.

뉴스레터 구독

매주 금요일, 주간 HCI 하이라이트를 이메일로 받아보세요.