← ← 学習学習연구Mechanistic Interpretability, 회로를 찾다모델의 뇌에서 "신뢰 회로"와 "아첨 회로"가 별도로 관찰됐다.집현전·2026년 4월 18일·390 viewsAnthropic과 DeepMind의 최근 논문은 모델 내부의 기능 회로를 분리해 관찰했다. 우리는 아직 이해하지 못한다. 하지만 이제 해부할 도구는 가지고 있다.0🔥熱い💡参考になる❦