주로 Claude를 사용해서 여러 에이전트들을 만들어서 워크플로우를 설정해서 자동으로 설계, 개발, 테스트 다 한다고들 합니다. 그런 방법에 대한 글들은 많지만, 실제로 작동하는것이 어떨지 궁금합니다. 설계, 개발, 시험, 등을 다른 모델로 사용하여 어떤 모델이 어떤 일에 적합한지에 대한 글도 많습니다.
현재 커서라는것을 사용하는데, 언급된 모든일을 모델은 자동으로 설정하고 이 하나로 모두 합니다만, 계속 지켜보며 대화하고 방양을 잡아줘야 하는데, Claude를 위에 언급한 방법으로 하면 완전히 자동으로 되는지 궁금합니다. 경험으론 프로젝트가 클수록 계속 방향을 잡아주지 않으면 엉뚱하거나 미흡하게 되던데, '완전 자동'의 방법에 대해 자세히 나온 글들이나 영상이 있는지요? 그런 글들이나 영상을 보면 따라할만한 자세한 방법은 못봤습니다.
완전한 전체 자동화 상태를 추구하기보다는 작업을 분해해서 각 작업의 담당을 정의해보는 게 그나마 현실적인 전략이라 생각합니다. 패턴 인식이나 의미 추출, 보편 지식과 연결하는 작업은 LLM에게 맡기고 의미 부여, 맥락 추가, 의사결정은 사람이 하는게 그 예시입니다. 코딩 상황에 예시를 적용하면 반복 코드 생성이나 테스트 케이스 작성은 LLM에 위임하고 아키텍처 결정과 도메인 모델링은 사람이 하게 됩니다. 그러면 문제는 의사결정을 어디까지 자동화할 수 있는가로 좁혀지게 되고 조금 더 구체적인 사례를 쉽게 찾으실 수 있을거라 생각합니다
답변 감사합니다. 오리지널 포스팅에서 언급했듯, 그런글들이 눈에 뜨였지만, 구체적 방법은 논하지 안았기에 혹시나 잘 알려진 문서나 정보가 궁급했습니다.
경기때문인지는 모르겠으나 최근들어 AI 에이전트로 모든것을 해결할수 있는것처럼 이야기하는 글이나 강의들이 많지만, 아직까지는 AI로만 모든것을 100%까지 해내기는 현실적으로 어렵습니다. 분야에 따라 최대 70-80% 정도라고 보고있고, 이 이상을 위해서는 분야의 전문가가 필수라고 봅니다.
'완전 자동'의 방법론에 대해 설명하는 글이나 영상을 아직까지는 본적이 없지만,
이와 관련된 논의나 실험이 지역적으로 이루어 지고 있는 상태인거 같습니다.
아래 아티클들이 작성자님의 질문에 대한 힌트가 될것이라 생각합니다!
https://anthropic.com/engineering/…
https://openai.com/ko-KR/index/harness-engineering/
https://github.com/karpathy/autoresearch
https://www.minimax.io/news/minimax-m27-en