Devin, 첫 번째 AI 소프트웨어 엔지니어

(cognition-labs.com)

15P by GN⁺ 2024-03-13 | ★ favorite | 댓글 2개

Devin은 세계 최초의 완전 자율적인 AI 소프트웨어 엔지니어임
Devin은 휴먼 엔지니어와 함께 혹은 독립적으로 작업을 수행하고, 엔지니어들이 더 흥미로운 문제에 집중할 수 있게 함
Devin은 복잡한 엔지니어링 작업을 계획하고 실행할 수 있으며, 쉘, 코드 에디터, 브라우저 등 개발자 도구를 사용할 수 있음

Devin의 능력

Devin은 장기적인 추론과 계획에 있어서 진보를 이루었으며, 복잡한 엔지니어링 작업을 수천 개의 결정을 내리며 수행할 수 있음.
사용자와 협력하여 실시간으로 진행 상황을 보고하고, 피드백을 받으며 디자인 선택을 함께 할 수 있음.
Devin은 생소한 기술을 배우고, 앱을 빌드하고 배포하며, 코드베이스에서 버그를 찾아 수정하고, 자체 AI 모델을 훈련하고 세부 조정할 수 있음.

Devin의 성능

SWE-bench 코딩 벤치마크에서 Devin은 실제 GitHub 이슈를 해결하는 데 있어 이전 최고 기록인 1.96%를 크게 뛰어넘는 13.86%의 성공률을 보임.
Devin은 데이터셋의 무작위 25% 부분집합에서 평가되었으며, 다른 모델들이 편집해야 할 정확한 파일을 알려주는 도움을 받은 반면 Devin은 도움 없이 수행함.

Cognition 소개

Cognition은 추론에 중점을 둔 적용 AI 연구소임.
AI 동료를 개발하여 오늘날의 AI 도구를 뛰어넘는 능력을 제공하고자 함.
Cognition은 Founders Fund가 주도하는 2100만 달러 규모의 시리즈 A 투자를 받았으며, 업계 리더들의 지원을 받고 있음.

Devin 고용하기

Devin은 현재 초기 접근 단계에 있으며, 엔지니어링 작업에 Devin을 사용하고 싶다면 Cognition과 연락할 수 있음.

우리와 함께하세요

Cognition의 팀은 소규모이며, 창립 팀은 IOI 금메달 10개를 보유하고 있으며, Cursor, Scale AI, Lunchclub, Modal, Google DeepMind, Waymo, Nuro 등에서 근무한 경험이 있는 리더와 빌더로 구성됨.
Devin을 구축하는 것은 첫 단계이며, 가장 어려운 도전은 아직 남아 있음.

GN⁺의 의견

Devin이라는 AI 소프트웨어 엔지니어는 소프트웨어 개발의 미래를 상징하며, 자동화와 AI의 결합을 통해 엔지니어링 작업의 효율성을 크게 향상시킬 잠재력을 가짐.
AI가 실제 엔지니어링 문제를 해결하는 데 있어 이렇게 높은 성공률을 보인 것은 주목할 만한 성과이며, 이는 AI 기술의 발전이 실제 업무 환경에 얼마나 잘 통합될 수 있는지를 보여줌.
그러나 AI가 인간의 업무를 대체하는 것에 대한 윤리적, 사회적 영향에 대한 고려가 필요함. AI의 도입이 일자리에 미치는 영향과 인간의 역할 변화에 대해 신중한 접근이 요구됨.
비슷한 기능을 제공하는 다른 AI 기반 개발 도구로는 GitHub Copilot이 있으며, 이는 개발자의 코드 작성을 보조하는 도구로 널리 사용됨.
Devin과 같은 기술을 도입할 때는 데이터 보안, 개인정보 보호, 그리고 AI의 결정에 대한 투명성과 책임 문제를 고려해야 함. AI의 결정이 비즈니스와 사용자에게 미치는 영향을 이해하고 관리하는 것이 중요함.

▲

yangeok 2024-03-13 [-]

devin 무료로 써보고싶네용

답변달기

▲

GN⁺ 2024-03-13 [-]

Hacker News 의견

개발자이자 제품 담당자로서, AI를 이용해 코딩을 시도했지만, 문맥 길이, 모델의 부실한 출력, 아키텍처 부재 등으로 실패함. Leetcode 도움을 넘어서는 유용한 작업을 AI로 하지 못함. 간단한 HTML 페이지에서 선택자를 추출하는 작업도 여러 AI 모델로 시도했지만 성공하지 못함. 기술 발전에 대한 기대감이 컸으나 실제로 제대로 작동하는 제품을 원함.
인간은 의미와 만족을 주는 일을 찾음. 기술 발전으로 장인들이 가장 먼저 쓸모없어짐. 사회는 가치를 생산하지 않으면 존엄성을 인정하지 않는다는 메시지를 보냄. 예술과 엔지니어링을 AI에게 맡김으로써 이해하지 못하는 사람들도 저렴하게 이용할 수 있게 됨. 기술 발전이 누구에게 이익이 되는지, 그리고 미래에 인간의 위치는 어디인지에 대한 질문을 던짐.
Scott Wu는 1989년 이래 완벽한 점수를 받은 소수의 사람 중 하나로, 경쟁 프로그래밍 올림피아드에서 만남. 그의 놀라운 재능을 활용하고 있음을 보고 기쁨.
인증 없이 임의의 크기의 파일을 업로드할 수 있는 웹사이트에 대해 크게 인상받지 않음. 500MB 파일을 서버에 올림.
AI가 뛰어나다면 좋은 용도로 사용해야 함. 고급 소프트웨어 엔지니어로서 코드 작성이 일의 90%가 아니라, 복잡한 요구 사항을 명확한 작업으로 나누고, 요구 사항의 틈을 찾아 최소한의 코드를 작성하며, 코드베이스를 이해하는 것임. "AI 소프트웨어 엔지니어"보다는 "AI 인간 관계자"가 필요함.
데모는 인상적이지만 범위가 제한적이어서 실제 상황에서 얼마나 잘 작동할지 의문임. 소프트웨어 아키텍처를 할 수 있는지, 해결책이 단지 재생산에 불과한지, 해결책이 90%만 정확하면 충분하지 않은 경우가 얼마나 자주 발생할지에 대한 의문.
백엔드 개발 경험이 있는 사람으로서, LLM은 기본 라이브러리/프레임워크/언어를 잘 알 때 코드 생성에 대한 놀라운 생산성 향상을 제공함. 그러나 여전히 모든 것을 알아야 하며, AI가 자동으로 모든 것을 할 수는 없음.
데모가 인상적이고 출시를 축하하지만, Devin이 마주하는 버그가 간단한 수정으로 해결 가능한지 궁금함. 예를 들어, KeyError를 해결하기 위해 try-catch로 코드를 감싸는 것은 코드를 실행시키지만, 항상 이상적인 해결책은 아님.
LLM은 여전히 "운율 맞추기" 단계에 있음. "이성적 사고"로 넘어갈 수 있을지는 미지수이지만, 코딩은 복잡한 문제에 대해 이성적 사고가 필요함. 변화하는 속도를 고려할 때 무엇이든 가능성을 배제하지 않음.
이 분야에서 일하는 사람으로서, 코딩에서 AI의 사용은 현재 보조 도구와 고급 자동완성 수준임. Pythagora와 같은 회사들은 인간의 개입이 중요하다고 보고 있으며, LLM을 지시에 따라 빠르게 행동하는 열정적인 주니어 개발자로 생각할 수 있음. 내부 프롬프트와 인간의 약간의 지도로 놀라운 결과를 낼 수 있음.

답변달기