▲GN⁺ 2025-04-01 | parent | ★ favorite | on: AI 에이전트: "더 많은 기능"보다 "더 높은 신뢰성"이 필요함(sergey.fyi)Hacker News 의견 "비행기 예약" 에이전트는 이제 농담의 소재가 되었음. Swyx의 최근 AI 엔지니어 이벤트 키노트에서도 언급되었음 이 글은 이 문제의 어려움을 과소평가하고 있다고 생각함 인간이 입력하거나 대화하는 UI에서는 무한한 오류 가능성이 존재함 인간은 명확하게 표현하는 데 서툴고, 소프트웨어의 기능을 정확히 이해하는 것도 어려움 Google Deepmind 연구자들이 에이전트의 신뢰성을 높이기 위한 연구를 진행 중임 사용자 행동을 대표하는 엄격한 평가가 중요함 JFK 암살 파일 80,000 페이지에 대한 에이전트의 고급 추론 데모를 게시했음 소량의 파일에서도 대형 AI 플레이어와의 신뢰성/정확성 차이가 큼 비행기 예약은 AI에게 맡길 수 없는 작업임 가족 여행이나 개인 여행 시 다양한 요령이 필요함 공식 웹사이트와 가격 비교, 날짜 확인, 신용카드 포인트 고려 등 다양한 요소가 있음 많은 경우 사람들이 AI를 기존 워크플로우에 맞추려는 경향이 있음 기존 워크플로우는 이미 최적화된 UX/UI를 가지고 있음 AI를 사용하는 것이 문제 해결을 위한 솔루션이 아닐 수 있음 Cursor 사용 경험에서 신뢰성이 중요하다는 결론에 도달했음 빠른 모델의 출력은 더 많은 수정이 필요함 특정 라이브러리를 명확히 사용하는 것이 중요함 지난 20년 동안의 기술 발전에서 신뢰성이 더 중요하다고 생각함 스마트폰, 운전 경로, 클라우드 저장소 등 몇 가지 새로운 기능만 필요함 이제는 배터리 수명과 자녀 기기의 부모 통제 기능이 중요함 AI 프로그래밍의 현재 상태에 대한 Reddit 스레드의 댓글이 내 감정을 요약함 AI로 인해 프로그래밍에 입문하는 새로운 엔지니어들이 기본적인 필수 요소를 놓치고 있음 하지만 여전히 내 자리가 있다는 점에서 안심됨 AI가 코드를 작성할 때 최소한 그 코드를 이해할 수 있어야 한다는 원칙을 가지고 있음 AI가 작성한 코드를 이해하지 못하는 "감각 코더"들의 방식은 따를 수 없음 워크플로우가 에이전트보다 중요하다고 생각함 에이전트가 높은 정확도로 작업을 실행할 준비가 되었을 때 워크플로우를 사용할 수 있음 효과적이고 정확하며 쉽게 진단 가능한 워크플로우를 만드는 방법을 찾을 것임 Google Flights는 이미 완벽한 UX를 제공하고 있음 AI 에이전트를 사용할 때 웹 검색이 더 신뢰할 수 있고 빠르다고 생각함 AI가 유용해질지에 대한 확신이 없고, 테스트가 제대로 이루어졌는지 의문임
Hacker News 의견
"비행기 예약" 에이전트는 이제 농담의 소재가 되었음. Swyx의 최근 AI 엔지니어 이벤트 키노트에서도 언급되었음
Google Deepmind 연구자들이 에이전트의 신뢰성을 높이기 위한 연구를 진행 중임
비행기 예약은 AI에게 맡길 수 없는 작업임
많은 경우 사람들이 AI를 기존 워크플로우에 맞추려는 경향이 있음
Cursor 사용 경험에서 신뢰성이 중요하다는 결론에 도달했음
지난 20년 동안의 기술 발전에서 신뢰성이 더 중요하다고 생각함
AI 프로그래밍의 현재 상태에 대한 Reddit 스레드의 댓글이 내 감정을 요약함
AI가 코드를 작성할 때 최소한 그 코드를 이해할 수 있어야 한다는 원칙을 가지고 있음
워크플로우가 에이전트보다 중요하다고 생각함
Google Flights는 이미 완벽한 UX를 제공하고 있음