GeekNews 최신글 예전글 쓰레드 댓글 Ask Show GN⁺ Weekly | 글등록 | @rlaaudgjs5638
로그인

rlaaudgjs5638

2 karma 가입일 2024-12-03

최근 활동

최근 작성한 댓글

전체 보기
그런것도 같네요. 다만 모델 자체는 결국 입출력 함수일 뿐이니까요. 적절한 하네스와 에이전트 루프가 주어진다는 가정 하에, 모델이 목표를 달성한다라는 말이 성립되는것 같습니다.
저도 생각중인 아이디어였는데, 멋지게 구현하셨네요! 결과도 좋게 나오신점 축하드려요.
결국 점점 복제할수 없는게 무엇이며, 그 비용은 얼마나 낮아질지 생각해보게 되네요.
좋은 시도네요!
강화학습과 딥러닝의 차이같기도 해요. 결정적인 피드백 루프를 제공하지 못하는 곳에선 인간 데이터가 아직까진 해자가 되는것 같습니다.

전체 배지

장기 활동
장기 활동 1년
스페셜
First Comment

더 많은 GeekBadge가 있습니다. 활동을 통해 모으거나, GeekGold로 구매해 보세요.

긱뉴스에 GeekBadge 기능이 추가되었습니다. 긱배지로 자신을 표현해 보세요.
처음 오셨나요 사이트 이용법 FAQ About 긱배지 이용약관 개인정보 처리방침   | Blog Lists RSS   | Bookmarklet
X (Twitter) Facebook   |   긱뉴스봇 : Slack 잔디 Discord Teams Dooray! Google Chat Swit
시작하기 이용법 FAQ About 긱배지 약관 개인정보
Lists Blog RSS X 긱뉴스봇