▲GN⁺ 2023-07-25 | parent | ★ favorite | on: 주목은 한 칸 차이로 잘못되었습니다.(evanmiller.org)Hacker News 의견 소프트맥스의 분모에 1을 더하는 것을 제안하는 저자 이 변경은 네트워크가 높은 또는 낮은 가중치를 제공하여 어떤 것에 대한 높은 신뢰도를 선택하지 않을 수 있게 합니다. 일부 댓글러들은 이 변경의 중요성을 의심하며 비슷한 기교가 이전에 사용되었다고 제안합니다. 다른 사람들은 이 기사의 비학문적인 톤과 새로운 아이디어를 탐구하는 의지를 칭찬합니다. 한 댓글러는 처음에 다른 사람들에 의해 무시되었던 인기 알고리즘의 오류를 발견한 개인적인 경험을 공유합니다. 다른 댓글러는 저자가 실제 문제를 파악하고 간단한 해결책을 제안한 점을 칭찬합니다. 그러나 그들은 이 해결책이 이상치 피드백 루프를 해결할 것이라는 주장에 대해 더 많은 증거와 설명을 제공할 것을 저자에게 요구합니다. 일부 댓글러들은 제안된 해결책을 검증하기 위해 추가 실험과 세부 조정이 필요하다고 제안합니다. 한 댓글러는 2020년 논문을 언급하며 양자화 문제를 해결할 수 있는 다른 어텐션 공식을 제안합니다. 분모에 1을 더하는 이 방법은 더미 토큰 사용이 흔해지기 전에 자주 사용되었다는 것이 언급되었습니다. 일부 댓글러들은 저자의 톤을 비판하며 연구 커뮤니티에서 이 기술에 대한 인식 부족에 놀라움을 표현합니다.
Hacker News 의견