◀ 일년전◁ 한달전<< 일주일전< 하루전| 2024-05-13 |다음날 >일주일후 >>한달후 ▷ 21▲GN⁺: 대규모 언어 모델의 Under-Trained Tokens 자동 감지 기술 (arxiv.org)# 대형 언어 모델의 훈련되지 않은 토큰 자동 감지에 관한 연구 - 언어 모델에서 토크나이저 생성과 모델 훈련 간의 불일치로 인해 'SolidGoldMag...1 point by neo 6달전 | 댓글 1개22▲GN⁺: GPU의 폭발적인 성능 향상 (hazyresearch.stanford.edu)# H100 GPU의 특징 - 80GB HBM3 메모리와 3TB/s 대역폭 제공 (실제로는 조금 더 낮음) - 50MB L2 캐시와 12TB/s 대역폭 제공. GPU에 두 개의 25MB...1 point by neo 6달전 | 댓글 1개23▲GN⁺: 비전 트랜스포머(Vision Transformers), 레지스터(Registers) 필요성 대두 (openreview.net)# 비전 트랜스포머에 레지스터가 필요함 - 저자: Timothée Darcet, Maxime Oquab, Julien Mairal, Piotr Bojanowski - ICLR 2024 구두 발표 - 202...1 point by neo 6달전 | 댓글과 토론24▲GN⁺: Emacs 윈도우 관리 백과사전 (karthinks.com)# Emacs 윈도우 관리에 대한 개요 ## 윈도우 관리의 평판과 잠재력 - Emacs의 윈도우 관리는 평판이 좋지 않음 - 이는 매우 유연하고 세분화된 레...1 point by neo 6달전 | 댓글 1개25▲GN⁺: 아담 커티스, self-expression의 위험성에 대해 경고 (2017) (thecreativeindependent.com)# 아담 커티스가 말하는 자기표현의 위험성 ## 예술은 정치 행동을 대체할 수 없음 - 예술은 세상을 잘 표현하고 시대의 분위기를 잘 전달하지만,...1 point by neo 6달전 | 댓글 1개