GeekNews 최신글 댓글 예전글 Ask Show GN⁺ Weekly | 글등록
로그인
◀ 일년전◁ 한달전<< 일주일전< 하루전| 2024-05-13 |다음날 >일주일후 >>한달후 ▷일년후 ▶
21
▲

대규모 언어 모델의 Under-Trained Tokens 자동 감지 기술

(arxiv.org)
# 대형 언어 모델의 훈련되지 않은 토큰 자동 감지에 관한 연구 - 언어 모델에서 토크나이저 생성과 모델 훈련 간의 불일치로 인해 'SolidGoldMag...
1 point by GN⁺ 2024-05-13 | 댓글 1개
22
▲

GPU의 폭발적인 성능 향상

(hazyresearch.stanford.edu)
# H100 GPU의 특징 - 80GB HBM3 메모리와 3TB/s 대역폭 제공 (실제로는 조금 더 낮음) - 50MB L2 캐시와 12TB/s 대역폭 제공. GPU에 두 개의 25MB...
1 point by GN⁺ 2024-05-13 | 댓글 1개
23
▲

비전 트랜스포머(Vision Transformers), 레지스터(Registers) 필요성 대두

(openreview.net)
# 비전 트랜스포머에 레지스터가 필요함 - 저자: Timothée Darcet, Maxime Oquab, Julien Mairal, Piotr Bojanowski - ICLR 2024 구두 발표 - 202...
1 point by GN⁺ 2024-05-13 | 댓글과 토론
24
▲

Emacs 윈도우 관리 백과사전

(karthinks.com)
# Emacs 윈도우 관리에 대한 개요 ## 윈도우 관리의 평판과 잠재력 - Emacs의 윈도우 관리는 평판이 좋지 않음 - 이는 매우 유연하고 세분화된 레...
1 point by GN⁺ 2024-05-13 | 댓글 1개
25
▲

아담 커티스, self-expression의 위험성에 대해 경고 (2017)

(thecreativeindependent.com)
# 아담 커티스가 말하는 자기표현의 위험성 ## 예술은 정치 행동을 대체할 수 없음 - 예술은 세상을 잘 표현하고 시대의 분위기를 잘 전달하지만,...
1 point by GN⁺ 2024-05-13 | 댓글 1개
사이트 이용법 FAQ About & ToS   | Blog Lists Podcast RSS   | Bookmarklet   | X (Twitter) Facebook   |   긱뉴스봇 : Slack 잔디 Discord Teams Google Chat Swit