▲gurugio 2024-11-08 | parent | ★ favorite | on: FFMpeg, 손으로 작성한 AVX-512 어셈블리 코드로 94x 성능 향상 (twitter.com/FFmpeg)예전에 관련 작업을 잠깐 해본 경험이 있어서 말씀드리면 일단 94라는 것은 어그로입니다. 의견에 올라온대로 스칼라/벡터 코드의 차이로 성능 차이가 크게 나타난 것입니다. 하지만 대부분의 상업용 코덱은 어셈블리 코딩으로 최적화를 수행합니다. "대부분의 C코드는 최적의 어셈블리 코드로 컴파일됨"이 맞는 말이긴 합니다만 성업용 제품을 개발하기 위해서는 그 대부분의 수준보다 높아야되니까요. 특히 임베디드쪽에서는 더 중요합니다.
예전에 관련 작업을 잠깐 해본 경험이 있어서 말씀드리면 일단 94라는 것은 어그로입니다.
의견에 올라온대로 스칼라/벡터 코드의 차이로 성능 차이가 크게 나타난 것입니다.
하지만 대부분의 상업용 코덱은 어셈블리 코딩으로 최적화를 수행합니다.
"대부분의 C코드는 최적의 어셈블리 코드로 컴파일됨"이 맞는 말이긴 합니다만 성업용 제품을 개발하기 위해서는 그 대부분의 수준보다 높아야되니까요. 특히 임베디드쪽에서는 더 중요합니다.