2P by neo 6달전 | favorite | 댓글 1개

Sir, there's a cat in your mirror dimension

  • 예전에 주파수 영역에 대해 이야기한 적이 있음.

    • 일상 신호를 구성 파형의 진폭으로 변환하는 기법임.
    • 가장 일반적인 기초는 증가하는 주파수의 사인파임.
    • 다른 수많은 파형도 다양한 주파수 영역을 만들 수 있음.
  • 주파수 영역 변환의 두 가지 중요한 특성:

    • 가역성: 주파수 이미지를 통해 원래 데이터를 복원할 수 있음.
    • 입출력 대칭성: 같은 수학적 연산을 사용하여 양방향으로 변환 가능.
  • 실제로는 이 구분이 중요함.

    • 특히 압축에서 중요함.
    • 이미지를 주파수 영역으로 변환하고 고주파 성분의 정밀도를 줄이면 데이터 양이 줄어듦.
    • 결과 이미지는 여전히 시각적으로 동일하게 보임.

MS Paint를 최첨단 압축 도구로 사용

  • 주파수 영역의 이미지는 퍼진 노이즈처럼 보임.

    • 대부분은 시각적으로 중요하지 않음.
    • 변환은 두 기능적으로 동일한 차원 사이를 오가는 레버임.
    • 이 거울 차원을 집으로 삼고 일부 데이터를 이동할 수 있을지 궁금해짐.
  • 이를 테스트하기 위해 고양이 사진을 가져와 이산 코사인 변환(DCT)으로 주파수 영역 형태를 계산함.

    • 시간 고양이, 주파수 고양이.
  • 이전 예제의 여성 사진을 사용하고 거울 차원의 "고양이 노이즈" 패턴을 겹쳐서 불투명도를 낮춤.

    • 시간 여성과 주파수 고양이.
  • 합성 작업은 필연적으로 손실이 발생함.

    • 이론적으로 합성 이미지를 DCT로 주파수 영역 표현을 계산하면 여성 사진이 균일한 노이즈로 분해될 것임.
    • 주입된 "고양이 노이즈"는 인식 가능한 고양이 이미지로 응집될 것임.
  • 실제로 그렇게 됨.

    • 주파수 고양이와 시간 여성.
  • 직접 확인하려면 합성 이미지를 다운로드하고 MATLAB에서 다음을 실행해보면 됨:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • 흥미롭게도, 고양이는 호스트 문서의 크기 조정에도 생존함.

    • 업스케일링은 이미지를 타일링함.
    • 다운스케일링은 이미지를 잘라냄.
  • 손실 압축이 고양이를 얼마나 손상시키는지 궁금했음.

    • 예상보다 영향이 적었음.
    • 높은 JPEG 품질 설정에서는 이미지가 꽤 괜찮아 보임.
    • 품질 설정이 낮아지면 오른쪽 하단 사분면이 심하게 양자화됨.
    • 주파수 영역에서 본 JPEG 압축의 혼란.
  • 이 시각화는 JPEG 알고리즘이 얼마나 많은 정보를 파괴하는지 보여줌.

    • 대부분은 우리가 알아차리지 못함.
  • 오디오 스펙트로그램을 숨겨진 메시지로 사용하는 이전 사례가 많음.

    • JPEG DCT 계수를 이용한 텍스트 스테가노그래피에 대한 논의도 있음.
    • 이 기술이 특히 유용하다는 것이 아니라, 주파수 영역과 시간 영역이 재미있게 연결되어 있다는 점을 강조함.

GN⁺의 의견

  1. 주파수 영역 변환의 이해: 주파수 영역 변환은 데이터 압축과 신호 처리에서 중요한 역할을 함. 이를 이해하면 이미지나 오디오 데이터를 효율적으로 처리할 수 있음.
  2. MATLAB 활용: MATLAB은 데이터 분석과 시각화에 강력한 도구임. 이 기사를 통해 MATLAB의 실용적인 사용 예를 배울 수 있음.
  3. JPEG 압축의 한계: JPEG 압축의 한계를 시각적으로 이해할 수 있음. 이는 이미지 품질을 유지하면서 파일 크기를 줄이는 방법을 찾는 데 도움이 됨.
  4. 스테가노그래피: 주파수 영역을 이용한 스테가노그래피는 데이터 보안과 관련된 흥미로운 주제임. 이를 통해 숨겨진 메시지를 전달하는 방법을 배울 수 있음.
  5. 기술의 재미있는 응용: 이 기사는 기술을 재미있고 창의적으로 응용하는 방법을 보여줌. 이는 기술에 대한 흥미를 높이고 새로운 아이디어를 떠올리게 함.
Hacker News 의견

해커뉴스 댓글 모음 요약

  • 사진의 주제와 스펙트럼 에너지:

    • 대부분의 사진에서 인식 가능한 주제는 스펙트럼 에너지가 원점(왼쪽 상단)에 집중됨.
    • 사진의 주제는 일반적으로 프레임의 중앙에 위치하여 공간과 주파수 도메인 데이터 간의 간섭을 최소화함.
  • 디지털 워터마킹의 기초:

    • 이 기술은 이미지나 오디오와 같은 신호에 대한 강력한 디지털 워터마킹의 기초가 됨.
    • 주된 응용은 신호가 많이 처리된 후에도 저작권이 있는 자료를 감지하는 것임.
  • 푸리에 변환의 시간-주파수 이중성:

    • 푸리에 변환의 수학적 원리는 변환의 방향에 상관없이 동일하게 작동함.
    • 고양이의 주파수 플롯을 여성의 공간 플롯에 삽입하면, 여성의 푸리에 변환이 고양이를 나타나게 함.
  • 과정 확인 요청:

    • 사진을 찍고, 고양이를 주파수 도메인으로 변환한 후, 이를 여성의 시각 이미지에 합성함.
    • 합성 이미지를 다시 DCT하면 고양이가 나타남.
  • 스테가노그래피 응용:

    • 불법 이미지를 숨기기 위한 스테가노그래피의 흥미로운 응용.
    • 주파수 도메인으로 변환하여 다른 이미지에 합성하면, 이를 되돌리는 방법을 아는 사람만이 이미지를 볼 수 있음.
  • Aphex Twin의 오디오 스펙트로그램 트릭:

    • Aphex Twin이 트랙의 오디오 스펙트로그램에 이상한 얼굴을 나타나게 한 재미있는 트릭과 유사함.
  • DCT의 위치 중요성:

    • 고양이가 왼쪽 상단에 더 집중되어 있었다면, 이 데모는 잘 작동하지 않았을 것임.
    • DCT는 고주파 성분이 많아 고양이를 상단 왼쪽에 두면 묻힐 가능성이 큼.
  • 이미지 압축의 이해:

    • 주파수 도메인이 이미지 압축에 사용될 수 있다는 것을 깨달음.
    • 대부분의 이미지 압축 알고리즘이 주파수 도메인의 조용한 부분을 제거하는 방식으로 작동하는지 궁금함.
  • DCT의 구체적 방법:

    • JPEG에서 사용하는 8x8 타일이 아닌 다른 방식으로 DCT가 적용된 것으로 보임.
    • 2D DCT 기저 함수가 이 경우에 사용되지 않은 것 같음.
  • 음악과 이미지 인코딩:

    • Aphex Twin과 Venetian Snares가 사운드에 이미지를 인코딩한 것과 유사함.
    • 특정 도구를 사용하면 주파수가 고양이의 이미지를 나타내는 것을 볼 수 있음.