41P by xguru 2023-02-14 | favorite | 댓글 26개
  • 현존 최고의 SF작가로 평가받는 테드 창이 적은 글
  • ChatGPT는 정보를 압축해서 저장하기에 원본이 아닌 흐린 JPEG을 보는 것과 비슷하다는 이야기
  • 2013년 Xerox 복사기가 도면을 복사할 때 숫자가 다른 숫자로 변경되는 것을 발견
  • 복사를 위해 디지털화 하는 과정에서 JBIG2 손실 압축하면서 비슷한 숫자를 하나만 저장했다가 재사용 하면서 발생한 문제
  • 이 사례와 OpenAI의 ChatGPT가 이와 명백히 유사하다고 보긴 어렵지만, 웹의 정보를 저장할 때 비슷한 시나리오가 생길 수 있음
  • 인터넷에 대한 접근 권한을 잃어 버릴 것이라 상상해 보면
    • 웹의 모든 텍스트를 압축하여 복사본을 만들고자 함
    • 하지만 저장할 규모의 1%의 공간만 있어서 압축을 해야하기 때문에 손실 알고리듬을 써야할 것
    • 이제 모든 것을 검색할 수 있지만, 텍스트가 너무 많이 압축되어서 정확한 인용문을 검색할 수 없음
  • ChatGPT는 웹에 있는 모든 텍스트의 흐릿한 JPEG 이라고 생각할 것
  • JPEG처럼 웹의 많은 정보를 유지하지만, 완벽하게 똑같은 비트시퀀스를 유지하는 것은 아님
  • 당신이 얻는 모든 것은 근사치임
  • 하지만 이 근사치가 ChatGPT가 만드는 탁월한 문법적 텍스트의 형태로 제공되기 때문에 일반적으로 허용 되는 것
  • 이 손실압축이 ChatGPT의 기능을 이해하는 방법은 아님
  • 하지만 ChatGPT가 만들어내는 "환각"이나 진실에 대한 말도 안되는 답변을 이해하는 방법이기도 함
  • 이런 환각들은 제록스 복사기가 만들어낸 잘못된 숫자들 처럼, 그것을 진짜 식별하려면 원본과 비교해야할 정도로 충분히 그럴듯함
  • 대규모 언어 모델은 텍스트의 통계적 규칙성을 식별함
  • "공급이 적다" 같은 문구는 "가격이 상승한다" 라는 문장과 근접하여 나타남
  • 이런 관계를 많이 본 챗봇은 공급 부족으로 일어나는 영향에 대한 질문을 받았을때 가격 상승에 대한 답변으로 응답하게 됨
  • LLM(대규모 언어 모델)이 경제 용어간의 수많은 상관관계를 수집했다고, 실제로 경제 이론을 이해한다고 말할 수 있을까 ?
  • ChatGPT 같은 모델은 무손실 압축을 수행하지 않음. 즉, 원래 텍스트를 정확하게 재구성 하지 않음
  • GPT-3는 한쌍의 숫자를 가감연산할때 2자리는 거의 항상 정답이 나오지만, 숫자가 5자리라면 정확도가 크게 나빠져서 10%로 떨어짐
  • 웹에는 "245 + 821" 같은 텍스트를 포함하는 페이지가 많지 않기 때문
  • 방대한 양의 정보를 취합했어도 "산술의 원리"도 도출하지 못했음
  • ChatGPT가 무손실 알고리듬이라면 어떨지 상상해 보라
  • 그러면 관련 웹페이지에서 일부를 그대로 인용하여 질문에 답할 것
  • 우린 아마도 소프트웨어가 기존 검색엔진에 비해서 약간 향상되었다고 생각하고 덜 감동하게 될 것
  • ChatGPT가 웹의 자료를 단어 그대로 인용하는 대신 다른 말로 바꾸어 표현한다는 사실은, 학생이 읽은 내용을 그대로 말하는 게 아닌 자신의 말로 생각을 표현하는 것처럼 보이게 함
  • ChatGPT가 자료를 이해한다는 환상을 만드는 것
  • LLM에 대한 많은 용도가 제안되었는데, 흐릿한 JPEG이라고 생각하면 적합하거나 적합하지 않은 것을 평가할 수 있음
  • 대규모 언어 모델이 기존 검색을 대신할 수 있을까?
    • LLM에 대한 확신을 가지려면 그들이 선전이나 음모론을 듣지 않았다는 것을 알아야함(이상한 데이터로 학습이 된게 아닌지)
    • 우린 JPEG이 웹의 올바른 섹션을 캡쳐하고 있다는 것을 알아야함
    • 그러나 LLM이 우리가 원하는 정보만 포함하더라도 여전히 흐릿함의 문제는 있음
    • 허용되는 흐릿함 유형이 있다면, 이는 정보를 다른 단어로 다시 설명하는 것
    • 그리고 사실을 찾을 때는 절대 용납 불가능한 명백한 조작같은 흐릿함도 있음
    • 허용할 수 없는 흐릿함을 제거하면서, 허용할 수 있는 흐릿함을 유지하는게 기술적으로 가능한지는 확실하지 않지만, 가까운 시일내에 알게될 것으로 기대
  • LLM이 위조되지 않도록 제한할 수 있다고 해도 이를 웹 콘텐츠 생성에 사용해야 할까 ?
    • 이는 우리의 목표가 이미 웹에서 사용할 수 있는 정보를 재포장 할 경우에만 의미가 있음
    • 일부 회사들은 이런 일을 위해 존재함. 우리가 콘텐츠 공장이라고 하는
    • 아마도 LLM의 흐릿함은 저작권 침해를 피하는 방법으로 그들에게 유용할 것
    • 하지만 일반적으로 얘기하면 콘텐츠 공장에 좋은 것은, 정보를 검색하는 사람들에게는 좋지 않은 것이라고 말하고 싶음
    • 이런 재포장들이 증가하면서 현재 온라인에서 뭔가를 찾는게 더 어려워 졌음
  • LLM에 의해 생성된 텍스트가 웹에 더 많이 게시될수록 웹은 더 흐릿한 버전이 됨
  • GPT-4에 대한 정보는 거의 없지만, 예측해보면 OpenAI 사람들은 이에 필요한 텍스트를 모을때 ChatGPT또는 다른 LLM에서 만들어진 자료를 제외하기 위해 노력했을 것
  • 만약 이게 사실이라면, LLM과 손실압축에 대한 유추가 맞는 것인지 확인하게 될 것
  • JPEG을 반복 압축하면 더 많은 정보가 손실되기 때문에 더 많은 압축 아티팩트가 생기게 됨
  • 옛날에 복사물을 다시 복사하는 것처럼 화질만 나빠짐
  • LLM이 인간이 오리지널 창작물을 생성하는데 도움이 될 수 있을까 ?
    • 내 의견은 원본이 아닌 흐릿한 복사본으로 시작하는 것은 원본을 만드는 좋은 작업이 아니라는 것
    • 당신이 작가라면, 독창적인 것(Original)을 쓰기 전에 독창적이지 않은 작품을 많이 쓸 것
    • 독창적이지 않은 작업에 들인 시간과 노력은 낭비되지 않음
    • 오히려 그것이 당신이 궁극적으로 독창적인 것을 창조할 수 있게 해주는 것
    • 올바른 단어를 선택하고 문장을 재배열하여 잘 따라가도록 하는데 보낸 시간은 산문이 의미를 전달하는 방법을 가르쳐줌
    • 학생들에게 에세이를 쓰게 하는 것은 단순히 자료에 대한 이해도를 테스트 하는 방버비 아님
    • 그들에게 그들의 생각을 분명히 표현하는 경험을 하게 해주는 것
  • 미래에는 세상에 대한 자신의 경험만을 바탕으로 좋은 글을 쓸 수 있는 AI를 구축할 가능성이 있음
  • 중요한 순간이 되겠지만, 그걸 달성하는 날은 우리 예측 범위를 뛰어 넘음
  • 인터넷에 대한 접근 권한이 없이 공간이 제한된 서버에 복사본을 저장해야 하는 경우 ChatGPT와 같은 대규모 언어모델은 좋은 솔루션이 될 수 있음
  • "그러나 우린 인터넷에 대한 접근 권한을 잃지 않았음. 오리지널이 있는데 흐린 JPEG을 사용해야할 이유가 뭘까"?

5자리 이상 가감연산 반복해서 질문해봤더니 계속 정확한 답을 내놓는데
어디서 정확도가 나빠진다는 것일까?

테드 창이 간과하는 부분은 지금까지 인터넷 탐색의 주요 방법으로 사용됐던 구글 검색이 근 몇 년 질 낮은 웹 컨텐츠 양산에 영향을 받아 퀄리티가 많이 떨어진 상태라는 것입니다.
ChatGPT가 흐릿한 JPEG라고 할지라도 그 대안이 노이즈 가득한 구글 검색뿐이라고 한다면 지금 당장 정보를 얻기 위한 최선의 수단으로 ChatGPT를 사용하는 것이 합리적일 수 있습니다.
"우린 인터넷에 대한 접근 권한을 잃지 않았"다고 했는데 바로 이 부분이 잘못된 전제입니다. 웹의 거대한 스케일을 생각하면 탐색 능력을 잃는 것이 곧 접근 권한을 잃는 것과 같은 의미라고 봅니다. 내가 원하는 정보를 찾을 수 없는데 접근 권한이 있는 것이 무슨 의미일까요?
즉 "오리지널"이 없는 것과 같은 상황에 가까워지고 있고, 그게 지금 사람들이 체감하고 있는 "흐린 JPEG을 사용해야 할 이유"라고 봅니다.

아래에 lightgreenmaesil 님이 남겨주신 댓글이 테드 창의 관점과 그 반대편에 있는 분들의 차이를 보여준다고 생각됩니다.

"일단 용량도 더 크고, 보는데 시간도 더 오래 걸리지요. 사진이라 시간은 조금 실감이 안날 수 있지만, 책 한권과, 그 책 한권의 핵심 내용을 한페이지로 요약한 것이라 하면 더 실감이 나겠지요."

유튜브에 있는 영화 15분 요약이나 책 요약 같은 것들의 인기나 조회수를 보면, 사람들이 그런 걸 좋아하는 것 사실이죠. 쇼츠도 그렇고요. 그러나 그 요약들이 온전히 원본을 표현 할 수 있냐를 생각해보면, 아니라고 말하는게 맞을 듯 합니다. 원본을 보고 감동 받은 사람이라면, 요약에서 빠진 것들을 크게 느낄테니까요.

소설가인 테드 창 입장에선, ChatGPT이나 LLM들이 하는 일들이 자신이 소설을 1~2장짜리로 요약한 글들을 보는 느낌일 겁니다. 그리고 그 짧은 글 속에 이 소설이 다 들어있다 말하는 혹은 여기는 사람들을 보면, 이게 맞나 싶겠죠.

마찬가지로 영화 감독들이나 배우들이 원본 대신 15분짜리 영화 요약본만 보는 사람들을 좋아할까요? 그 사람들을 본인의 작품을 본 사람으로 여길까요? 더 나아가 거의 모든 사람들이 15분짜리 요약을 실제 영화보다 더 영화 같이 인식하면 어떻게 될까요? 그래서 더 이상 영화를 만들 수 없게 되면, 15분짜리 요약은 어떤 영화를 보고 요약을 해야 할까요?

영상도 글도 요약하고 빠르고 압축해서 보기 좋아하는 시대지만, 재미있게도 음악만은 유일하게 그대로 남아있습니다. 음악을 요약해서 듣는 사람이나, 2배속으로 듣는 사람이나, 재미 없는 부분을 10초씩 넘겨가면 듣는 사람은 없죠.

그렇다면, 요즘 시대정신처럼 2배속, 1분 미리듣기로 뉴진스의 Ditto를 들은 저는 뉴진스의 팬이 될 수 있을까요? 압축하고 요약해서 들은 저도 그 노래를 들었다고 할 수 있을까요? 아닐까요? 아니면 상관 없나요?

테드창 본인도 언어모델을 설명하는데 JPEG라는 손실압축된 비유를 들고 왔듯이, 오리지널이 있더라도 압축정보는 필요합니다.
그리고 언어모델이 자기가 만든 결과물로 다시 학습을 하게 되더라도 정보의 손실은 거의 없습니다. (내부 모델 Parameter에 대한 업데이트가 거의 안일어납니다. 원래 알고 있는 정보라 학습 효과가 없는 거죠.)

마지막 질문에 대한 번역에 원글과 뤼앙스 차이가 있는것 같은데, 번역본만 보고 원글 의도와 다른 댓글이 많은듯 합니다

So just how much use is a blurry jpeg, when you still have the original?
원본을 가지고 있을 때, 흐린 JPEG파일이 얼마나 유용할까요?

저는 Raw 파일을 소유하고 있을 때, JPEG에 대한 유용성을 찾는 질문으로 보이는데요,
사용할 이유가 뭘까로 해석하니 RAW있는데 JPEG같은거 왜 쓰냐는 식으로 보이는것 같습니다.

물론 현실에는 raw보다 jpeg가 대중적인 이유가 있는 만큼, 그 관점을 포함한 질문이라고 생각합니다

때로는 오픈소스의 공식 문서나 AWS의 공식 문서도 신뢰가 안돼서 직접 실행해서 확인하거나 소스코드까지 확인해야 할 경우가 많은데, ChatGPT는 오죽 할까요... 정보의 양이 많아질 수록 인간이 해야하는 교차검증의 양이 불필요하게 많아지는 것 같아요.

JPEG랑 원본이랑 구분을 못하지 않나요?

이미지의 특성과 압축률에 따라 다른데요. 사진 찍는 사람이면, JPEG와 별도로 원본을 가지고 있길 선호합니다. 나중에 편집하고 보정 할 때, JPEG 파일로 하는 것과 원본으로 하는 것과 편집 가능한 범위가 많이 달라서요.

https://www.keptlight.com/does-size-matter/

이순간에도 대부분의 인간들이 밥벌어먹으려 하고있는일이 바로 그 흐린 JPEG를 만드는일 아닐까요.

chatGPT는 정말 대단하지만 너무 인간적이어서 검색과 정보 전달에는 부적합하게도 느껴집니다.

원본이 아닌 흐린 JPEG을 보는 것과 비슷하다는 것에 매우 공감 됩니다. 가령 번역서 읽을 때, 역자 의역이 많이 반영된 경우, 좀 중간에 번역이 이상하다고 느껴도 단어가 계속 부드럽게 연결되는 거 같고, 대략적인 문맥이 맞는 거 같다 느끼면 그냥 대부분 계속 페이지를 넘깁니다 (다 읽고 나서 정말 이해가 되는 지는 별개의 문제지만). 근데 그 이상하다고 느낀 번역이 터무니 없는 것 일수도 있으니 이게 간과할 문제는 아닌거죠. 이런 번역이 누구에게는 용납 불가일수도 있고 또 누구에게는 감내할 수준 일수도 있고.

음. 화질구지네요.

어쩌면 경고의 의미인가 싶기도 합니다. 저도 업무에서나 조언이 필요할 때나 문장을 다듬을 때나 두루두루 쓰지만, 분명 그럴싸하지만 잘못된 답변을 할 때도 분명히 있어요. 사용자가 이 답변이 잘못되었다는 걸 알기 위해 그 분야에 대한 지식이나 추가적인 조사가 필요한 것도 사실이구요. 의외로 굉장히 디테일하게 보아야 눈치챌 수 있는 오류도 가끔 있습니다.(코드를 생성했을 때 실제로 존재하지 않는 함수를 사용한다거나)
그런 오류를 발견할 때까지 이 인공지능이 저에게 그런 식의 답변을 할 것이라고 생각해본 적이 사실 없었습니다. 아예 답변이 불가능하거나, 생뚱맞은 답변을 하는 것만 생각해 보았거든요.

이러한 기술에 대해 이해도가 비교적 더 높은 사람이 많을 스택오버플로우 등지에서도 AI 답변과 연관된 마찰이 조금씩 존재했던 걸 보면 생각보다 사용자 사이에서 완벽한 검증이 이루어지지는 않았을 것입니다. AI가 생성한 데이터의 검증은 인간의 개입이 필요하고 분명 노동과 지식이 들어가는 작업입니다. 그렇지 않다면 MS사에서 자사의 AI가 낸 그럴싸한 오류를 놓치지 않았겠죠. 그렇기에 우리는 이 기술을 당장은 도구로 활용해야 한다는 것을 알아요. 그러나 휴대폰의 인공지능에게 오늘의 날씨를 물어볼 때, 이 답변이 버그나 여타 오류로 인해 틀릴 거라는 가정을 해본 적이 없어요. chatGPT같은 인공지능이 점차 범용 AI로 일상생활과 밀접하게 발전해나갔을 때, 사용자가 그 답변을 큰 의심없이 수긍할 확률이 높지 않을까요?

요새 학교에서 chatGPT 등을 이용한 에세이 대필 사례가 많습니다. 오류를 지적하거나 글을 쓸만한 소재를 받거나, 살을 불리거나 하는 정도가 아닌, 문제에 대한 고민 없이 무분별하게 AI의 답변을 단어만 조금씩 바꿔서 내어 높은 점수를 받는 사례가 기사화 되었죠. 직접 조사한 자료를 기반으로 자신의 생각을 묻는 상황에서 인공지능에게 생각과 구성, 작성까지 맡기는 것은 분명 새로운 패러다임입니다.

인공지능을 떠나, 가끔 잘못된 자료가 인터넷에 수두룩히 검색되는 경우가 많은데요, 이에 대해 추가적인 확인 없이 사실이라고 믿는 사람들이 많습니다. 저 또한 하나하나 검증하면서 읽지 않는다면 무심코 잘못된 정보를 받아들인 적이 많을 겁니다.
흔히 데이터 풍화라고 우스갯소리로 말하는 게 있는데요, 인터넷에서 사진이 jpg로 다양한 사이트를 떠돌며 공유되는 과정에서 리사이징, 용량 압축을 반복하여 화질이 엉망이되는 경우가 종종 있죠. 새하얀 배경색이 시퍼런 색이 되기도 하더군요.
정보의 열화같은 걸 우려하는 게 아닐까 싶습니다. 악화가 양화를 구축한다고 하잖아요?
이미 그림 공유 사이트에는 AI가 생성한 그림으로 넘쳐납니다. 이것이 잘못된 것은 아니지만, AI가 작성한 근사치의 아티클로 인터넷이 빼곡히 채워진다면, 그리고 이를 기반으로 하는 AI가 다시 아티클을 생성하는 것을 반복한다면 정보에 대한 왜곡이 조금씩 누적될 수도 있지 않을까요? 그런 생각을 해봅니다.

30년 이상 SF를 읽어왔고, 근 10 년 동안 읽은 SF 신작 중에 '당신 인생의 이야기'를 최고로 치는 찐팬이지만, 20년 이상 개발자로 일해 온 업계 종사자의 관점에서 반박할 수 밖에 없는 이야기입니다.

기본적으로 이 발언은 오만이라고 할 만한 관점에서 나왔습니다. 사람들은 (우매하여) ChatGPT 를 위시한 AI 플랫폼들이 창조의 영역에 이르렀다고 오해할 것이지만, 나는 그렇지 않음을 알고 있으니 저들에게 참된 말로 참된 사실을 알려줘야 한다는 관점입니다.

정말 참된 사실은 그렇지 않다는 것을 업계 종사자 뿐 아니라 대다수의 사람들이 알고 있다는 것입니다. 알파고 이후로 AI 는 대중의 화두가 된지 오래입니다. AI 의 역량도 한계도 다들 어느 정도 알고 있습니다. 지금 AI 바둑계는 알파고 정도는 젖먹이 취급할 정도의 고수들이 판치고 있지만, 누구도 그걸 충격으로 받아들이지 않습니다. 그게 어떤 의미인지, 어떻게 받아들여야 할지 학습이 많이 되어 있기 때문입니다.

저는 테드 창의 저 발언을 오히려 대중에 대한 무지와 편견에서 비롯된 오류라고 봅니다. ChatGPT 에 열광하는 대중은 그것이 우리의 지적 활동을 대체해 주리라는 믿음에서 그러는 것이 아닙니다. 그것이 우리의 지적 활동을 '보조'해줄 것이라는 점을 다들 잘 알고, 그렇게 사용하고 있습니다. 프롬프트 예시가 매뉴얼화되어 공유되고 있습니다. 도구라는 점을 명확하게 인지하고 있음을 알 수 있습니다.

그림 그리는 AI 를 사람들이 어떻게 받아들이나요? 내 창작을 대신해달라고 마술램프처럼 문지를까요? 제가 요즘에 본 AI 이미지의 90% 정도는 후방 이미지였습니다. 손은 잘 못그려서 흐릿하다면 흐릿하지만, 나머지 부분은 깔끔하고 명료하기만 하더군요.

할 말이 많지만, 너무 많기에 한 마디만 하고 줄이겠습니다.

"김대리. 내가 감히 조언하고 싶은 것이 있읍니다. 다른 것이 아니고, 너무 엑셀 팡션? 사용하지 마세요. 편리함이 있다면, 위험성은 증대하죠. 소를 잡든데는 그만한 칼날이 있고 닭잡는데는 칼이 필요한가요?...... 저의 의견은 암산이 빠를 수 있고, 물론 사람에 차이는 있지만, 계산기가 좋을 수 있죠. 콤퓨타는 소잡는 칼 아닌가 해서 의견 드립니다.

마지막 질문은 잘못되었습니다. 비교 대상은 흐른 JPEG가 아니라, JPEG 사진을 말로 요약한 것이어야 합니다. 예를들면 '혀를 내밀고 있는 개'라는 텍스트와 실제 이것의 사진이어야 하지요. 이것도 일종의 손실 압축이지요. 대다수의 정보가 삭제되고 텍스트 몇바이트로만 압축 했으니까요. 하지만 원본 사진이 있기에 이런 손실 압축이 가치가 없냐?하면 아닙니다. 일단 용량도 더 크고, 보는데 시간도 더 오래 걸리지요. 사진이라 시간은 조금 실감이 안날 수 있지만, 책 한권과, 그 책 한권의 핵심 내용을 한페이지로 요약한 것이라 하면 더 실감이 나겠지요.

자 그렇다면, 어떤 논문 한편이 있는데 그 논문의 손실압축인 요약본을 볼 이유가 있습니까? 물론 있고 때에 따라 아주 유용합니다. 어떤 책 한권이 있는데 그 책의 한 챕터에 언급된 특정 주장에 관한 요약을 사용해야 할 이유-당연히 있습니다. 어떻게 보면 인간이 학교에 가서 수십 시간 동안의 강의를 듣고, 그것을 노트나 cheating sheet에 요약 정리 하는 것도 영상에서 글로의 엄청난 손실 압축이지요. 학습 자체가 손실 압축입니다. 이것이 쓸모가 없습니까?

'압축'을 사진의 압축에 비유해 마치 아주 trivial하고 큰 의미가 없는 것 처럼 작성했지만, 사실 압축은 인간의 학습에 있어서 굉장히 본질적이고, 의미 있는 작업입니다. 사진 같은 경우 압축을 하는 방법이 어느 정도 많이 풀려있지만, 언어의 압축은 굉장히 non-trivial하고 중요한 일이지요.

마지막 질문에 대한 답은

우리가 GPT를 통해 제공받는 정보가 열화된 JPEG버전이라 할지라도
우리가 원하는 정보는 대체로 콜라쥬 버전이고 이 콜라쥬를 구성하기 위해 들어가는 노력이 상당한데

콜라쥬 하는 노력을 대신해주고, 때로는 전체적인 완성도가 내 손재주보다 뛰어나
화질의 열화를 충분히 감수할만 하기 때문이죠

감히 테드창의 상상력과 기술에 대한 이해를 제가 평가할 수 있는 입장이 아닐 수 있으나
전반적으로 이 기술의 일부 특징을 과대 해석한 결과물이고
정말 중요한 특징은 놓쳤다는 인상입니다.

마지막 질문에 대한 대답은 '편해서'가 아닐까요?
적절한 비유인진 모르겠지만, 요즘 영화/드라마 몰아보기같이 오리지널을 압축한 것들에 대해 만족도가 높은 것처럼요.

매우 훌륭한, 하지만 업계 종사자가 아니면 절대 이해하지 못할 비유인 것 같습니다.
이걸 어떻게 해야 (전문가연 하는 사람들을 포함한) 비 전문가에게 이해시킬 수 있을까요.

Super Resolution이 오리지널보다 나을 수 있는데

물론 나을 수 는 있지만 무조건 낫진 않다는 점을 글에서도 지적하고 있지 안으나요?

나을 수 있다고 했지만 물론 무조건 낫지는 않죠. 하지만 글에서는 해상도가 흐릿하다고만 할 뿐 반대로 더 명료해질 가능성은 배제하고 있네요. CCTV 화질도 개선하고 흑백에 컬러도 입히고 있는데, 제목의 JPEG는 그런 거 지원 안 하죠.

이미지 화질 개선, 즉 CCTV의 화질을 개선하는 것은 어떤 측면에서는 개선은 아니죠. 인간에게 이미지가 개선되었다는 '감각'을 선사하는겁니다. 흑백에 컬러를 입히는 것도 마찬가지입니다. 흑백에 컬러를 입힌 이미지를 '생성'함으로서 인간에게 컬러 이미지의 '감각'을 선사하는거죠. 때문에 현재의 이미지 품질 향상 기술이 다루는 '개선'은 매우 좁은 측면에서 다뤄져야 하는 이슈입니다. CCTV 화질 개선에 대해 JPEG가 그런걸 지원하지 않는다는 비교는 무척 부당한 비교죠.

댓글 감사합니다. 같은 논리로 그런데 흐릿하다는 것도 어떤 측면에서는 열화가 아니고 열화된 걸 '생성'함으로써 '감각' 선사하는 거니까 때문에 매우 좁은 측면에서 다뤄져야 하는 이슈라 ChatGPT 수학 실력을 JPEG 열화와 비교하는 것도 무척 부당하겠네요? 정보량 자체를 늘릴 때 굳이 인간의 '감각' 같은 얘기할 필요 없을 것 같아요. 원본 컬러를 흑백 압축 시 용량 줄어들듯이 역으로 컬러 입히면 비트 용량뿐 아니라 정보량 자체가 늘어나는 점은 압축보다는 오히려 압축 해제, 또는 원본 복원과 비슷합니다. 원본 그 자체가 아니라고 흐릿하다는 게 훨씬 더 부당한 비교 같네요. 제목만 보면 DALL-E도 저용량 저해상도만 만들고 HD는 못 만드는 줄 오해하겠어요. 본문대로 JPEG 반복 압축 시 일반적으로 용량 줄고 화질 줄고 흐릿할 수밖에 없는데 딥러닝은 데이터 적은 수학 계산 시 흐릿할지언정 반대로 오히려 더 분명하고 정확하게 잘하는 부분도 있다는 사실이 간과 되지 않으면 좋겠네요.

말씀하신 내용 중에서 제가 간과한 부분은 하나도 없었어요. 원본을 만들고 계시는데 제가 '원본이 아니라 원본으로 감각되는 것'을 만들고 있다고 해서 무척 화가 나셨나봅니다. 그러거나 말거나 그게 심플한 사실인데 뭐 어떻게 합니까.

말씀대로 무척 화가 나거나 무척 부당하다는 감정 표현을 저는 하지 않았는데요? 그저 테드 창이라는 사람이 말했다는 이 기사 제목을 대중이 보고 간과할 것 같다는 걱정이 들었습니다. 대부분 동의하시는 것 같은데 개인적으로 알고 계셔서 다행이네요. 디지털로 아날로그 만들기 어려운 건 동의합니다. 텍스트 얘기라 논외지만.

제록스 복사기 문제는 내가 2022년에 배운 52가지 #33 에서도 봤던 내용이네요.
이게 이쪽으로 연결되니까 흥미롭고 이해가 팍~!