1P by neo 3일전 | ★ favorite | 댓글 1개

소개

  • 프랑스의 한 서브레딧에서 "기차역에 가까울수록 케밥이 맛이 없다"는 가설을 접하게 됨.
  • 이 가설에 대한 논란이 있었고, 이를 검증하기 위해 비공식적인 "연구"를 수행하게 됨.

방법

  • 연구 지역으로 파리를 선택함. 이는 프랑스 서브레딧에서 시작된 가설이기 때문임.
  • OSMnx를 사용하여 파리의 도보 네트워크 데이터를 다운로드하고 저장함.
  • Google Places API를 사용하여 케밥을 제공하는 식당 데이터를 수집함. 그러나 API의 제한으로 인해 일부 어려움이 있었음.

네트워크 데이터

  • 파리의 기차 및 지하철역 데이터를 수집함.
  • OSMnx를 사용하여 철도 및 지하철 입구를 필터링함.

식당 데이터

  • Google Places API를 사용하여 케밥을 제공하는 식당을 검색함.
  • API의 제한으로 인해 일부 데이터 수집에 어려움이 있었음.

경로 및 거리

  • 각 식당에서 가장 가까운 역 입구까지의 거리를 계산함.
  • NetworkX를 사용하여 네트워크 분석을 수행함.

결과

  • 피어슨 상관계수가 0.091로, 가설이 어느 정도 사실일 수 있음을 시사함. 그러나 상관계수가 매우 약함.
  • 이상치를 제거한 후에도 상관계수는 0.098로 크게 개선되지 않음.

토론

  • Google 리뷰가 케밥의 맛을 객관적으로 측정할 수 있는지에 대한 의문이 제기됨.
  • 관광이 리뷰에 영향을 미칠 수 있음.
  • Google 결과의 정확성에 대한 논의가 있었음.
  • 초기 가설이 너무 구체적이어서 일반적인 식당을 포함하지 않음.
  • 리뷰 수가 결과에 영향을 미칠 수 있음.

결론

  • 연구는 재미있었고, 다른 사람들도 이러한 실험을 시도해보기를 권장함.
  • 파리의 특정 조건이 가설에 영향을 미쳤을 가능성이 있음.
  • 추가 연구를 계획 중임.
Hacker News 의견
  • "OP"임. 처음 이 글을 쓴 지 일주일 조금 넘었는데, 인터넷에서 퍼지는 걸 보니 재미있음. 몇 가지를 명확히 하고 싶음

    • 이 글은 일종의 밈이었음. r/gis에 원래 글을 올리기 위해 빠른 "연구"(또는 "분석")를 했지만, 사람들이 이 문제를 진지하게 받아들인 것에 놀랐음. 좋은 케밥은 중요한 문제인 것 같음
    • 다른 사람들이 지적했듯이, 선형 상관관계는 "가설"을 테스트하기에는 잘못된 접근이었을 가능성이 높음. 프랑스 글의 원래 표현이 그렇게 암시했지만, 되돌아보면 특정 반경 내의 케밥 가게들이 평균적으로 나쁜 것 같음
    • 파리는 연구 지역 중 하나로 좋지 않았음. 기차역 근처에 아주 좋은 케밥 가게들이 있음
    • 2부를 시작해야 할 것 같음
  • 베를린에는 수천 개의 케밥 가게가 있음. 대부분은 동네에 자리 잡고 있으며, 현지인들이 자주 찾음. 품질은 다양함. 많은 곳이 음식 제공보다는 돈세탁 사업(현금만 받음)을 목표로 하는 것 같음. 위생이 나쁘고 서비스가 무관심함. 이런 곳들은 사업 관점에서 완전히 무의미함. 돈세탁을 제외하면. 이런 곳들은 오래되고 더러워 보이며, 손님이 거의 없음. 점심/저녁 시간에 아무도 먹지 않으면 피하는 게 좋음

    • 그리고 정말 뛰어난 곳들이 있음. 제대로 된 숯불 그릴을 사용하고, 직원들이 친절하고 고객 서비스에 집중함. 이런 곳들은 훌륭하고 일반적으로 가성비가 좋음. 자체적으로 고기를 양념하고 표준 케밥 외에도 다양한 메뉴를 제공함. 베를린에 있다면, 어느 지역에 가야 할지 조언을 받는 것이 좋음. 놀라운 케밥 레스토랑들이 있으며, 대부분 오랫동안 운영되고 있음
    • 세 번째 카테고리는 여행자나 술 취한 사람들을 대상으로 하는 늦은 밤과 여행 핫스팟에 있는 곳들임. 이 고객층을 위한 경쟁이 치열하며, 사람들이 우회해서라도 가는 좋은 선택지가 있음. 많은 곳이 잘 운영되며, 처리량과 일관성을 최적화함(반드시 높은 품질은 아님)
  • 이 글의 제목을 업데이트해야 할 것 같음. 현재 상위 댓글의 절반이 연구가 가설을 확인했다고 가정하고 있음

    • Pearson 상관계수가 0.091로, 데이터는 이것이 사실일 수 있음을 나타냄. 상관관계가 너무 약해서 '통계적으로 유의미하지 않다'고 부르는 것이 관대할 정도임
  • 추가할 하위 가설: 기차에서 내린 사람들이 일반 인구보다 더 배고프고, 배고픈 사람들은 일반적으로 더 호의적인 리뷰를 줌

  • 기차역과 케밥 리뷰 사이에 상관관계를 찾지 못했음. 통계 수업에 좋은 연구임

  • Trip Advisor에서 Best Kebab 리뷰 읽는 것을 항상 좋아함. Queen Street 기차역 바로 옆에 있어서 연구와 맞음

    • 음식이 익지 않았을 뿐만 아니라, 칩과 치즈에서 음모를 발견했음. 문제를 보고하자 칼로 쫓아옴. Dundas Street에서. 정말 충격적임
  • 이 말은 개발도상국에서는 여전히 유효함. 도시나 마을에 하나의 주요 기차역이나 버스 정류장이 있는 경우에 해당됨. 이런 곳들은 1년에 한 번도 돌아오지 않을 일회성 고객을 대상으로 함. 메트로를 포함하는 것은 이 말이 유래된 실제 상황을 위반함. 파리에서 식품 안전과 품질을 엄격히 시행하는 것은 실제로 검증되지 않을 것임

  • 그리스에서 수블라키에 대해 정확하다는 것이 매우 재미있음. 반대로 일본의 역에서 음식의 품질에 놀랐음. "수상한" 가게들이 일본에서 먹어본 최고의 라면/우동을 제공했음

  • 모든 레스토랑의 모든 입구로 경로를 설정할 수 있었음. 하지만 몇십 년이 걸렸을 것임. 파리의 상대적으로 작은 도로 네트워크에서 표준 다대다 라우팅 문제로 보임. 왜 몇십 년이 걸렸을까? 단순한 Dijkstra를 구현해도 1분 이상 걸리지 않을 것임

  • 베니스에서 피자 한 조각의 가격으로 San Marco까지의 거리를 추정할 수 있다는 이론을 개발했음. 더 비싸면 더 가까운 것임. 테스트해본 적은 없지만, 히트맵을 보는 것이 재미있을 것임