Eli의 여백

바쁜 나날들 사이에서 생각났던 이런저런 것들을 적어봅니다.

IT/새로운 시도

Google 애널리틱스 4로 이전 및 유니버설 애널리틱스와 비교 (Looker studio 적용내역)

Eli♪ 2023. 6. 7. 19:36

작성계기

2020년도에 블로그 유입 통계에 구글 애널리틱스를 도입했었고 (도입 당시 썼던 글) 잘 사용하고 있었는데, 2023년 7월부터 유니버설 애널리틱스(UA) 속성으로는 더이상 데이터를 수집하지 않는다는 경고 문구가 떠서 약 한 달 전 GA4로 이전했었다. 그런데 아무래도 깔끔하게 이전되지 않는 느낌이 들어서 looker studio (舊 data studio) 에 GA4 속성을 직접 연결시키니 데이터를 제대로 받아오지 못해서 그래프들이 다 깨지는 문제가 발생했다. 결국 수동으로 마이그레이션을 완료했으나, UA 속성에서 GA4 속성으로 일대일 대응이 되지 않거나 2023년 6월 기준 아예 구현이 불가능한 측정항목들이 있었다. 7월 1일부로 강제 GA4 속성으로 전환된 이후에 UA 속성을 더이상 받아오지 못하므로 그전에 구글에서 하위호환을 고려하지 않는다면 UA 속성에 연동하여 데이터 프로세싱을 하고 있던 서비스들에서 대혼란이 일어날 것으로 예상한다. 직접 마이그레이션 해보고 느낀 차이점 및 한계점에 관해 기록으로 남겨 본다.

 

마이그레이션 전후 결과물 공유

마이그레이션 전(universal analytics 속성): https://lookerstudio.google.com/reporting/c3d5b780-1832-41b7-a3e0-da9f858d8aec

 

ProjectEli report

Looker Studio turns your data into informative dashboards and reports that are easy to read, easy to share, and fully customizable.

lookerstudio.google.com

 

마이그레이션 후(google analytics 4 속성): https://lookerstudio.google.com/reporting/942f8b68-4183-4fde-ab37-50f713e22e9d

 

ProjectEli(GA4) report

Looker Studio turns your data into informative dashboards and reports that are easy to read, easy to share, and fully customizable.

lookerstudio.google.com

 

변경사항

1. 페이지뷰 수 대신 조회수, 이탈률 대신 참여율 사용

GA4에서는 페이지뷰 수라는 측정항목이 존재하지 않는다. 대신 조회수 라는 항목이 있어서 그것으로 대체하면 된다. UA 속성에서 페이지뷰와 세션으로 이분화되어있던 유입 횟수 부분을 세션으로 일원화했기 때문에 조회수는 세션 기준으로 계산된다. 이 글에서는 자세히 다루지는 않지만, GA4의 데이터를 올바르게 분석하기 위해서는 세션 개념에 대해 잘 알아야 할 것이다. 또한 이탈률이라는 개념을 버리고 참여율이라는 항목이 도입되었다.

외부 글에 의하면 참여 세션 기준은 다음과 같다.

  • 10초 안에 액션을 취했을 때
  • 이벤트가 발생했을 때
  • 2개 이상의 페이지 조회가 실행되었을 때.

Looker studio에서 조회수 결과물 비교

바뀐 측정항목을 적용해 보니 실제 숫자는 아래와 같이 미묘하게 차이가 있다. internal traffic 제외를 테스트 레벨로 놔두고 완전히 활성화시키지 않았기 때문에 필자의 트래픽이 잡힌 것일수도 있다고 생각한다. 기존에 이탈률 항목은 매번 90% 가까이 나와서 이걸 보는게 무슨 의미가 있나 싶을 정도였는데 참여율 측정항목으로 바꾸고 나서 약 50% 정도의 세션에서 유의미한 이벤트가 발생했구나 하는 것을 확인할 수 있었다.

조회수 관련 (왼쪽=UA속성, 오른쪽=GA4속성)

 

2. 요일 필터에서 범위를 사용할 수 없음

정확한 이유는 모르겠지만, 주중 필터와 주말 필터를 만들어뒀던 그래프가 깨져서 어떻게든 되게 만들어보니 기존에 요일에 1부터 5까지 (월-금) 필터를 걸어놓은 것이 제대로 작동하지 않았다. 따라서 별 수 없이 아래와 같이 1~5에 대하여 각각 매칭되는 필터를 or로 걸어주니 정상 작동했다. 다른 속성에서도 이런 식으로 범위가 작동하지 않는지는 확인해보지 않았지만, 핵심 기능에 대한 심각한 버그라고 생각하고, 조속히 수정되어야 할 것으로 생각한다.

 

Looker studio에서 요일별 통계 결과물 비교

앞에서 조회수 다르게 잡힌 부분 빼고는 기본적으로 동일 항목을 측정한다고 봐도 될 것 같다.

요일별 통계 관련 (왼쪽=UA속성, 오른쪽=GA4속성)

 

3. 시간대별 측정을 사용할 수 없음

몇 시간을 찾아보았으나 결국 해결하지 못한 문제이다. 기존의 UA 속성에서는 시간대별 측정을 위해 hh 기준으로 된 측정항목이 있어서 1시간 간격으로 유입되는 사람 수 그래프를 그릴 수 있었으나, GA4 속성에서는 날짜까지만 정보가 수집되고 시간대별로는 수집되지 않는 것으로 보인다. 

 

참고자료 1 (질문자가 있고 same question이 수십 명 있으나 closed되었다. 이유는 불명): https://support.google.com/looker-studio/thread/209459237/why-is-date-time-not-appearing-when-using-a-ga4-property-as-a-data-source?hl=en 

 

Why is 'Date & Time' not appearing when using a GA4 property as a data source? - Looker Studio Community

 

support.google.com

참고자료 2 (GA4 is always 00:00:00 이라는 reddit 글): https://www.reddit.com/r/GoogleDataStudio/comments/y08tvv/timehour_of_ga4_data_is_always_000000_in/

 

r/GoogleDataStudio on Reddit: Time/hour of GA4 data is always 00:00:00 in DataStudio.

Posted by u/DGKenneth - 2 votes and 4 comments

www.reddit.com

Looker studio에서 시간대별 통계 결과물 비교

기존에는 1시간 단위로 유입자 수 패턴을 명확하게 파악할 수 있었는데, GA4에서는 시간대별 분류하는 기능을 찾지 못했다 (2023-06-07 기준). 만약 이런 데이터에 의존하는 서비스를 운영 중이라면 대응책을 미리 마련해 두는 게 좋을 듯하다.

시간대별 통계 관련 (왼쪽: UA 속성, 오른쪽: GA4 속성)

 

4. 유입 키워드 항목을 사용할 수 없음

사실 이게 모든 변동사항 중 가장 큰 문제라고 생각한다. 기존 구글 애널리틱스에서 키워드 라는 측정항목을 사용하면 구글 외부에서는 볼 수 없는 구글 검색어 내용을 볼 수 있었다. 그러나 GA4 속성에서는 키워드 항목이 아예 없다. 이를 대체할 수 있는 방법도 아직 찾지 못했다. 아마 query 라는 항목이 기존의 키워드를 대체하기 위해서 만들어진 것으로 보이는데, 2023-06-07 기준 google search console에 들어가서 보면 다음과 같이 검색어 항목이 잡히지만 GA4 및 looker studio에서 이 항목과 연동할 수 있는 방법을 찾지 못했다.

유입 키워드 관련 (왼쪽: 구글 서치콘솔 화면, 오른쪽: 서치콘솔과 연동된 구글 애널리틱스 화면. 쿼리에 아무것도 안 뜬다.)

인터넷을 좀 더 찾아보니 google search console과 looker studio를 연동할 수 있다는 글을 발견하였다.

https://measureschool.com/keywords-in-google-analytics-4/

 

How to See Keywords in Google Analytics 4 (2023)

This is a guide on keywords in Google Analytics 4. Learn the different methods to view what users were looking for before landing on your site.

measureschool.com

위 글의 절차를 따라서 데이터 소스에 search console을 추가하는 데에 성공했으나 query 항목이 제대로 작동하지 않았다.

또한 GA4 속성부터 table에 left join, inner join 등을 사용할 수 있게 변경되었는데, search console과 GA4 속성 간에 겹치는 부분이 거의 없어서 inner join을 사실상 사용할 수 없는 상황으로 판단했다.

혹시나 event에 organic search keyword를 넣을 수 있지 않을까 하는 생각을 해 보았으나, 시간이 없어 더 자세히 찾아보지는 못했다.

 

5. 세션 시간을 사용할 수 없음

아마 앞에서 설명했던 시간대별 측정항목을 사용하지 못하는 문제와도 연관되어있을 것으로 생각한다. 기존 UA 속성에서 세션 시간을 binning하는 함수를 만들어서 세션 시간별 페이지뷰 분석을 구현했었는데, GA4부터는 이러한 분석을 사용할 수 없는 것으로 보인다.

UA 속성에서 사용할 수 있던 세션 시간 항목

 

6. 방문 심도 항목 사용 불가

모든 측정이 세션 기준으로 돌아가기 때문에 이전 페이지를 기억해야 하는 방문 심도 측정 항목도 사용할 수 없게 되었다. 이것도 custom event를 새로 만들어서 하면 가능할지도 모르겠지만, 어쨌든 기본 측정 항목에서는 방문 심도를 사용할 수 없다.

UA 속성에서 사용할 수 있던 방문 심도 측정

 

7. 사용자 유형(신규/재방문) 항목 사용 불가

기존에 new visitor와 returning visitor 항목을 나눠서 측정하고 returning visitor를 milestone 항목으로 보고 있었는데, 더이상 해당 측정이 불가능했다. 역시 event로 만들면 가능할지도 모르겠으나 기본 항목에서는 제외된 것으로 보인다. 정확도가 떨어지더라도 구글이 알아서 어떻게든 추정해서 분류해주니 좋았는데 더이상 쓸 수가 없다...

UA 속성에서 사용할 수 있던 사용자 유형

 

8. 성별 측정항목에 unknown이 추가됨

기존 UA 속성에서는 구글이 어떻게든 사용자를 male 또는 female로 분류했었다고 하면 이제는 unknown을 명시해서 잘 모르겠으면 unknown에 넣어버리는 것으로 생각한다. 티스토리 블로그 통계에서 성별 정보를 아예 볼 수가 없었기 때문에 구글 애널리틱스의 성별 통계는 매우 유용한 자료로 참고하고 있었는데, GA4 속성으로 전환 후 성별 unknown 비중이 50%가 넘어가버려서 분석에 난항을 겪고 있다. 아무래도 일 조회수 1000이하라 더 그런 것 같다. 이제 표시되는 male과 female 분류에는 확신을 가질 수 있게 되었다는 점에서는 좋아진 것 같기는 하지만, 블로그 유입의 과반에 대해 깜깜이 상태로 분석을 해야하는 점은 불편하지 않을 수 없다.

 

Looker studio에서 성별 통계 결과물 비교

성별 통계 관련 (왼쪽: UA 속성, 오른쪽: GA4 속성)

 

GA4 적용 후기

이전 2020년 글에서 느꼈던 것처럼 그동안 google analytics에서 무차별적으로 수많은 데이터를 수집이 가능했었는데, 이번에 GA4로 넘어오면서 수집할 수 있는 데이터에 여러 제한사항이 생긴 것으로 확인했다. 필자의 경우 원래 되던 게 안되는 부분이 많은 것으로 보아 기존 UA 속성을 거의 한계까지 잘 쓰고 있었다는 반증이 되는 것 같다. 그러나 앞으로 해당 기능을 사용할 수 없다는 점은 씁쓸한 부분이다.

 

GA4 강제적용 시점부터는 방문자 입장에서는 사생활 보호가 그나마 조금이라도 더 될 수 있을 것 같고, 데이터 수집하는 사람 입장에서는 대충 뭉뚱그리는 타겟팅이 더 어려워지는 것으로 생각한다. 본인이야 블로그에 애드센스 등의 광고를 도입하고 있지 않아 금전적 이득과는 관계가 없는데, UA 속성에 연동해서 타겟팅 광고를 넣던 사람에게는 광고 수익에 중대한 문제가 발생할 수도 있다고 생각한다. 어떻게 보면 그동안 사용자의 명시적 동의를 구하지 않고 정보를 수집해서 이득을 취하고 있던 부분에 철퇴를 맞는 거라는 생각도 든다.

 

안 그래도 얼마 전에 github pages 한 개를 구현하면서 찾아본 내용 중 UI design에서의 dark pattern에 관한 글을 보고 많은 생각이 들었었는데, 이제 단물이 다 빠진 시점이라고나 해야 할까. 그리고 사이트 운영자들의 광고 수익이 떨어진다는 것은 곧 구글의 광고 수익 하락으로 이어질 것으로 예상해볼 수 있는데, 7월부터 GA4 강제가 시행된다면 그 영향은 빠르면 23Q3, 늦어도 Q4에 반영될 것으로 보인다. 아직까지는 이전 글에서 구글 주식 매도 결정을 한 것이 유효한 것으로..

 

하여간 유니버설 애널리틱스 속성에서 구글 애널리틱스 4로 이전을 고려하고 있는 사람들에게는 미리 준비하지 않으면 상당한 낭패를 볼 수 있는 부분이라고 생각하고, 이러한 변화가 정말로 사생활 보호에 도움이 되는지는 아직 잘 판단이 서지 않지만 적어도 사용자에게 부정적인 방향으로 가지는 않는 것 같아서 다행이라고 생각한다.

 

참고자료

[1] GA3와 GA4 차이: https://www.optimizesmart.com/understanding-google-analytics-4-sessions/

[2] How to see Keyworkds in Google Analytics 4: https://measureschool.com/keywords-in-google-analytics-4/

[3] How to extract Hour only from date time in Looker studio: https://stackoverflow.com/questions/75788846/how-to-extract-hour-only-from-date-time-data-that-has-utc-7-in-looker-studio

[4] Github에서 google tag 광고 정책 반대(FLoC 관련) 문구 삽입: https://www.clien.net/service/board/news/16113461