본문 바로가기
중국어 빅데이터/개인 프로젝트

중국 내 인기 한국 웹툰의 흥행 요인 분석 - 중국 Z세대 여성을 중심으로

by cxcwin 2023. 7. 29.

(프로젝트라고 이야기하기 민망하지만)
본 프로젝트는 학부시절  "중국어 빅데이터 이해"라는 수업을 듣고 기말 보고서로 제출했던 것이다. 

 

총 두 개의 게시물을 올릴 예정인데, 현재 게시물에 첨부되어 있는 보고서는 중국 프로그램을 활용해 작성한 것이고, 이후 올릴 게시물의 첨부 보고서는 같은 내용을 파이썬을 활용해 작성한 것이다.


<주제 선정 계기>

개인적으로 웹툰을 굉장히 좋아해서 여러 플랫폼을 이용하고 있고(네웹 쿠키 상위 2%, 카카오웹툰, 카카오스토리, 레진, 봄툰, 코미코, 만화경 등), 더 볼 게 없어서 만화과 온라인 졸전도 찾아보고 있으며, 작가님 덕질도 하고 있는 사람인데^^

아무래도 관심사가 이렇다 보니 자연스럽게 중국 웹툰 시장도 궁금해지기 시작했다. (중국어 전공자이기 때문이다.)

 

'한국 웹툰이 전세계적으로 잘 된다던데 진짜인가?' 

'특히 중화권에서 인기가 많던데 대체 어떤 부분이 먹혔던 거지?'

'중국 독자들의 반응을 파악한 후 현지화하여 콘텐츠를 수출한다면 더 좋지 않을까?'

'근데 중국 독자 반응을 확인하려면 어떤 플랫폼을 이용해야 하지?'

'동만만화를 이용하자!'

 

웹툰 pd 직무에 관심이 있었던 터라 위와 같은 흐름으로 사고가 흘러갔는데,  독자 반응 데이터를 수집하여 근거로 제시하면 나중에 여러 관계자들 설득하기도 좋을 것 같다는 생각이 들었다.

그래서 이번에 특정 장르 웹툰 몇 개를 선정해 댓글 반응을 수집하여 '중국 내 인기 한국 웹툰의 흥행요인 분석'이라는 보고서를 작성하게 되었다. 

 

** 이 수업은 해당 분야에 대한 관심을 이끌어내기 위한 목적으로 진행되었고 기초 수업이라 사실상 노가다 작업이 전부였다. 이쪽 분야 공부하신 분들이 보면 장난 수준이라는 생각이 들 것 같다. 지금 NLP 공부하고 있는데 너무 어려워서 큰 충격을 받고 있기 때문이다^^ **

 


<작업 과정>

1. TEXT 수집

     * 수동수집과 자동수집 병행 

2. TEXT 전처리

     * Notepad++ 에서 정규표현식 사용하여 불필요한 텍스트 삭제

     * CorpusWordParser 프로그램으로 단어 분리 (사용자 정의 사전 통해 한 단어로 묶어주는 작업 동시 진행)

3. AntConc 이용하여 Word와 Keyword 분석

4. 빈도표 제작, Ngram 문맥 분석

5. 보고서 작성

 


<작업물>

 


 

<아쉬운점>

1. 기술적으로 부족했다.

2. 피드백을 받지 못해서 뭘 수정해야 좋을지 알 수 없었다.

    (사실 내가 여쭤봤으면 해 주셨을 텐데 내가 베트남에 있어서 못 여쭤봤다.)

3. 시간이 없어서 원래 웹툰 4개 하려고 했는데 2개밖에 못 했다. 그리고 지금 봤는데 오타 있음;;

4. 고퀄의 ppt란 무엇인가? 광고 동아리를 했어야 했다. 

5. 발표도 해봤으면 좋았을 텐데

 

등등 아쉬운 점이 많다. 하지만 너무 재밌게 공부했기에 다른 친구들도 꼭 이 수업 듣고 먹고 살길을 잘 찾아갔으면 좋겠다

교수님 최고 ^^

 

 


 

 

+ 잡소리

2022년 2학기에 이 수업을 듣고, 2023년 1학기에 파이썬으로 텍스트 처리 배우면서 "와 나 좀 진화했네."라고 생각했었는데 ㅋ23년 7월 현재, 크롤링으로 텍스트 수집하고 파이썬으로 텍스트 전처리 후 딥러닝 통해 모델 만들어서 미래를 예측하거나 분류를 하는,, 개미친 NLP 분야가 있다는 것을 알고,, 내가 한 건 아무것도 아니구나 라는 생각에 굉장히 충격을 받았다...

 

어? 인생은 말이야 통계학과나 산업공학과를 나와야 했다고 ;

근데 뭐 어쩔 수 없지

걍 가보자고