[사이드 프로젝트] 파이썬 프로젝트 추천

    저는 프로젝트 주제를 선택하는 데 어려움을 겪었다.

    그래서 벤치마킹 프로젝트를 진행하거나, 구글에서 "파이썬 프로젝트 추천" 또는 "프로젝트 주제 추천"을 검색해왔다.

    하지만 매번 정말 기초적인 프로젝트 이거나, 재미있을거 같지 않은 프로젝트만 추천받았다.

     

    예를 들어, 계산기 만들기, 자판기 만들기 같은 것들 말이다..

    그래서 새로운 프로젝트를 소개하고자 이 글을 적게 되었다.

     

    요즘 또 대학교에선 비전공이든 전공이든 파이썬을 많이 배우니 뭘 해야할까 라는 고민을 하는 사람이 많을거 같았기 때문이다. 

     

    물론 이번에 소개할 워드클라우드 프로젝트도 흔할 수 있지만 어쨋든 도움이 되길 바라며 글을 작성하게 되었다.


    워드클라우드란? 

    위와 같은 내용을 많이 보셨을 거라 생각합니다. 

    워드클라우드 ? 

    쉽게 말해  말 그대로 단어들을 구름처럼 표현하는 것이다.

    특정 문서나 텍스트 데이터에서 어떤 단어가 얼마나 자주 등장하는지를 분석해서, 그 단어들을 빈도수에 따라 크기나 색상 등으로 시각화해 보여주는 것이다.

     

    이렇게 보여지는 단어들 중에서 크고 진한 단어일수록 그 단어가 더 많이 등장했다는 뜻이다..

    요즘엔 데이터 시각화나 텍스트 분석에서 많이 활용되고 있다.

     

    워드 클라우드를 프로젝트로 추천하 이유는

    데이터 분석의 전 과정을 정말 얕은 과정으로 경험해볼 수 있을만한 주제이기 때문이다.

     

    먼저 텍스트 데이터를 가져오기 위한 크롤링, 데이터를 다듬기 위한 데이터 전처리, 그리고 분석, 그리고 시각화까지가 전반적인 프로세스를 경험할 수 있을것이다. 

     

    또한 합성어와 복합어를 어떻게 처리할지에 대한 고민 등 작은 프로젝트여도 많은 경험을 해볼 수도 있고,

     

    아래 이미지처럼 시각화를 했다면 웹서비스로 더 나아갈 수도 있고, 로그인 기능을 붙여서 사용자 마다 저장하는 기능도 넣을 수 있기 떄문이다. 

     

     

     

     

    아래 URL은 직접 개발한 소스코드를 담고 있으니 참고 바랍니다.

     

    GitHub - jisoo03010/WordCloud: 워드 클라우드: "단어 빈도 시각화로 텍스트를 한눈에 이해하세요."

    워드 클라우드: "단어 빈도 시각화로 텍스트를 한눈에 이해하세요.". Contribute to jisoo03010/WordCloud development by creating an account on GitHub.

    github.com

     

     

     

    728x90
    반응형

    댓글