반응형
pandas
-
해시태그로 알아본 건설사 인기도 전처리네이버 블로그 태그 개수 2023. 5. 29. 01:05
먼저 건설사에 대한 정보를 가져오기위하여 2022년 도급순위파일을 가져왔다. https://www.worker.co.kr/link/2002R100.asp 해당파일은 다음과 같이 상호, 대표자, 소재지, 전화번호부터 각각 어떻게 도급순위가 평가되었는지를 알수있는 파일이다. 인기도를 확인하려면 역시 상호만 필요하다. 여기서 고민이 생겼다. 주식회사, (주)ㅁㅁ건설, ㅁㅁ건설(주) 등 주식회사임을 나타내는 순서가 각 회사마다 다양하다.. -> 결국 알아주는건 대표적인 브랜드이지 않을까 싶기도하고, 따라서 주식회사, (주) 등은 다 빼버리고 이후 이름이 중복되는건 더 유명한 회사의 게시글이지 않을까 싶어서 중복은 제거해버린다. 위와같은 엑셀자료를 불러오면 다음과 같이 순서가 너무 뒤죽박죽이되어버린다. 편하게하려..