# Linguistic Complexity and Socio-cultural Patterns in Hip-Hop Lyrics

### 저자

Aayam Bansal, Raghav Agarwal, Kaashvi Jain

### 개요

본 논문은 1980년부터 2020년까지 40년간 146명의 영향력 있는 힙합 아티스트의 3,814곡을 분석하여 힙합 가사의 언어적 복잡성과 사회문화적 동향을 포괄적으로 분석하는 계산 프레임워크를 제시합니다. 자연어 처리 기술을 사용하여 가사의 다차원적 복잡성을 정량화한 결과, 연구 기간 동안 어휘 다양성이 23.7% 증가했고, 동부 해안 아티스트가 다른 지역보다 17.3% 높은 어휘 변이를 보였습니다. 모든 지역에서 라임 밀도는 34.2% 증가했으며, 중서부 아티스트가 가장 높은 기술적 복잡성(행당 3.04개의 라임)을 보였습니다. 토픽 모델링을 통해 사회 정의 관련 주제는 28.5%에서 13.8%로 감소한 반면, 내성적 주제는 7.6%에서 26.3%로 증가하는 등 주제적 내용의 상당한 변화를 확인했습니다. 감성 분석 결과, 사회 정치적 위기 동안 가사의 부정적 정서가 0.31 감소하는 등 사회적 혼란 이후 가사의 극성이 유의미하게 감소했습니다. 다차원 분석 결과, 지리적 기원(r=0.68, p<0.001) 및 기간(r=0.59, p<0.001)과 강하게 상관관계를 갖는 4가지 독특한 스타일 접근 방식을 밝혀냈습니다. 이러한 결과는 힙합의 진화를 예술 형식과 사회 역동성의 반영으로서 정량적으로 증명하고, 대중 음악에서 언어적 혁신과 문화적 맥락 간의 상호 작용에 대한 통찰력을 제공합니다.

### 시사점, 한계점

- **시사점:**

    - 힙합 가사의 언어적 복잡성과 사회문화적 동향을 정량적으로 분석하는 새로운 프레임워크 제시

    - 힙합 음악의 시대적, 지역적 변화에 따른 언어적 특징 변화를 규명

    - 사회적 맥락과 힙합 가사의 감성 및 주제 변화 간의 상관관계 제시

    - 힙합 음악의 진화를 이해하는 데 대한 새로운 통찰력 제공

- **한계점:**

    - 분석에 사용된 데이터셋의 지역적, 아티스트적 편향 가능성

    - 자연어 처리 기술의 한계로 인한 분석의 정확도 제한

    - 사회문화적 요인 외 다른 요인들(예: 음악적 트렌드)의 영향 고려 부족

    - 분석 결과의 일반화 가능성에 대한 추가 연구 필요

[PDF 보기](https://arxiv.org/pdf/2505.00035)

![https://i.imgur.com/CR2eApO.jpeg](https://i.imgur.com/CR2eApO.jpeg)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
