結論與討論
首先,情緒詞典資料不平衡是影響模型預測結果的重要因素之一。不同情緒象限中的字詞數量並不平均,容易使模型在訓練過程中偏向學習樣本數較多的情緒類型,進而影響整體預測表現。
其次,中文情緒詞彙具有高度的語境依賴性。同一個詞彙在不同的歌詞或句子情境中,可能呈現出不同甚至相反的情緒含義,這使得無論是詞典式情緒分析方法或機器學習模型,在判斷情緒時都面臨一定程度的挑戰。
第三,情緒本身具有主觀性。即使在人工標註的過程中,不同標註者也可能因為個人理解與情緒感受差異,而對同一段歌詞給出不同的情緒判定。因此,在情緒分析中,模型的預測結果並不一定存在唯一的「正確答案」。
綜合而言,本研究結果顯示,在歌詞情緒預測中,結合深度學習方法並保留完整文本語境的模型,能夠獲得較佳的預測效果。然而,資料品質、標註方式以及情緒分類標準等因素,仍然是未來研究中值得進一步優化與改進的重要方向。
♬模型預測成功率比較
我們將各個模型的預測成功率整理成以下表格:
| 模型 | 成功率 |
|---|---|
| 詞典法【情緒類別】 | 39% |
| 詞典法【VA值】 | 49% |
| BERT微調【情緒類別】 | 45% |
| BERT微調【VA值】 | 47% |
| BERT微調【歌詞】 | 74% |
結果顯示 BERT微調【歌詞】是最佳,成功率達到74%。