文本分析之社會網絡關系圖

2024年2月6日 23点热度 0人点赞

社會網絡關系圖展示關鍵詞之間的關系情況,此處的關系是指‘共詞矩陣’,即兩個關鍵詞同時出現的頻數情況,將‘共詞矩陣’信息使用可視化方式進行呈現出來,接下來將分別闡述‘共詞矩陣’和‘社會網絡關系圖’。

共詞矩陣

首先看下一個共詞矩陣的例子,比如使用demo數據並且將詞頻前10的關鍵詞進行共詞矩陣展示如下圖:

上圖中共10個關鍵詞,第1行和第1列為關鍵詞名稱且完全對應。具體數據上,右下三角斜對角線為該詞的詞頻。其它數字為‘共現’次數(每行‘共現’次數之和)。關於共詞矩陣的計算發下所述:

特別提示:

  • 當兩個詞同時出現在某‘行’時,比如A出現5次且B出現7次,則記錄較小值為5次;

  • 如果兩個詞在某‘行’時並沒有同時出現過則記錄為0;

  • 假如有10行,A和B每行的‘共現’次數分別均為5,那麼總‘共現’次數為10*5=50。

上述共詞矩陣可以直接在頁面進行下載,下載地如下圖:

社會網絡關系圖

社會網絡關系圖將共詞矩陣信息進行展示,包括是否有共詞關系(共詞次數>0則有共詞關系,等於0則說明沒有同時出現過),共詞次數情況等。在社會網絡關系圖時,可使用線條粗細展示共詞次數,越粗則表示共詞次數越高,當然也可選擇顏色深淺或者固定線條大小。除此之外,還可設置社會網絡關系圖的風格,是否使用放大鏡(魚眼)等,通過設置圖的樣式等,直觀展示關鍵詞之間的關系情況,默認進入的時候,SPSSAU選中詞頻排名前20的關鍵詞進行分析,demo事例數據後結果如下圖:

默認情況下,系統會選中排名前20的關鍵詞進行共詞矩陣構建和社會網絡關系圖呈現,也可以自由的選擇比如前10名,前30名,前40名,也或者自由的選中(或者搜索選中)需要分析的關鍵詞,更加自由靈活地進行分析的。使用‘選擇分析詞’功能即可進行選擇,如下圖所示:

最後,還可通過單擊表格中的關鍵詞,查看該關鍵詞與其餘分析詞之間的共詞次數情況,比如選中‘建設’這個關鍵詞後,其出來結果如下,明顯地可以看到,建設與‘建設部’、‘城鄉’和‘住戶’這三個詞之間的關系較為緊密。