大數據技術的迅速普及,很多城市與媒體積極引入大數據輿情技術輔助輿情監測、管理與應對決策。那么大數據輿情監測分析的局限性有哪些呢?
大數據輿情監測分析的局限性:
一、樣本截斷問題
大數據輿情獲取的信息來源于網絡平臺,主要集中于網站及自媒體平臺的公開意見表達。第一,由于網絡、自媒體平臺的使用存在一定的門檻,從而天然的排除了很多年長不能使用網絡媒體或者經濟地位較低無法負擔網絡媒體者的意見。第二,雖然網絡存在一定的匿名性,但網絡意見的表達會受到因素的影響,并非所有的意見均會呈現在網絡空間中。
二、系統性偏誤
大數據輿情技術宣稱進行全網信息采集,一般不存在樣本容量擴大的問題。但在實際操作中,受限于抓取能力和時間成本,大數據輿情平臺的數據抓取也局限于雙微、新聞客戶端、媒體網站等。由于技術能力限制會導致樣本產生系統性偏誤,進而影響大數據輿情預警和決策能力。
三、情緒衡量偏誤
由于情緒的高度復雜性和漢語的語義模糊性,對情緒進行精確的區分的努力,即使是引入強大的機器學習技術,對情緒分詞處理仍存在一定的困難。近年新產生的一些情緒詞匯,由于語言的約定俗成性、新詞的不斷涌現會給情緒判斷帶來極大的困難。
四、遺漏變量偏誤
一方面,當個人意見與主流意見不一致時,個體會傾向于改變自己的意見或者干脆選擇沉默。另一方面,網絡上發表意見的人,隸屬于不同小團體進而在輿論領域進行競爭,群體中的個體會表達趨同的意見,進而隱藏個體的不同意見。這兩種機制的存在導致個體的意見表達并不能反映個體的真實意見,而在大數據分析中又難以對這兩種機制的影響進行剔除,可能會導致對輿情估計的偏大或偏小,也會導致輿情風險評估模型出現遺漏變量偏誤。
以上便是大數據輿情監測分析的局限性相關內容,<識微商情>專業輿情監控軟件_免費試用入口>>>
【文章聲明】識微科技網倡導尊重與保護知識產權。本網站文章發布目的在于分享輿情知識。部分內容僅是發稿人為完善客觀信息整理參考,不代表發稿人的觀點。未經許可,不得復制、轉載、或以其他方式使用本網站的內容。如發現本網站文章、圖片等存在版權問題,請及時聯系并發郵件至zhangming@civiw.com,電話:4008299196,我們會在第一時間刪除或處理相關內容。