每日經(jīng)濟新聞 2017-09-25 17:49:20
在2017中國上市公司口碑榜第二階段的評選中,我們運用了輿情數(shù)據(jù)采集、處理、分析等手段。
《每日經(jīng)濟新聞》專訪了本次口碑榜獨家數(shù)據(jù)支持慧科訊業(yè)的相關(guān)部門負(fù)責(zé)人,以期向您展示他們對大數(shù)據(jù)行業(yè)未來發(fā)展的深思。
每經(jīng)編輯 每經(jīng)記者 左越
每經(jīng)記者 左越 每經(jīng)編輯 肖鴻月
上周,2017中國上市公司口碑榜結(jié)束第二階段的篩選,誕生了600家上市公司的入圍名單。
在第二輪篩選中,大數(shù)據(jù)起到了至關(guān)重要的作用?!睹咳战?jīng)濟新聞》(以下簡稱NBD)專訪了本次口碑榜獨家數(shù)據(jù)支持慧科訊業(yè)(以下簡稱Wisers)的相關(guān)部門負(fù)責(zé)人,為您揭秘大數(shù)據(jù)技術(shù)在口碑榜中的運用。
NBD:作為2017中國上市公司口碑榜獨家數(shù)據(jù)提供商,慧科訊業(yè)在對輿情數(shù)據(jù)采集、處理、分析上,具備哪些獨特的實力呢?
Wisers:慧科訊業(yè)1998年成立于香港,是全球領(lǐng)先的全媒體大數(shù)據(jù)智能商業(yè)情報專家?;劭苹诮?0年的海量媒體數(shù)據(jù)積累,憑借先進(jìn)的人工智能技術(shù),通過科學(xué)的分析建模,為全球超過2500家客戶提供創(chuàng)新的產(chǎn)品服務(wù)和解決方案。
數(shù)據(jù)采集方面,慧科全媒體數(shù)據(jù)庫從1998年累積至今,目前的文章存儲量已經(jīng)達(dá)到了590億篇,每天新增文章量有6800萬篇。全方位覆蓋了報刊、網(wǎng)站、APP、微博、微信、論壇、問答、視頻、電視等各類媒介;除了中國大陸,還有來自港澳臺及海外其他地區(qū)的媒體數(shù)據(jù),目前信息來源總數(shù)將近50萬,這個數(shù)據(jù)還會隨著新媒體的發(fā)展不斷增長。
處理和分析方面,慧科擁有自己的人工智能研究院,專注研發(fā)文本分析挖掘引擎,結(jié)合深度的行業(yè)知識圖譜,可以實時提取新聞和社交媒體中涉及各類主體,比如公司、品牌、產(chǎn)品、人物、股票等相關(guān)信息,并通過句法分析和機器學(xué)習(xí),對這些不同主體進(jìn)行情感判斷與關(guān)聯(lián)。
與其他大數(shù)據(jù)公司相比,慧科始終致力于媒體大數(shù)據(jù)的商業(yè)應(yīng)用,助力企業(yè)及機構(gòu)客戶進(jìn)行口碑聲譽管理、提升品牌價值、發(fā)掘市場情報、強化商業(yè)風(fēng)控、輔助戰(zhàn)略決策等。我們的客戶來自財富500強、上市公司、央企集團、政府機關(guān)、教育以及媒體機構(gòu),經(jīng)過多年合作,都對慧科的服務(wù)高度認(rèn)可。
NBD:能談?wù)勢浨榇髷?shù)據(jù)在對上市公司的日常經(jīng)營和對投資者的投資上,有哪些作用和幫助嗎?
Wisers:隨著移動互聯(lián)網(wǎng)的發(fā)展,媒體的話語權(quán)越來越去中心化。在主流媒體之外,以微博、微信為主的社交平臺,各種資訊類APP以及多平臺分布的自媒體,都會對上市公司的口碑,甚至資本市場表現(xiàn)產(chǎn)生影響。
現(xiàn)在,大多數(shù)上市公司都會采用輿情監(jiān)測服務(wù)及時跟蹤行業(yè)動態(tài)、國家相關(guān)政策、發(fā)現(xiàn)自身及競爭對手的資訊,尤其是那些可能影響股價的敏感新聞,做好風(fēng)險管控;另外,輿情大數(shù)據(jù)還可以幫助上市公司了解自身在各利益相關(guān)方,包括媒體、股東、客戶、合作伙伴、員工等心目中的形象,并根據(jù)各方反饋做好對外溝通,尤其在輿情危機管理方面,第一時間將危機的影響最小化。
對于投資者來說,輿情其實是市場對于上市公司的態(tài)度與信心的反映。輿情大數(shù)據(jù)能夠幫助投資者在投資之前,更加客觀全面地了解企業(yè)現(xiàn)狀,衡量投資風(fēng)險。比如許多境外投資者與投資機構(gòu),會利用社交媒體去了解企業(yè)在本土的口碑與形象,作為參考,輔助投資決策。
以此次口碑榜為例,慧科與每日經(jīng)濟新聞共同制定的評選標(biāo)準(zhǔn)會綜合考量公司的經(jīng)營合規(guī)性、盈利能力、高管團隊聲譽等可能影響股價波動的因素,口碑指數(shù)高的公司相對而言也更穩(wěn)定,更可靠,盈利能力更強,對投資者來說就是一種有效參考。
NBD:在輿情服務(wù)上,慧科訊業(yè)還涉足了金融及風(fēng)險監(jiān)測解決方案等多個業(yè)務(wù)范疇。在這些業(yè)務(wù)范疇上,慧科訊業(yè)成績?nèi)绾危?/strong>
Wisers:慧科根據(jù)多年服務(wù)金融客戶的經(jīng)驗,結(jié)合客戶需求和我們的人工智能技術(shù),開發(fā)了系列分析模型,用來解決金融及風(fēng)險監(jiān)測領(lǐng)域的問題。
根據(jù)慧科金融產(chǎn)品總監(jiān)李曉偉介紹,目前比較應(yīng)用比較成熟的有三大模型:
第一個,是AI盡調(diào)決策模型,依托宏觀、中觀和微觀三種數(shù)據(jù),實現(xiàn)某個企業(yè)的盡調(diào)分析,其中宏觀數(shù)據(jù)包括,國民經(jīng)濟數(shù)據(jù)、各地區(qū)經(jīng)濟數(shù)據(jù)、政府相關(guān)政策及法律、金融政策與環(huán)境、國際政治經(jīng)濟環(huán)境等;中觀數(shù)據(jù)包括,行業(yè)整體現(xiàn)狀及趨勢,行業(yè)政策、行業(yè)重大事件等;微觀數(shù)據(jù)包括,公司公開披露數(shù)據(jù)、政府或監(jiān)管執(zhí)法機構(gòu)公開數(shù)據(jù)、第三方評級研究數(shù)據(jù)、媒體及社交媒體數(shù)據(jù)等,前這個模型已經(jīng)服務(wù)于銀行類客戶的風(fēng)控體系中。
第二個,是企業(yè)全息畫像,通過企業(yè)在股權(quán)投資、公司集團及家族圖譜、高管、工商、稅務(wù)、行業(yè)、上下游、借貸及擔(dān)保關(guān)系中的表現(xiàn)展開關(guān)聯(lián)分析和挖掘,自動化生產(chǎn)企業(yè)標(biāo)簽;通過識別關(guān)聯(lián)關(guān)系中跨境、動態(tài)、聯(lián)動的風(fēng)險,來評估企業(yè)外圍潛在風(fēng)險,整體評估企業(yè)發(fā)展環(huán)境。
第三個,是量化分析的情緒因子模型,通過對上市公司股價波動、公司運營信息、意見領(lǐng)袖言論,個人投資者情緒、機構(gòu)評級等各路數(shù)據(jù),建立投資者情緒指標(biāo),為投資和監(jiān)管提供依據(jù),目前這個模型主要服務(wù)于多家證券、私募公司,成為他們量化指標(biāo)體系構(gòu)成元素之一。
NBD:近一兩年來,國內(nèi)大數(shù)據(jù)公司數(shù)量漸多,雖然領(lǐng)域各有側(cè)重但其中也難免重疊。慧科訊業(yè)在面對大數(shù)據(jù)行業(yè)的競爭當(dāng)中,擁有哪些優(yōu)勢呢?
Wisers:大數(shù)據(jù)是個很寬泛的概念,具體到每個領(lǐng)域,都需要長期、系統(tǒng)的數(shù)據(jù)積累和專業(yè)精深的數(shù)據(jù)挖掘能力。大數(shù)據(jù)的商業(yè)應(yīng)用,有四個關(guān)鍵要素,一是數(shù)據(jù),二是AI人工智能技術(shù),三是業(yè)務(wù)知識體系,四是后臺大數(shù)據(jù)計算與存儲系統(tǒng)。
數(shù)據(jù)方面,剛才已經(jīng)提到過,慧科擁有全球領(lǐng)先的中文全媒體大數(shù)據(jù)資訊庫。
慧科數(shù)百位專職語言學(xué)編輯團隊在服務(wù)各行業(yè)客戶的同時,也在不斷提供大量標(biāo)注數(shù)據(jù)供AI研究院訓(xùn)練人工智能分析模型,以適應(yīng)快速變化的信息世界。
根據(jù)慧科研究部總監(jiān)何超博士的介紹,2014年創(chuàng)建的慧科人工智能技術(shù)研究院擁有20多個世界知名院校博士碩士組成的專家團隊,成功研發(fā)出了一系列覆蓋媒體資訊自動化處理與大數(shù)據(jù)挖掘各個層面的自有先進(jìn)技術(shù),包括分詞、實體識別、關(guān)系抽取、話題分類、文本聚類、情感分析、事件發(fā)現(xiàn)、知識圖譜、與圖像識別等。這些技術(shù)名稱并不新奇,但慧科的每一項分析技術(shù)都是基于自身擁有的全媒體數(shù)據(jù)庫,并從實際的商用場景出發(fā),不斷嘗試及優(yōu)化的成果。
業(yè)務(wù)知識體系方面,慧科在近二十年服務(wù)2500多家客戶的過程中,積累了大量的行業(yè)知識,借助AI技術(shù)對第三方公開的或者一些授權(quán)數(shù)據(jù)進(jìn)行了整合,形成了慧科商業(yè)知識圖譜,包含了公司、品牌、產(chǎn)品、地點、人物在內(nèi)的30多萬知識節(jié)點,以及50多萬關(guān)聯(lián)關(guān)系,而且這個圖譜還在持續(xù)擴展。
后臺大數(shù)據(jù)計算與存儲方面,慧科一直采用云端平臺的產(chǎn)品模式,積累了大量的后臺大數(shù)據(jù)計算、存儲、與查詢的技術(shù)和經(jīng)驗;并不斷與時俱進(jìn),借鑒和應(yīng)用最新的大數(shù)據(jù)處理與存儲框架。
慧科在媒體大數(shù)據(jù)方面的努力,已經(jīng)得到了專業(yè)機構(gòu)的認(rèn)可,也拿到了不少國內(nèi)外的獎項。今年6月,中國最大的大數(shù)據(jù)公益組織——中國首席數(shù)據(jù)官聯(lián)盟正式發(fā)布《中國大數(shù)據(jù)企業(yè)排行榜V4.0》,慧科訊業(yè)連續(xù)第三次上榜,并在基礎(chǔ)設(shè)施排行“文本數(shù)據(jù)挖掘”類別排名上升至第二名,彰顯了慧科大數(shù)據(jù)技術(shù)綜合實力不斷提高,持續(xù)不斷地產(chǎn)品創(chuàng)新獲得市場高度認(rèn)可。今年1月,慧科還被全球知名市場研究機構(gòu)Outsell列為全球十大重點關(guān)注的公關(guān)解決方案和社交媒體監(jiān)測領(lǐng)域企業(yè)之一。
NBD:在您看來,輿情大數(shù)據(jù)行業(yè)在發(fā)展中面臨有哪些機遇和挑戰(zhàn)?
Wisers:首先,新媒體時代的來臨,信息的傳播渠道日益多元,對企業(yè)來說,要應(yīng)對的輿情環(huán)境,相較過去復(fù)雜了很多。對處于這個行業(yè)中的大數(shù)據(jù)公司來說,如何幫助企業(yè)從容應(yīng)對日益復(fù)雜的媒體環(huán)境,是一種挑戰(zhàn)?;劭茷榇撕茉缇妥龊昧藴?zhǔn)備,成立了專門的媒體管理咨詢部,定期對中國媒體現(xiàn)狀及發(fā)展趨勢做梳理,每當(dāng)有新的媒體形式出現(xiàn),就會對其進(jìn)行深入全面的調(diào)研,并思考這類信源對客戶的口碑及聲譽管理意味著什么?是否值得監(jiān)測?從技術(shù)角度如何監(jiān)測?監(jiān)測到的數(shù)據(jù)又該如何評估?機遇總是留給那些早有準(zhǔn)備的頭腦,慧科就是在這樣不斷升級換代中建立起多層次媒體信源的輿情管理體系,幫助企業(yè)從容應(yīng)對新媒體時代的各種挑戰(zhàn),從而贏得客戶的高度認(rèn)可。
其次,自然語言理解,尤其是漢語的自然語言理解仍然面臨很多挑戰(zhàn)。以深度學(xué)習(xí)為代表的技術(shù),對解決這些問題提出了一種新的思路,但是同樣會面臨瓶頸。據(jù)長遠(yuǎn)來講,必須以科學(xué)的方式,將語言學(xué)的理論及特征和機器學(xué)習(xí)結(jié)合起來,才有可能實現(xiàn)更大的突破。
目前,有很多開源的機器學(xué)習(xí)或深度學(xué)習(xí)的軟件包,進(jìn)入人工智能大數(shù)據(jù)領(lǐng)域的門檻降低很多,所以市場上充斥著大量的大數(shù)據(jù)公司。但是如果從業(yè)人員不深入研究理解各種人工智能模型成立背后的假設(shè)條件,只懂得簡單盲目地試用各種開源模型,然后選一個看上去訓(xùn)練結(jié)果最好的模型,很可能在假設(shè)條件不成立的實際場景中,會出現(xiàn)嚴(yán)重的錯誤。而慧科的人工智能的開發(fā)工作從一開始就與實際商業(yè)應(yīng)用場景緊密結(jié)合,換句話說,是經(jīng)過市場檢驗并獲得資本認(rèn)可的,因此能一直走在行業(yè)前端。
最后,輿情大數(shù)據(jù)行業(yè)的進(jìn)一步發(fā)展,應(yīng)該著重于如何將企業(yè)或政府內(nèi)部的數(shù)據(jù)與外部的媒體大數(shù)據(jù)結(jié)合起來,將輿情資訊緊密結(jié)合進(jìn)機構(gòu)的日常運營與決策,從而發(fā)掘更多的數(shù)據(jù)關(guān)聯(lián)與洞察資訊,帶來更大的商業(yè)價值和社會價值。
NBD:您如何看待大數(shù)據(jù)公司和媒體的合作?
Wisers:根據(jù)慧科媒體管理部總監(jiān)王勤的介紹,去年以來,國內(nèi)各大媒體都成立了數(shù)字新聞部并引入大數(shù)據(jù)合作伙伴。慧科已經(jīng)和國內(nèi)三大商業(yè)財經(jīng)報刊以及新京報等重要媒體,在上市公司、消費品牌、金融科技以及社會民生多方面,聯(lián)合發(fā)布基于大數(shù)據(jù)分析的各類專題新聞報道及榜單評選。
媒體的優(yōu)勢在于對熱門事件的敏銳嗅覺,以及前線采訪整理出的獨家觀點,這些媒體視角可以幫助大數(shù)據(jù)公司進(jìn)一步發(fā)掘其數(shù)據(jù)價值。例如慧科此次與每日經(jīng)濟新聞合作的上市公司口碑榜,就是基于慧科日積月累的全媒體大數(shù)據(jù),將其中關(guān)于上市公司的數(shù)據(jù)篩選出來,再根據(jù)雙方商定的輿情表現(xiàn)評選標(biāo)準(zhǔn)進(jìn)行分析,就形成了有價值的上市公司口碑榜。
而大數(shù)據(jù)公司對媒體的價值,可以概括為兩點:
首先,媒體對新聞事件的洞察需要數(shù)據(jù)的佐證,從而使新聞內(nèi)容更具有客觀性、說服力。例如去年我們和每日經(jīng)濟新聞合作的歐冠杯數(shù)據(jù)專題,通過對微博平臺上數(shù)萬條用戶對歐冠杯討論的數(shù)據(jù)分析,我們捕捉到了球迷們最關(guān)注的球星、最津津樂道的場外話題以及提及最多的體育類概念股。這些結(jié)論,在過去,可能主要倚賴專業(yè)編輯的敏銳度,或者線下采訪與讀者調(diào)研,而借助慧科的全媒體數(shù)據(jù)庫,不到一周就可以把線上用戶的評論口碑采集下來,經(jīng)過進(jìn)一步的數(shù)據(jù)清洗、處理、分析,得到更加全面而客觀的結(jié)論。
其次,大數(shù)據(jù)還可以為媒體的新聞挖掘提供更多的切入點,還以這次口碑榜為例,這次我們基于每日經(jīng)濟新聞初選后的1200多家公司進(jìn)行口碑評選,我們采集了主流媒體上有關(guān)這一千多家公司的175萬條新聞報道,通過AI技術(shù)全量分析每條新聞的情感態(tài)度,進(jìn)而得到每家上市公司的輿情表現(xiàn)及排名。每日經(jīng)濟新聞可以通過這個完整的輿情數(shù)據(jù)表,對比不同上市公司之間的口碑差異,也可以結(jié)合上市公司的其他特征,如上市板塊、總市值、市盈率等內(nèi)容,與口碑進(jìn)行關(guān)聯(lián)分析,挖掘上市公司口碑與其資本市場表現(xiàn)之間的關(guān)系。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP