股市輿情、監測與預測技術
陳育仁
國立高雄第一科技大學
會計資訊系 / 財金大數據中心
基礎架構
資料擷取
資料整合應用
資料處理環境
資料分析模組
股票輿情、監測與預測基礎架構
Hadoop Spark
描述性分析 診斷分析
預測分析 決策分析
資料處理模組
資料分析
產品開發 市場行銷顧客服務管理
風險管理 …
• 分佈式數據基礎設施
• 快速資料處理速度
讀取
運算寫入 讀取
運算寫入
運算讀取 寫入
過去
現在
資料處理環境基礎架構
資料處理模組 - 資料擷取
傳統結構化資料
半結構、非結構化資料
• 產品資訊
• 客戶資訊
• 交易紀錄
• 文本資訊
• 圖像資訊
• 視頻資訊
• 音頻資訊
• 數位足跡
金融大數據分析
方法與技術
大數據分析
大數據分析五部曲
大數據分析方法與
技術
金融大數據分析方法與技術資料處理模組 - 資料分析
金融大數據分析方法與技術
設定目標
資料取得
前置處理
數據分析
結果詮釋
瞭解需求並確定問題
蒐集內部或外部資料
預先將資料處理為資料分析所需之格式
解讀分析結果並應用於實務
測試與修正
➢ 自然語言處理 (NLP)
➢ 網路爬蟲 (Web Crawler)
➢ 意見探勘/語意分析
➢ 情緒分析
網路社群媒體股票輿情大數據分析平台
網路社群媒體共同基金輿情大數據分析平台
(台灣、中國大陸輿情)
AI智能聊天機器人
Client Side
Server Side
敬請指教
Q&A