R軟體與文字探勘研習班

課程時數

12小時

課程簡介

文字探勘(Text Mining)技術用於分析非結構化或半結構化資料,例如文件資料庫、電子書、數位圖書館、電子郵件、新聞資料庫、技術與商業的文件、報告、研究文獻、網路上的網頁文章,甚至是音樂、影音等。文字探勘技術包含文字/文件的分類、集群、規則的探索、概念、分類、與關聯性,也包含議題分類、正負評意見的情緒分析。R 軟體的文字探勘套件包含了中文斷詞相關技術,而且是免費的開放原始碼軟體,是處理中文文字資料的最佳工具。本課程特別邀請到學者專家講授,課程精彩,敬請及早報名!

日期時間講授內容教席地點
05/14(六) 09:30~12:30 1. R 軟體簡介
2. 文字探勘基本概念
3. Rwordseg 中文斷詞
陳景祥
淡江大學專任副教授
本會901教室
台北市南海路3號9樓
05/14(六) 13:30~16:30 4. 其他 tm 套件介紹
5. wordcloud
6. topicmodels 等套件
陳景祥
淡江大學專任副教授
本會901教室
台北市南海路3號9樓
05/21(六) 09:30~12:30 1. 資料探勘分群與分類簡介
2. 文字探勘:分群
3. 文字探勘:分類
陳景祥
淡江大學專任副教授
本會901教室
台北市南海路3號9樓
05/21(六) 13:30~16:30 4. 情感分析
5. 實例演練
陳景祥
淡江大學專任副教授
本會901教室
台北市南海路3號9樓