- 課程詳情
- 上課校區(1)
關于舉辦“Python和R數據挖掘技術-基于Python和R語言的數據挖掘和統計分析技術”培訓的通知
各有關單位:
中國科學院計算技術研究所是國家專門的計算技術研究機構,同時也是中國信息化建設的重要支撐單位,中科院計算所培訓中心是致力于高端IT類人才培養及企業內訓的專業培訓機構。中心憑借科學院的強大師資力量,在總結多年大型軟件開發和組織經驗的基礎上,自主研發出一整套課程體系,其目的是希望能夠切實幫助中國軟件企業培養高級軟件技術人才,提升整體研發能力,迄今為止已先后為國家培養了數萬名計算機專業人員,并先后為數千家大型國內外企業進行過專門的定制培訓服務。
隨著互聯網、移動互聯網和物聯網的發展,我們已經切實地迎來了一個大數據的時代。如何對海量數據進行挖掘和分析,已經成為一個非常重要且緊迫的需求。
R是一個用于統計計算和統計制圖的優秀工具,也是GNU的一個自由、免費、源代碼開放的軟件。R包括一套完整的數據處理、計算和制圖軟件系統。其功能包括:數據存儲和處理系統,數組運算工具(其向量、矩陣運算方面功能尤其強大),完整連貫的統計分析工具,優秀的統計制圖功能。
Python是一個數據分析和圖形顯示的程序設計環境,用于統計分析、繪圖的語言和操作環境。Python有簡便而強大的編程語言:可操縱數據的輸入和輸入,可實現分支、循環,用戶可自定義功能。
本培訓將對基于Python和R語言進行數據處理、數據探索的基本方法,利用R語言實現模型選擇、Logistic回歸及決策樹算法,以及貝葉斯算法及支持向量機、神經網絡等算法原理及實現進行講解。具體事宜通知如下:
一、培訓對象
1,系統架構師、系統分析師、高級程序員、資深開發人員。
2,牽涉到數據挖掘和統計分析的數據中心運行、規劃、設計負責人。
3,政府機關,金融保險、移動和互聯網等大數據來源單位的負責人。
4,高校、科研院所牽涉到數據挖掘與統計分析處理的項目負責人。
1,對IT系統設計有一定的理論與實踐經驗。
2,對數據挖掘和數據處理方法有一定的基礎知識。
3,對Hadoop/Spark等大數據技術有一定的了解。
三、師資
由業界知名大數據專家親自授課:
楊老師 主要研究網絡信息分析以及云計算相關技術,長期從事通信網管系統、網絡信息處理、商務智能(BI)以及電信決策支持系統的研究開發工作,主持和參與了多個國家和省部級基金項目,具有豐富的工程實踐及軟件研發經驗。
四、培訓內容
第一講 數據挖掘,Python和R簡介
1.1數據挖掘
1.*****on語言
1.3 R語言
1.4 Iris數據集
1.5 Bodyfat數據集
第二講 數據的導入與導出
2.1 R數據的保存與加載
2.2 CSV文件的導入與導出
2.3 通過ODBC從數據庫中讀取數據
2.4 從Excel中導入與導出數據
2.5 Python的數據操作
第三講 數據可視化展現
3.1 查看數據
3.2 單個變量展現
3.3 多個變量展現
3.4 更多探索
3.5 將圖表保存到文件中
第四講 決策樹與隨機森林
4.1 使用party包構建決策樹
4.2 使用rpart包構建決策樹
4.3 隨機森林
4.4 Python中的決策樹實現
4.5 Python決策樹實例
第五講 回歸分析
5.1 線性回歸
5.2 邏輯回歸
5.3 廣義線性回歸
5.4 非線性回歸
5.5 Python中的回歸實現
5.6 Python回歸實例
第六講 聚類分析
6.1 k-means聚類
6.2 k-medoids聚類
6.3 層次聚類
6.4 基于密度的聚類
6.5 Python中的聚類實現
6.6 Python聚類實例
第七講 離群點檢測
7.1 單變量的離群點檢測
7.2 局部離群點因子檢測
7.3 用聚類方法進行離群點檢測
7.4 時間序列數據的離群點檢測
7.5 Python中的孤立點實例
第八講 時間序列分析
8.1 R中的時間序列數據
8.2 時間序列分解
8.3 時間序列預測
8.4 時間序列聚類
8.5 時間序列分類
8.6 Python中的時間序列實例
第九講 關聯規則
9.1 關聯規則的基本概念
9.2 Titanic數據集
9.3 關聯規則挖掘
9.4 消除冗余
9.5 解釋規則
9.6 關聯規則的可視化
9.7 Python中的關聯規則實例
第十講 社交網絡分析
10.1 詞項網絡
10.2 推文網絡
10.3 雙模式網絡
10.4 Python中的社交網絡分析實例
五、培訓目標
1, 全面了解Python和R語言數據挖掘的相關知識。
2,學習Python和R的數據挖掘核心技術方法以及應用特征。
3,深入使用Python和R在數據挖掘和分析中的使用。
六、時間、地點
時間: 2018年4月10日-4月12日 地點:北京
2018年5月16日-5月18日 地點:上海
七、證書
培訓結束,頒發中科院計算所職業培訓中心“Python和R數據挖掘技術-基于Python和R語言的數據挖掘和統計分析技術”結業證書。
八、費用
培訓費:5800元/人(含教材、證書、午餐、學習用具)。住宿協助安排,費用自理。
-
海淀校區
地址:中關村958樓
電話:400-029-0976 轉 **** 查看號碼
關于我們 詳情

中科院計算所培訓學校(北京市海淀區中科院計算所職業技能培訓學校)成立于1987年,是計算所根據國家普及計算機知識,培養專業計算機人才而創建的。培訓中心依托中國科學院強大的技術背景,歷經二十年的發展,為全國各企事業單位、部隊、院校等累計培養了近十七萬人次的計算機專業人才,并為多家企業提供了高質量的咨詢服務,現已形成企業內訓、高端公開課、GJB5000A/CMMI培訓與咨詢、企業全方位咨詢服務四大業務模塊,在業界具有良好信譽。“科學、高效、權威、品質”是北京市海淀區中科院計算所職業技能培訓學校的經營宗旨,面向企業人是其明確的市場定位。中科院計算所針對企業的信息化建設具有悠久的歷史,其IT技術培訓是一個長期積累、與時俱進的過程。1987年,我國的信息化建設十分滯后,計算機相關設備僅見于政府、部隊和部分大型國內企業,專業技術急待普及,中科院計算所適時創建了培訓中心,從計算機的基本概念、原理和維護到Windows、unix、linux應用到Oracle、DB2、數據倉庫、J2EE、.net,再到現在高端企業級需求分析、架構設計、系統設計及咨詢、云計算、海量數據,始終與國際較前沿的IT技術接軌。25年,培訓中心的服務廣泛應用于全國各地電信、通信、電力、石化、金融、教育、部隊、交通、醫藥、服務等各行各業,為我國的信息化建設做出了卓越的貢獻,成為中國IT精英權威培訓咨詢機構。北京市海淀區中科院計算所職業技能培訓學校擁有一批具有多年豐富實際開發與教學經驗兼備的優秀專職教師隊伍、咨詢專家,有一支活躍于軟件行業的研發團隊。中心憑借強大的師資力量,把握當今世界較前沿的開發技術,在總結多年大型軟件開發和組織經驗的基礎上,自主研發出百門課程體系,滿足企業各層次的培訓需求,其目的是希望通過有經驗高水平教師的講授來真正解決企業信息化建設中的問題,切實幫助中國軟件企業培養高級軟件技術人才,提升企業的整體研發能力。授課教師從思想、方法和技術三個層面系統討論企業信息化建設及大型軟件設計理論和方法,并且通過一些精心選擇的案例,揉合教師的大型項目經驗,以項目過程中的問題帶動原理的描述,理論和實際相結合,重點講清問題,從而使學員在企業信息化建設項目中發揮更大的作用。面對千變萬化的IT技術,北京市海淀區中科院計算所職業技能培訓學校不僅傳授給學員當今IT潮流較核心的前沿技術和解決問題的方法,同時也為學員提供后續技術支持,更指導學員如何把握技術動態的方法和考慮問題、潛心學習的思維方式,旨在為國內外各企事業單位培養實用型、潛力型IT高端管理、創新人才,實現“與企業共發展,同攜手開創未來”的美好愿景。我們承諾:充分的資源共享、完善的管理模式和立足潮頭的前沿技術,必將使您在更廣的領域享受到更佳的培訓服務!為了明天,我們一起努力